麦芽糖依赖性降解决定子、麦芽糖响应型启动子、稳定化构建体及其在生成非分解代谢化合物中的用途的制作方法

文档序号:15303789发布日期:2018-08-31 20:41阅读:373来源:国知局

本申请要求并享有于2015年6月25日提交的美国临时专利申请号62/184,793和2015年12月11日提交的美国临时专利申请号62/266,436的优先权,所述这两个申请通过引用并入本文。

2.发明领域

本发明总体涉及麦芽糖依赖性降解决定子、麦芽糖响应型启动子和稳定化构建体。本发明还涉及其在通过遗传修饰的宿主细胞来控制基因表达、蛋白稳定性和非分解代谢化合物生成中的用途。

3.发明背景

合成生物学的出现带来了可在工业规模和质量上利用可再生资源发酵生成生物燃料、化学品和生物材料的希望。譬如,已在微生物宿主中成功构建了功能性非天然生物学途径,用于生成抗疟药青蒿素的前体类(参见例如martinetal.,natbiotechnol21:796-802(2003));脂肪酸衍生的燃料类和化学品类(例如,脂肪酯类、脂肪醇类和蜡类;参见例如steenetal.,nature463:559-562(2010));制备降胆固醇药物的聚酮合酶类(参见例如maetal.,science326:589-592(2009));和聚酮类化合物(参见例如kodumal,procnatlacadsciusa101:15573-15578(2004))。然而,合成生物学的商业成功在很大程度上将取决于可再生成品的生成成本是否可竞争或优于与其相应的不可再生成品的生成成本。

菌株稳定性可能是工业发酵成本的主要驱动因素,因为它影响连续发酵可有效运行的时长。菌株稳定性通常是指微生物在延长培养时间中仍维持非分解代谢发酵产物的有利生成特征(例如,高产率(每克底物得到化合物的克数)和生产率(每升发酵液每小时得到的克数)。尤其是遗传稳定性,是指生成微生物群倾向于随着时间的推移几乎不改变与产品生成相关的基因的预期等位基因频率,所述遗传稳定性在产品的持续生成中起主要作用。

对于生物量以外的产品(根据定义,这些产品消耗代谢能量和碳源,以免所述碳源用于生成更多的细胞)的非分解代谢发酵,不稳定性的基础有两重:进化突变和选择性。首先,生成损失突变是自发和随机地生成的。其次,产物产率下降的细胞的生长率或“适应性”优势导致低生成者对最终的细胞群产生影响,从而降低整体培养性能。此种现象可被称为“菌株退化”。

巴西燃料乙醇在长时间发酵过程中,从糖获得非常高的乙醇产率,即最大理论产率的约90%。这在某种程度上是因为通过分解代谢生成的乙醇:每分子糖生成2分子atp(三磷酸腺苷),并且在没有氧气的情况下达到氧化还原平衡。突变不生成乙醇的细胞在发酵罐的低氧条件下不太适合,并且不会对细胞群产生影响。这使得工业乙醇发酵在整个周期重复利用大部分酵母生物量,从而使糖转化成酵母细胞生物量的转化率最低并将几乎所有的糖导向乙醇生成。生物量的这种扩展繁殖和再利用提高了乙醇生成的效率:运营支出减少,因为在每个周期中糖转化为生物量减少(即产率增加);和资本支出减少,因为需要更少和更小的发酵罐来构建用于接种的生物量。

相比之下,乙酰辅酶a(acetyl-coa)衍生的烃类(例如,类异戊二烯、脂肪酸和聚酮化合物)的生成通常本质上是非分解代谢的;它们通常需要净输入atp(三磷酸腺苷)、nadph(烟酰胺腺嘌呤二核苷酸磷酸)和碳源,通常需要大量氧气来帮助平衡氧化还原系统。此环境使产品向更低级的产物演变,越高的生物量产生的基因型越有利,并导致更高的菌株退化率。

降低生成非分解代谢产物的负面选择压力的一种方式是在生成不需要的产物的过程期间,例如在必须生成生物量以使发酵罐的生产率最大化的发酵阶段期间阻断其形成。因此,本领域需要能够控制发酵过程中非分解代谢化合物生成的时机的开关。本领域还需要在发酵过程中降低菌株退化速率和使生成非分解代谢化合物稳定的方法和组合物。本发明提供的组合物和方法满足所述这些需求,并且它们可用于发酵环境之外的其他应用。

4.发明摘要

本发明提供了利用麦芽糖依赖性降解决定子(maltosedependentdegron)来控制与所述麦芽糖依赖性降解决定子融合的任何蛋白的稳定性的组合物和方法。在其中一个实施方案,所述麦芽糖依赖性降解决定子是通过修饰已知与麦芽糖结合的蛋白(例如,mbp或麦芽糖结合蛋白)而得到,当其不与麦芽糖结合时变得不稳定。因此,本发明提供的麦芽糖依赖性降解决定子依赖于其与其配体(例如麦芽糖)结合而稳定。在一些实施方案,所述麦芽糖依赖性降解决定子可与麦芽糖响应型启动子组合使用,以同时控制蛋白的表达和稳定性的时机。譬如,用于生成非分解代谢化合物的生物合成途径的酶的表达可通过操作培养基中麦芽糖含量,使用所述麦芽糖依赖性降解决定子和麦芽糖响应型启动子直接或间接控制。因此,在一些实施方案,可利用相同的分子效应因子(例如,麦芽糖)来提供基因表达的转录和翻译后控制。本发明还提供了利用稳定化构建体的组合物和方法,所述稳定化构建体对生成高产物产率的原始菌株提供生长有利条件,和对已变成低生成者或非生成者的自发突变细胞提供生长不利条件。结果,所述生成高产物产率的原始菌株过度生长而超出了突变的细胞,并且在发酵期间稳定了所需产物(例如,非分解代谢化合物)的生成。在本发明提供的组合物和方法中,麦芽糖依赖性降解决定子、麦芽糖响应型启动子和稳定化构建体可以单独使用、组合使用或以次组合使用。

一方面,本发明提供了利用麦芽糖依赖性降解决定子作为开关来调控任何目的蛋白的稳定性的组合物和方法。在具体实施方案中,麦芽糖依赖性降解决定子与目的蛋白融合,所述目的蛋白对在遗传修饰的宿主细胞中生成所需产物(如非分解代谢化合物)具有影响。在一些实施方案,在麦芽糖结合蛋白(mbp)中引入一个或多个突变以将其转化成麦芽糖依赖性降解决定子(也称为麦芽糖结合降解决定子),当其与麦芽糖结合时,相较其不与麦芽糖结合时更稳定。在麦芽糖不存在情况下,麦芽糖依赖性降解决定子和与其融合的任何蛋白均是不稳定的或无活性的,导致所述融合蛋白更快降解。因此,通过操作所述麦芽糖含量可控制与麦芽糖依赖性降解决定子融合的任何目的蛋白的稳定性。

在一些实施方案,宿主细胞中的所述融合蛋白的稳定性可对靶分子,例如在发酵过程中生成非分解代谢化合物的生物合成途径的酶,具有下游效应。譬如,如果融合蛋白包含与麦芽糖依赖性降解决定子框内融合的转录调控因子,则其稳定性可通过从培养基中添加或除去麦芽糖来控制。在此类实施方案中,所述培养基中的所述麦芽糖依赖性降解决定子和麦芽糖含量可用作开关来控制非分解代谢化合物的生成。同时麦芽糖依赖性降解决定子在发酵过程中是有用的,它们可用于需调节目的蛋白的稳定性和/或靶分子生成的任何环境中。

因此,一方面,本发明提供了调节蛋白稳定性的方法,其中所述方法包括使麦芽糖与融合蛋白接触,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白。在一些实施方案,当所述麦芽糖依赖性降解决定子与麦芽糖接触时,与所述麦芽糖依赖性降解决定子不与麦芽糖接触时相比,所述融合蛋白更稳定。在一些实施方案,所述方法进一步包括从与所述融合蛋白的接触除去麦芽糖。在一些实施方案,从与所述融合蛋白的接触除去麦芽糖之后的所述融合蛋白的半衰期比包含与所述目的蛋白框内融合的野生型麦芽糖结合蛋白的融合蛋白的半衰期小至少约50%。

在一些实施方案,所述方法进一步包括提供宿主细胞,所述宿主细胞包含编码融合蛋白的异源性核酸,所述融合蛋白包含与目的蛋白框内融合的麦芽糖依赖性降解决定子,和在含有麦芽糖的培养基中培养表达所述融合蛋白的所述宿主细胞。

在一些实施方案,所述融合蛋白直接或间接调节一种或多种靶分子的水平。在一些实施方案,所述宿主细胞进一步包含生物分子,所述生物分子在所述宿主细胞中与所述融合蛋白相互作用以调节所述一种或多种靶分子的水平。在某些实施方案,所述目的蛋白是转录调控因子。在某些实施方案,所述生物分子是转录调控因子。

在一些实施方案,所述方法包括提供宿主细胞,所述宿主细胞进一步包含编码一种或多种靶分子的一种或多种异源性核酸,所述靶分子的水平由与所述麦芽糖依赖性降解决定子框内融合的目的蛋白进行调控。在一些实施方案,一种或多种靶分子是生成一种或多种非分解代谢化合物的生物合成途径中的酶。在一些实施方案,一种或多种靶分子是由所述生物合成途径中的所述酶生成的非分解代谢化合物。在一些实施方案,与所述麦芽糖依赖性降解决定子框内融合的所述目的蛋白包含gal80p。在一些实施方案,编码所述融合蛋白的所述异源性核酸序列被整合到所述宿主细胞的基因组中。

在一些实施方案,调节蛋白稳定性的方法包括提供宿主细胞,所述宿主细胞包含编码与麦芽糖响应型启动子可操作地连接的所述融合蛋白的异源性核酸。在一些实施方案,调节蛋白稳定性的方法包括提供宿主细胞,所述宿主细胞包含编码所述融合蛋白的异源性核酸的,所述融合蛋白可操作地连接至编码所述目的蛋白的基因的内源性启动子。

在一些实施方案,调节蛋白稳定性的方法包括提供包含编码融合蛋白的异源性核酸的宿主细胞,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白,其中所述麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28具有至少约70%、75%、80%、85%、90%、或95%序列同一性的氨基酸序列,和与seqidno:2或seqidno:28相比,包含一个或多个变体氨基酸残基。在一些实施方案,调节蛋白稳定性的方法可采用本发明所述的任何麦芽糖依赖性降解决定子进行。

本发明的另一方面,在本发明提供的方法和组合物中,麦芽糖响应型启动子与麦芽糖依赖性降解决定子组合使用。更具体地,麦芽糖响应型启动子可与编码融合蛋白的核酸可操作地连接,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白。通过将麦芽糖依赖性转录控制与翻译后控制相结合,本发明提供的组合物和方法可对任何基因产物的表达和稳定性施加非常稳健和严格的控制。

因此,本发明提供的方法包括:(a)在包含碳源的培养基中培养遗传修饰的宿主细胞群,所述碳源包含麦芽糖,其中所述遗传修饰的宿主细胞包含与编码融合蛋白的异源性核酸可操作地连接的麦芽糖响应型启动子,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白;和(b)在包含碳源的培养基中培养所述宿主细胞群或其亚群,其中与步骤(a)中的所述培养基相比,麦芽糖不存在或以足够低的量存在。在一些实施方案,在步骤(a)期间,在麦芽糖存在下,所述异源性核酸的转录被激活,和由其编码的所述融合蛋白被稳定。当在步骤(b)期间,麦芽糖不存在或以足够低的量存在时,与步骤(a)相比,所述麦芽糖响应型启动子活性和所述融合蛋白稳定性降低了。所述方法的此两个培养阶段的时机可通过例如从所述培养基中添加或去除麦芽糖来控制。

在一些实施方案,所述宿主细胞进一步包含与所述宿主细胞中的所述融合蛋白相互作用以调节一种或多种靶分子水平的生物分子。在一些实施方案,所述目的蛋白是转录调控因子。在一些实施方案,所述生物分子是转录激活因子。在一些实施方案,所述宿主细胞进一步包含编码一种或多种靶分子的异源性核酸,所述靶分子的水平是由所述目的蛋白进行调控。在一些实施方案,一种或多种靶分子是生物合成途径的酶,所述生物合成途径的酶由所述麦芽糖响应型启动子和所述融合蛋白的活性正调控,所述融合蛋白在麦芽糖存在下是稳定的。在一些实施方案,一种或多种靶分子是生物合成途径的酶,所述生物合成途径的酶由所述麦芽糖响应型启动子和所述融合蛋白的活性负调控,所述融合蛋白在麦芽糖存在下是稳定的。

在一些实施方案,提供双重转录和翻译后控制的方法可采用本发明所述的任何麦芽糖依赖性降解决定子进行。在某些实施方案,提供双重转录和翻译的方法可采用麦芽糖响应型启动子进行,所述麦芽糖响应型启动子包含选自由以下组成的组的序列:pmal1(seqidno:29),pmal2(seqidno:30),pmal11(seqidno:31),pmal12(seqidno:32),pmal31(seqidno:33),pmal32(seqidno:34),pmal32_v1(seqidno:78),pgmal_v5(seqidno:35),pgmal_v6(seqidno:36),pgmal_v7(seqidno:37),pgmal_v9(seqidno:38),pgmal_v10(seqidno:39),pgmal_v11(seqidno:40),pgmal_v12(seqidno:41),pgmal_v13(seqidno:42),pgmal_v14(seqidno:43),pgmal_v15(seqidno:44),pgmal_v16(seqidno:45),pgmal_v17(seqidno:46),pgmal_v18(seqidno:47),pg2mal_v1(seqidno:48),pg2mal_v2(seqidno:49),pg2mal_v3(seqidno:50),pg2mal_v5(seqidno:51),pg2mal_v6(seqidno:52),pg2mal_v7(seqidno:53),pg2mal_v8(seqidno:54),pg2mal_v9(seqidno:55),pg2mal_v10(seqidno:56),pg7mal_v2(seqidno:57),pg7mal_v4(seqidno:58),pg7mal_v6(seqidno:59),pg7mal_v8(seqidno:60),pg7mal_v9(seqidno:61),pg172_mal_v13(seqidno:62),pg271_mal_v12(seqidno:63),pg721_mal_v11(seqidno:64),pg712_mal_v14(seqidno:65),其保留启动子功能的部分,或与其具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施方案,本发明所述的其他合成麦芽糖响应型启动子可用于提供双重转录和翻译后控制的方法中。

另一方面,本发明提供了由遗传修饰的宿主细胞生成异源性非分解代谢化合物的发酵方法。在一些实施方案,所述方法包括两个阶段:构建阶段,在此阶段期间,非分解代谢化合物生成大大减少(所述“关闭”阶段),同时细胞生物量积累;和生成阶段,在此阶段期间,非分解代谢化合物生成开启(所述“开启”阶段)。因此,在不需要生成的发酵阶段(即构建阶段),减轻了与非分解代谢化合物生成有关的负选择压力。在所述构建阶段期间减少或消除所述非分解代谢化合物生成导致:(i)在所述构建阶段期间所述细胞的生长速率提高;和(ii)在所述生成阶段期间所述菌株的生成稳定性提高。此举导致更长持续时间的非分解代谢化合物生成,从而增加了所述菌株的总产率和/或生产率。有利的是,本发明提供的发酵方法中的非分解代谢化合物生成的所述“关闭”和“开启”状态通过容易获得的、负担得起的和工业相关的条件来控制。

本发明使用的术语“关闭”阶段不一定表示遗传修饰的宿主细胞中的非分解代谢化合物生成在此阶段期间为零或接近于零。相反,术语“关闭”阶段与所述“开启”阶段相关,因为与所述“开启”阶段相比,所述“关闭”阶段期间的非分解代谢化合物生成量大大减少(譬如,超过约10%、20%、30%、40%、50%、60%、70%、80%、90%或100%地小于所述“开启”阶段期间的非分解代谢化合物生成量)。

在一些实施方案,所述发酵培养物中非分解代谢化合物生成的所述“关闭”和“开启”状态可通过所述培养基中麦芽糖的量连同使用调控途径酶的基因表达的麦芽糖响应型启动子来控制,所述途径酶影响异源性非分解代谢化合物的生成。有利的是,通过使途径基因表达与麦芽糖敏感型启动子偶联,异源性非分解代谢化合物的生成可通过控制原料中麦芽糖的量来开启或关闭。譬如,麦芽糖响应型启动子可作为“开启”开关进行接线,以在麦芽糖存在下诱导所述异源性非分解代谢化合物的生成。或者,可将麦芽糖响应型启动子作为“关闭”开关进行接线,以在麦芽糖存在下诱导化合物生成的所述生物合成途径的负调控因子的表达。

在一些实施方案,所述发酵培养物中非分解代谢化合物生成的“关闭”和“开启”状态可通过所述培养基中麦芽糖的量连同使用调控途径酶的表达稳定性的麦芽糖依赖性降解决定子来控制,所述途径酶影响异源性非分解代谢化合物的生成。有利的是,通过将途径基因表达与麦芽糖依赖性降解决定子的麦芽糖依赖性稳定性偶联,异源性非分解代谢化合物的生成可通过控制原料中麦芽糖的量来开启或关闭。譬如,与合适融合配偶体(例如,转录调控因子)进行融合的麦芽糖依赖性降解决定子可作为“开启”开关连线,以在麦芽糖存在下诱导所述异源性非分解代谢化合物的生成。或者,可将与合适融合配偶体进行融合的麦芽糖依赖性降解决定子可作为“关闭”开关进行接线,以在麦芽糖存在下诱导化合物生成的所述生物合成途径的负调控因子的表达。

在一些实施方案,所述发酵培养物中非分解代谢化合物生成的所述“关闭”和“开启”状态可通过所述培养基中糖麦芽糖的量连同使用麦芽糖响应型启动子和麦芽糖依赖性降解决定子来控制,所述麦芽糖响应型启动子和麦芽糖依赖性降解决定子可调控影响异源性非分解代谢化合物生成的途径酶的基因表达。通过同时结合相同小分子效应因子麦芽糖的转录和翻译后控制,可严格调控途径酶的时机和表达水平。通过对在长时间发酵过程中受到严格调控的基因施加两层控制,也可降低潜在的菌株退化的可能性。

因此,本发明提供了在遗传修饰的宿主细胞中生成异源性非分解代谢化合物的方法,其中所述方法包括:(a)在包含碳源的培养基中培养所述遗传修饰的宿主细胞群,所述碳源包含麦芽糖,其中所述遗传修饰的宿主细胞包含:(i)一种或多种异源性核酸,所述一种或多种异源性核酸编码用于制备所述异源性非分解代谢化合物的生物合成途径的一种或多种酶;和(i)一种或多种异源性核酸,所述一种或多种异源性核酸编码用于制备所述异源性非分解代谢化合物的生物合成途径的一种或多种酶;和(ii)编码融合蛋白的异源性核酸,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白,所述异源性核酸可操作地连接至麦芽糖响应型启动子,其中在麦芽糖存在下,编码所述融合蛋白的所述异源性核酸的转录被激活,和由其编码的所述融合蛋白被稳定,和其中所述稳定的融合蛋白调控所述一种或多种酶的表达,其转而控制由所述宿主细胞生成的所述异源性非分解代谢化合物的量;和(b)在包含碳源的培养基中培养所述宿主细胞群或其亚群,其中与步骤(a)中的所述培养基相比,麦芽糖不存在或以足够低的量存在。在一些实施方案,与步骤(a)相比,步骤(b)中的麦芽糖响应型启动子活性和融合蛋白稳定性降低,与步骤(a)相比其导致由所述宿主细胞生成的所述异源性非分解代谢化合物的量的变化。采用此种方法,可使用本发明所述的任何麦芽糖依赖性降解决定子和/或麦芽糖响应型启动子。

此外,本发明提供了在遗传修饰的宿主细胞中生成非分解代谢化合物的方法。在一些实施方案,所述方法包括:(a)在包含碳源的培养基中培养遗传修饰的宿主细胞群,所述碳源包含麦芽糖,其中所述宿主细胞包含:(i)编码生物合成途径的一种或多种酶的一种或多种异源性核酸,所述一种或多种异源性核酸各自可操作地连接至gal4p响应型启动子;(ii)编码gal4p的核酸;和(iii)编码融合蛋白的核酸,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的gal80p,所述核酸可操作地连接至麦芽糖响应型启动子,其中所述培养基中的所述麦芽糖限制由所述宿主细胞生成的异源性非分解代谢化合物的量;和(b)在包含碳源的培养基中培养所述宿主细胞群或其亚群,其中麦芽糖不存在或以足够低的量存在,使得与步骤(a)相比,由所述宿主细胞生成的所述异源性非分解代谢化合物的量增加。在进行此方法时,可使用本发明所述的任何麦芽糖依赖性降解决定子和/或麦芽糖响应型启动子。

在一些实施方案,用于本发明所述方法的所述gal4p响应型启动子是选自由pgal1、pgal2、pgal7、pgal10、pgcy1、pgal80、和合成的pgal启动子组成的组。

在一些实施方案,所述培养步骤(a)进行至少约12、24、36、48、60、72、84、96或约96小时以上的时间。在一些实施方案,所述培养步骤(a)进行足以使所述宿主细胞群达到约0.01和400之间的细胞密度(od600)的一段时间。在一些实施方案,步骤(a)的所述培养基包含至少约0.1%(w/v)的所述麦芽糖。在一些实施方案,步骤(a)的所述培养基包含约0.25%至3%(w/v)的麦芽糖。在一些实施方案,步骤(b)的所述培养基包含不超过约0.08%(w/v)的麦芽糖。在一些实施方案,在生成所述异源性非分解代谢化合物过程中,在步骤(b)期间,将所述遗传修饰的宿主细胞群或亚群培养约3至20天的时间。

在一些实施方案,在步骤(b)的培养持续时间中由所述遗传修饰的宿主细胞群生成的所述异源性非分解代谢化合物的量与发酵过程中获得的相比得到改善,其中所述生物合成途径的所述一种或多种酶的表达不受所述麦芽糖响应型启动子和所述融合蛋白的活性限制。在一些实施方案,在步骤(a)期间生成的所述非分解代谢化合物的量小于在步骤(b)期间生成的所述非分解代谢化合物的量的约50%、40%、30%、20%、或10%。在一些实施方案,由所述方法提供的所述非分解代谢化合物是选自由氨基酸、脂肪酸、类异戊二烯、和聚酮化合物组成的组。

在一些实施方案,由本发明所述方法提供的所述遗传修饰的宿主细胞能够生成异源性类异戊二烯,并包含编码类异戊二烯途径酶的至少一种异源性核酸,所述类异戊二烯途径酶是选自由以下组成的组:(a)使两分子乙酰辅酶a缩合形成乙酰乙酰辅酶a的酶;(b)使乙酰乙酰辅酶a与另一分子乙酰辅酶a缩合形成3-羟基-3-甲基戊二酰-辅酶a(hmg-coa)的酶;(c)使hmg-coa转化为甲羟戊酸的酶;(d)使甲羟戊酸转化为甲羟戊酸5-磷酸的酶;(e)使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶;(f)使甲羟戊酸5-焦磷酸转化为ipp的酶;(g)使ipp转化为dmapp的酶;(h)可缩合ipp和/或dmapp分子以形成含有五个以上碳原子的聚异戊二烯基化合物的聚异戊二烯基合酶;(i)使ipp与dmapp缩合形成gpp的酶;(j)使两分子ipp与一分子dmapp缩合的酶;(k)使ipp与gpp缩合形成fpp的酶;(l)使ipp与dmapp缩合形成ggpp的酶;和(m)使ipp与fpp缩合形成ggpp的酶。

在一些实施方案,所述宿主细胞进一步包含编码修饰聚异戊二烯基的酶的异源性核酸,所述酶选自由香叶醇合酶,芳樟醇合酶,柠檬烯合酶,月桂烯合酶,罗勒烯合成酶,α-蒎烯合酶,β-蒎烯合酶,桧烯合酶,γ-萜品烯合酶,萜品油烯合酶,紫穗槐二烯合酶,α-法呢烯合酶,β-法呢烯合酶,法呢醇合酶,橙花叔醇合酶,广藿香醇合酶,诺卡酮合酶,和松香二烯(abietadiene)合酶组成的组。

在一些实施方案,所述宿主细胞包含编码甲羟戊酸途径的所有酶的多种异源性核酸。在一些实施方案,所述类异戊二烯是选自由半萜、单萜、二萜、三萜、四萜、和多萜组成的组。在一些实施方案,所述类异戊二烯是c5-c20类异戊二烯。在一些实施方案,所述类异戊二烯是倍半萜。在一些实施方案,所述类异戊二烯是选自由松香二烯(abietadiene)、紫穗槐二烯、蒈烯、α-法呢烯、β-法呢烯、法呢醇、香叶醇、香叶基香叶醇、异戊二烯、芳樟醇、柠檬烯、月桂烯、橙花叔醇、罗勒烯、广藿香醇、β-蒎烯、桧烯、γ-萜品烯、萜品油烯和瓦伦烯(valencene)组成的组。

在一些实施方案,所述宿主细胞能够生成聚酮化合物,并包含编码聚酮化合物合成酶的至少一种异源性核酸,其中所述聚酮化合物合成酶是选自由以下组成的组:(a)使乙酰辅酶a和丙二酰辅酶a中的至少一个与酰基载体蛋白缩合的酶;(b)使选自由乙酰辅酶a和丙二酰辅酶a组成的组的第一反应物与选自由丙二酰辅酶a或甲基丙二酰辅酶a组成的组的第二反应物缩合以形成聚酮化合物产物的酶;(c)使聚酮化合物上的β-酮化学基团还原成β-羟基基团的酶;(d)使聚酮化合物中的烷烃化学基团脱水生成α,β-不饱和烯烃的酶;(e)使聚酮化合物中的α,β-双键还原成饱和烷烃的酶;和(f)从酰基载体蛋白水解聚酮化合物的酶。

在一些实施方案,所述聚酮化合物是具有抗生素、抗真菌和抗肿瘤活性中的至少一种的脂质。在一些实施方案,所述聚酮化合物是选自由大环内酯类化合物、抗生素类化合物、抗真菌化合物、抑制细胞生长化合物、抗胆甾醇血的化合物、抗寄生物化合物、抗球虫化合物、动物生长促进剂、和杀虫剂组成的组。

在一些实施方案,所述宿主细胞能够生成脂肪酸,并包含编码脂肪酸合成酶的至少一种异源性核酸,其中所述脂肪酸合成酶是选自由以下组成的组:(a)使乙酰辅酶a与丙二酰辅酶a中的至少一个共价连接至酰基载体蛋白(acp)的酶;(b)使乙酰-acp和丙二酰-acp缩合形成乙酰乙酰-acp的酶;(c)采用nadph使乙酰乙酰-acp中的双键还原以在d-3-羟基丁酰羟化酶-acp中形成羟基基团的酶;(d)使d-3-羟基丁酰羟化酶-acp脱水以在β-和γ-碳之间生成双键而形成巴豆酰-acp的酶;(e)采用nadph使巴豆酰-acp还原形成丁酰-acp的酶;和(f)从酰基载体蛋白水解c16酰基化合物以形成棕榈酸的酶。在一些实施方案,所述脂肪酸是选自由棕榈酸、棕榈酰辅酶a、棕榈油酸、6(z)-十六碳烯酸(sapienicacid)、油酸、亚油酸、α-亚麻酸、花生四烯酸、二十碳五烯酸、芥酸、和二十二碳六烯酸组成的组。

另一方面,本发明提供了重组宿主细胞,其包含编码融合蛋白的异源性核酸,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白,其中当所述麦芽糖依赖性降解决定子与麦芽糖接触时,与所述麦芽糖依赖性降解决定子不与麦芽糖接触时相比,所述融合蛋白更稳定。在一些实施方案,所述异源性核酸可操作地连接至麦芽糖响应型启动子。在一些实施方案,所述宿主细胞进一步包含编码用于制备异源性非分解代谢化合物的生物合成途径的一种或多种酶的一种或多种异源性核酸。在一些实施方案,所述宿主细胞是选自由真菌细胞、细菌细胞、植物细胞、和动物细胞组成的组。在一些实施方案,所述宿主细胞是酵母细胞。

另一方面,本发明提供了发酵组合物,其包含培养基中的本发明所述的重组宿主细胞,所述培养基包含麦芽糖。

另一方面,本发明提供了编码麦芽糖依赖性降解决定子的分离的核酸分子。在一些实施方案,所述分离的核酸分子编码麦芽糖依赖性降解决定子,所述麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28具有至少约70%、75%、80%、85%、90%、或95%序列同一性的氨基酸序列,其中与seqidno:2或seqidno:28相比,所述麦芽糖依赖性降解决定子包含一个或多个变体氨基酸残基。在一些实施方案,所述分离的核酸分子编码麦芽糖依赖性降解决定子,所述麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28具有至少约70%、75%、80%、85%、90%、或95%序列同一性的氨基酸序列,其中(a)与seqidno:2或seqidno:28相比,所述麦芽糖依赖性降解决定子包含一个或多个变体氨基酸残基;和(b)所述一个或多个变体氨基酸残基位于位置7、10、11、21、24、28、42、43、64、68、83、88、92、95、98、101、110、117、134、135、136、149、168、177、186、187、193、198、210、216、217、229、236、237、242、263、291、304、321、322、339、351、357、367、370和374中的至少一个,其中所述一个或多个变体氨基酸残基的位置对应于seqidno:2或seqidno:28的氨基酸位置。在一些实施方案,所述分离的核酸分子是cdna。

在一些实施方案,所述分离的核酸分子编码麦芽糖依赖性降解决定子,所述麦芽糖依赖性降解决定子包含选自由k7r、i10t、w11g、l21s、v24a、f28y、d42v、k43e、a64t、f68s、d83g、d88n、p92t、w95r、v98i、n101i、a110t、i117v、p134s、a135t、l136m、m149i、y168c、y168n、y177h、n186s、a187p、l193s、d198v、d210e、a216v、a217d、g229c、i236n、d237n、n242d、l263m、l291v、a304s、t321n、m322l、a339t、a351t、t357s、t367s、s370p和n374s组成的组的一个或多个变体氨基酸残基。所述一个或多个变体氨基酸残基的位置对应于seqidno:2或seqidno:28的氨基酸位置。

在一些实施方案,所述分离的核酸分子编码麦芽糖依赖性降解决定子,与seqidno:2或seqidno:28相比,所述麦芽糖依赖性降解决定子包含至少一组变体氨基酸残基,其中所述至少一组变体氨基酸残基是选自由以下变体氨基酸残基组组成的组:(a)i10t、v24a、d42v、k43e、d83g、p92t、m149i、y168n、n186s、a216v、和t357s;(b)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、a216v、和d237n;(c)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、a216v、和a339t;(d)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、a216v、和n242d;(e)i10t、v24a、d42v、a110t、m149i、和a216v;(f)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、和a216v;(g)l21s、a64t、l136m、y177h、a187p、a304s、t321n、和a351t;(h)k7r、d83g、v98i、l193s、i236n、和n374s;(i)w11g、d88n、p134s、a135t、d210e、和m322l;(j)i117v、y168n、g229c、l263m、t367s、和s370p;(k)f68s、w95r、n186s、和d198v;和(l)f28y、k43e、n101i、y168c、a217d、和l291v。

在一些实施方案,所述分离的核酸分子编码麦芽糖依赖性降解决定子,所述麦芽糖依赖性降解决定子包含选自由seqidnos:4、6、8、10、12、14、16、18、20、22、24、和26组成的组的序列。在一些实施方案,所述分离的核酸分子编码麦芽糖依赖性降解决定子,所述麦芽糖依赖性降解决定子包含选自由seqidnos:16、18、20、22、24、和26的位置1至位置365组成的组的序列。在一些实施方案,所述分离的核酸分子编码麦芽糖依赖性降解决定子,所述麦芽糖依赖性降解决定子包含选自由seqidnos:16、18、20、22、24、和26的位置1至位置370组成的组的序列。

在一些实施方案,所述分离的核酸分子包含选自由seqidnos:3、5、7、9、11、13、15、17、19、21、23、和25组成的组的序列。在一些实施方案,所述分离的核酸分子包含选自由seqidnos:11、15、17、19、21、23、和25的位置1至位置1098组成的组的序列。在一些实施方案,所述分离的核酸分子包含选自由seqidnos:11、15、17、19、21、23、和25的位置1至位置1113组成的组的序列。

另一方面,本发明提供了融合蛋白,其包含与本发明所述的麦芽糖依赖性降解决定子框内融合的目的蛋白。

另一方面,本发明提供了dna构建体,其包含与编码融合蛋白的核酸可操作地连接的麦芽糖响应型启动子,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白,所述麦芽糖依赖性降解决定子包含由本发明所述的分离的核酸序列编码的氨基酸序列。

另一方面,本发明提供了包含具有至少一个或全部gal4p结合位点的pgal启动子的合成麦芽糖响应型启动子,其中所述至少一个或全部gal4p结合位点被mal转录激活因子的一个或多个结合位点置换。在一些实施方案,合成麦芽糖响应型启动子包含选自由以下组成的组的序列:pgmal_v5(seqidno:35),pgmal_v6(seqidno:36),pgmal_v7(seqidno:37),pgmal_v9(seqidno:38),pgmal_v10(seqidno:39),pgmal_v11(seqidno:40),pgmal_v12(seqidno:41),pgmal_v13(seqidno:42),pgmal_v14(seqidno:43),pgmal_v15(seqidno:44),pgmal_v16(seqidno:45),pgmal_v17(seqidno:46),pgmal_v18(seqidno:47),pg2mal_v1(seqidno:48),pg2mal_v2(seqidno:49),pg2mal_v3(seqidno:50),pg2mal_v5(seqidno:51),pg2mal_v6(seqidno:52),pg2mal_v7(seqidno:53),pg2mal_v8(seqidno:54),pg2mal_v9(seqidno:55),pg2mal_v10(seqidno:56),pg7mal_v2(seqidno:57),pg7mal_v4(seqidno:58),pg7mal_v6(seqidno:59),pg7mal_v8(seqidno:60),pg7mal_v9(seqidno:61),pg172_mal_v13(seqidno:62),pg271_mal_v12(seqidno:63),pg721_mal_v11(seqidno:64),pg712_mal_v14(seqidno:65),其保留启动子功能的部分,或与其具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施方案,本发明提供的其他合成麦芽糖响应型启动子包含:(a)包含转录起始位点的核心启动子;和(b)一个或多个mal转录激活因子结合位点,其中在不存在麦芽糖情况下的未诱导条件下,所述合成麦芽糖响应型启动子的启动子活性小于衍生出所述一个或多个mal转录激活因子结合位点的天然麦芽糖响应型启动子的启动子活性。

另一方面,本发明提供了包含dna构建体的载体(vector),所述dna构建体包含与编码融合蛋白的核酸可操作地连接的麦芽糖响应型启动子,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白,其中所述麦芽糖响应型启动子选自本发明提供的天然麦芽糖响应型启动子和合成麦芽糖响应型启动子。

另一方面,本发明提供了基因表达的方法,其包括:(a)培养包含dna构建体的宿主细胞,所述dna构建体包含pgmal启动子,所述pgmal启动子在不含麦芽糖的培养基中可操作地连接至目的基因;和(b)将麦芽糖加至所述培养基中,以激活或增加所述pgmal启动子活性,其中所述pgmal启动子包含具有至少一个或全部gal4p结合位点的pgal启动子,所述至少一个或全部gal4p结合位点被mal转录激活因子的一个或多个结合位点置换。在一些实施方案,本发明所述的其他合成麦芽糖响应型启动子可在基因表达方法中与目的基因可操作地连接。

另一方面,本发明提供了在遗传修饰的宿主细胞中生成异源性非分解代谢化合物的方法,所述方法包含:(a)在包含碳源的培养基中培养遗传修饰的宿主细胞群,所述碳源包含麦芽糖,其中所述宿主细胞包含编码用于制备所述异源性非分解代谢化合物的生物合成途径的一种或多种酶的一种或多种异源性核酸,其中所述一种或多种酶的表达由合成麦芽糖响应型启动子活性负调控,其中所述培养基中所述麦芽糖的存在限制由所述宿主细胞生成的异源性非分解代谢化合物的量;和(b)在包含碳源的培养基中培养所述宿主细胞群或其亚群,其中所述麦芽糖不存在或以足够低的量存在,使得所述合成麦芽糖响应型启动子的活性低于步骤(a)中的活性,和由所述宿主细胞生成的所述异源性非分解代谢化合物的量增加。在一些实施方案,所述合成麦芽糖响应型启动子包括本发明提供的pgmal启动子。

另一方面,本发明提供了使用稳定化构建体来稳定异源性非分解代谢化合物生成的组合物和方法,所述稳定化构建体可使自发突变的负面影响最小化,所述自发突变增加正选择压力以降低非分解代谢化合物的生成量。在一些实施方案,生成异源性非分解代谢化合物的方法包括在培养基中培养遗传修饰的细胞,所述遗传修饰的细胞包含:(a)编码用于生成异源性非分解代谢化合物的生物合成途径的酶的异源性核酸,其中所述异源性核酸可操作地连接至第一启动子;(b)编码影响细胞生长的蛋白的核酸,其中所述核酸可操作地连接至第二启动子;和(c)编码转录调控因子的核酸。在所述这些实施方案中,所述第一启动子和所述第二启动子均由相同的转录调控因子进行调控。因此,所述转录调控因子的功能性破坏(例如,由自发突变引起)负面影响编码所述生物合成途径的所述酶的所述异源性核酸和编码所述影响细胞生长的蛋白的所述核酸两者的表达。减少编码所述影响细胞生长的蛋白的所述核酸的表达将提供生长不利条件,并防止此类细胞在长时间发酵过程中在所述细胞群中占主导地位。

在一些实施方案,所述非分解代谢化合物本身是目的蛋白,而非用于生成异源性非分解代谢化合物的生物合成途径的酶。在所述这些实施方案中,所述转录调控因子共调控编码目的蛋白的异源性核酸和编码影响细胞生长的蛋白的核酸的表达。

在一些实施方案,调控所述第一启动子和所述第二启动子的所述转录调控因子是gal调节子的调节蛋白。譬如,遗传修饰的宿主细胞可包含编码转录激活因子gal4p和/或转录抑制因子gal80p的异源性核酸。在一些实施方案,所述第一启动子和所述第二启动子均是天然来源的pgal启动子或pgal合成启动子。在一些实施方案,编码所述影响细胞生长的蛋白的所述异源性核酸和编码用于生成非分解代谢化合物的生物合成途径的酶的所述异源性核酸染色体整合到所述遗传修饰的宿主细胞的基因组中。

在一些实施方案,编码影响细胞生长的蛋白的异源性核酸是在任何培养基或条件下,对于遗传修饰的宿主细胞而言是生命绝对需要的必需基因。在其他实施方案,编码影响细胞生长的蛋白的异源性核酸是当宿主细胞在缺少必需化合物的培养基中生长时,细胞生长所必需的条件性必需基因。所述这些包括,譬如,编码用于生成氨基酸、核苷酸或脂肪酸的生物合成途径中的一种或多种酶的一种或多种生物合成基因。在一些实施方案,条件性必需基因编码生成赖氨酸的生物合成途径中的酶。在其他实施方案,条件性必需基因编码生成蛋氨酸的生物合成途径中的酶。

在一些实施方案,所述培养方法包括两个阶段:(a)细胞生物量构建阶段,其中所述遗传修饰的宿主细胞群是在限制异源性非分解代谢化合物生成的培养基中进行培养;其次是生成阶段,其中所述宿主细胞群或其亚群是在促进所述异源性非分解代谢化合物生成的培养条件下进行培养。在所述细胞生物量构建阶段期间,在遗传修饰的宿主细胞中的所述调节子(例如,编码用于生成非分解代谢化合物的生物合成途径的酶的核酸和编码条件性必需基因产物的核酸)的表达受到限制,和在所述培养基中补充必需化合物,使得细胞可以生长。在所述生成阶段期间,遗传修饰的宿主细胞在缺乏或含有足够低的量的必需化合物的培养基中进行培养,使得仅有可合成所述必需化合物的细胞才能生长。此举为维持转录调控因子的表达的细胞提供了正选择压力,因此在所述生成阶段期间表达所述调节子。

另一方面,本发明提供了用于生成异源性非分解代谢化合物的组合物和方法,其利用包含与麦芽糖依赖性降解决定子框内融合的转录调控因子的融合蛋白和稳定化构建体的组合。当所述融合蛋白与本发明所述的稳定化构建体组合使用时,异源性非分解代谢化合物的生成进一步稳定,因为此两种构建体均可抵消自发突变的任何负面影响。使遗传修饰的宿主细胞的细胞生长与非分解代谢化合物的生成偶联的稳定化构建体减轻了所述转录水平上自发突变的任何负面影响。包含与麦芽糖依赖性降解决定子框内融合的转录调控因子的融合蛋白减轻了所述翻译后水平上自发突变的任何负面影响。

在一些实施方案,生成异源性非分解代谢化合物的方法包括在培养基中培养遗传修饰的宿主细胞,所述宿主细胞包含:(a)编码融合蛋白的异源性核酸,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的转录调控因子;(b)编码用于生成所述异源性非分解代谢化合物的生物合成途径的一种或多种酶的一种或多种异源性核酸,其中所述异源性核酸中的每一种可操作地连接至由所述融合蛋白调控的启动子;和(c)编码影响细胞生长的蛋白的核酸,其中所述核酸可操作地连接至由所述融合蛋白调控的启动子。在其中一个实施方案,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的gal80p,和gal4p响应型启动子可操作地连接至编码所述生物合成途径的一种或多种酶的所述异源性核酸和可操作地连接至编码所述影响细胞生长的蛋白的所述核酸。

本发明的所述这些实施方案和其他实施方案以及其许多特征将结合下文和附图进行更详细地描述。

5.附图简要说明

图.1a和1b示出了原理图,其示出了使用包含与麦芽糖依赖性降解决定子框内融合的gal80p的融合蛋白的麦芽糖依赖性稳定性以负调控生物合成途径基因的表达。

图.2a和2b示出了原理图,其示出了使用包含与麦芽糖依赖性降解决定子框内融合的gal4p的融合蛋白的麦芽糖依赖性稳定性以正调控生物合成途径基因的表达。

图.3a和3b示出了原理图,其示出了组合麦芽糖响应型启动子和麦芽糖依赖性降解决定子,以通过操纵培养基中麦芽糖含量来控制融合dna构建体的转录和所述融合蛋白的翻译后稳定性。

图.4示出了示意图,其示出了编码与mbp突变体框内融合的麦芽糖-依赖性gal80p的核酸的选择筛选。

图.5示出了表示由表达融合蛋白的菌株生成法呢烯的曲线图,所述融合蛋白包含与从所述第一层诱变得到的各种mbp突变体框内融合的gal80p。x轴代表在含有麦芽糖的培养基中培养的菌株生成的法呢烯的量,y轴代表在不含麦芽糖的培养基中培养的菌株生成的法呢烯的量。通过所述第一层诱变得到的每个mbp突变体菌株由方形标记表示。

图.6示出了第二层优化过程的示意图,其示出了在所述第一层mbp突变菌株上进行竞争性富集以改善它们的麦芽糖依赖性可切换性。

图.7a和7b示出了在一轮选择/反选择循环之后和三轮选择/反选择循环之后,对来自所述第一层诱变的mbp突变的组合的生长竞争选择的结果。在所述第二层优化过程的三轮选择/反选择循环之后,得到具有改善的“关闭”状态的菌株。

图.8a示出了原理图,其示出了细胞分选策略以在不存在麦芽糖的情况下筛选具有改善的不稳定性的mbp突变体。

图.8b示出了当宿主细胞在含有麦芽糖或不含麦芽糖的培养基中培养时,表达与各种mbp突变体融合的gfp的宿主细胞的相对gfp(绿色荧光蛋白)强度。

图.8c示出了当宿主细胞在含有麦芽糖的培养基(顶部图)和不含麦芽糖(底部图)的培养基中时,表达与各种mbp突变体和与野生型mbp融合的gfp的宿主细胞的gfp荧光强度(以原单位表示)。图.8c底部的表格示出了在麦芽糖存在下与不存在麦芽糖情况下培养的遗传修饰的宿主细胞的gfp荧光强度的比率。

图.9a至9c示出了表达融合蛋白的宿主细胞的麦芽糖依赖性法呢烯生成水平,所述融合蛋白包含与不同mbp突变体框内融合的gal80p。

图.9d示出了原理图,其示出了如何可视化和解释在图.9a至9c、10和19中以箱形图示出的数据。所述这些图的箱形图是使用数据可视化和分析软件生成的。当针对不同运行的测定非常精确并且彼此接近时,由上四分位数和下四分位数表示的箱折叠成一条或多条线(参见,例如图.9a中的gal80_mbp_h9和gal80_mbp_m1数据)。

图.10示出了包含mbp的不同开关构建体的可切换性。菌株b、c和d是同基因菌株,以及菌株b和c包含特定的开关构建体。b=pmal32_v1>gal80_mbpl8_v4d(驱动gal80与对于蛋白稳定性具有最佳麦芽糖依赖性差异的mbp突变体融合的弱启动子);c=pmal32>gal80_mbpl8_v4d(与b相同,只是所述启动子更强);d=亲本菌株(在没有麦芽糖开关或麦芽糖依赖性降解决定子情况下,驱动甲羟戊酸途径基因表达的组成型启动子)。

图.11a示出了在bsm蔗糖培养基中与gfp融合的各种mbp突变体的降解。gfp表达是由麦芽糖诱导型启动子pmal32驱动。gfp蛋白单独表达或与野生型或突变体mbp的n端融合(无mbp–x;gfp_mbp–○;gfp_5a2–□;gfp_5f3–▼;gfp_h8–◇;gfp_l8_v4d–▲)。

图.11b示出了gfp对照和在bsm蔗糖培养基中培养的宿主细胞中与各种mbp突变体融合的gfp的半衰期。

图.12a和12b提供的结果证明了,能够生成所述类异戊二烯法呢烯和包含由麦芽糖响应型启动子和麦芽糖依赖性降解决定子负调控的mev途径的宿主细胞,与在整个构建阶段生成法呢烯的组成型生成菌株的生成相比,当所述发酵的所述构建阶段是在麦芽糖存在下进行时(从而实现“关闭”状态),在长时间发酵过程中显示改善的法呢烯生成稳定性。

图.13a示出了阐明pgmal启动子的构建的原理图。

图.13b示出了来自pmal12和pmal32的mal转录激活因子结合位点的序列比对。使用具有评分矩阵的克隆管理器软件(clonemanagersoftware)比对所述结合位点的序列:线性(错配(mismatch)2,开放空位(opengap)4,延伸空位(extgap)1)。

图.14a和14b提供的结果是,pgmal启动子均是麦芽糖可诱导的,并且在不存在麦芽糖情况下不受生长速率影响。

图.15提供了用于生成异戊烯基二磷酸(“ipp”)的甲羟戊酸(“mev”)途径的示意图。

图.16提供了ipp和二甲基烯丙基焦磷酸(“dmapp”)向牻牛儿基焦磷酸(“gpp”)、法呢基焦磷酸(“fpp”)和香叶基香叶基焦磷酸(“ggpp”)转化的示意图。

图.17示出了原理图,其示出了使用包含与pgal10v3启动子可操作地连接的lys9的稳定化构建体,以使条件性必需基因lys9的表达与用于生成非分解代谢化合物的生物合成途径基因的表达偶联。图.17所示的实施方案示出了麦芽糖,当存在于培养基中时,则与malx3蛋白结合,所述malx3蛋白激活麦芽糖响应型启动子,导致转录抑制因子gal80的表达。由gal80基因编码的gal80p转而抑制转录激活因子gal4p。由于用于生成非分解代谢化合物的lys9基因和生物合成途径基因均作为gal调节子被共调控,所以所述这些基因的表达通过所述gal调节子的转录调控因子进行偶联。

图.18示出了示意图,其示出了氨基酸生物合成途径基因和与其可操作连接的pgal启动子的组合的选择筛选,所述pgal启动子使遗传修饰的宿主细胞依赖于其细胞生长的表达。

图.19示出了两种稳定化构建体,每种构建体包含可操作地连接至pgal启动子的赖氨酸生物合成基因,所述pgal启动子使遗传修饰的宿主细胞依赖于其细胞生长的表达。

图.20示出的结果证明了,包含稳定化构建体的麦芽糖可切换酵母菌株(包含pgal10_v3>lys9的菌株f;和包含pgal2_v3>lys1的菌株g)与其不包含稳定化构建体的亲本菌株(菌株e)相比,在长时间发酵运行中显示改善的类异戊二烯法呢烯的生成稳定性。

6.具体实施方式

6.1定义

本发明使用的术语“麦芽糖结合蛋白”或mbp是指包括可特异性结合麦芽糖并与麦芽糖相互作用的部分的蛋白。在一个实施方案,mbp包括作为大肠杆菌和其他细菌的麦芽糖/麦芽糖糊精体系的一部分的蛋白,其负责麦芽糖糊精的摄取和有效分解代谢。mbp表现出对麦芽糖和麦芽糖糊精的结合亲和力。与大分子α(1-4)连接的葡聚糖类也以高亲和力结合。ferenci&klotz,febsletters,vol.94(2):213-217(1978)。

本发明使用的术语“野生型”mbp包括可从生物体分离的mbp。在一个实施方案,术语“野生型”mbp包括从细菌分离的mbp,例如从包含seqidno:2的氨基酸序列的大肠杆菌分离的mpb。seqidno:2是从大肠杆菌的male基因编码的前体多肽分裂n-端扩展时的成熟mbp(370个残基)。在一些实施方案,所述“野生型”mpb包含由seqidno:1的核酸序列编码的蛋白。在一些实施方案,“野生型”mbp是指用作背景序列以引入突变从而生成mbp突变体的参考序列。譬如,“野生型”mbp可进一步包括参考序列,所述参考序列包含seqidno:2和另外的序列,如连接体序列。譬如,“野生型”mbp包含含有seqidno:28的氨基酸序列的mbp,其在seqidno:2的c端包含连接体序列。“野生型”mbp核酸序列还包含含有seqidno:27的核苷酸序列的核酸序列,其在seqidno:1的c端包含连接体序列。

本发明使用的术语“mbp突变体”是指野生型mbp的任何变体。所述mbp突变体可包括,譬如,具有一个或多个添加和/或置换和/或缺失和/或插入的氨基酸的野生型mbp。

术语“降解结构域”或“降解决定子”是指赋予与其融合的另一蛋白不稳定性的蛋白元件。

本发明使用的术语“麦芽糖依赖性降解决定子”或“麦芽糖结合降解决定子”或“麦芽糖结合蛋白降解决定子”是麦芽糖结合蛋白突变体,所述麦芽糖结合蛋白突变体已变得依赖于与麦芽糖的结合而稳定。麦芽糖依赖性降解决定子在与麦芽糖接触或与麦芽糖结合时比不与麦芽糖接触或结合时更稳定。当麦芽糖依赖性降解决定子接触或结合麦芽糖时,与麦芽糖依赖性决降解决定子不接触或不结合麦芽糖时相比,麦芽糖依赖性降解决定子还赋予与其融合的另一蛋白的稳定性。

术语“麦芽糖基诱导物”包括麦芽糖或麦芽糖的任何类似物和衍生物。所述麦芽糖基诱导物可结合mbp、mbp突变体或麦芽糖依赖性降解决定子。在一个实施方案,当麦芽糖基诱导物与麦芽糖依赖性降解决定子结合时,其可稳定所述麦芽糖依赖性降解决定子。麦芽糖基诱导物也可诱导激活麦芽糖响应型启动子。虽然在整个说明书中为了简单起见使用术语“麦芽糖”,但在本发明提供的组合物和方法中,可使用任何麦芽糖基诱导物代替麦芽糖,并且贯穿整个本发明,术语“麦芽糖”可用“麦芽糖基诱导物”代替。

如本发明使用的,在两个或更多个核酸或蛋白序列的背景下的术语“序列同一性”或“百分比同一性”或是指两个或更多个序列或子序列,其是相同的或具有特定百分比的相同氨基酸残基或核苷酸。譬如,当在比较窗口或指定区域上进行比较和比对以获得最大对应性时,如使用序列比较算法或通过手动比对和目视检查进行测定的,所述序列在指定区域上可具有与参考序列至少约70%,至少约75%,至少约80%,至少约85%,至少约90%,至少约91%,至少约92%,至少约93%,至少约94%,至少约95%,至少约96%,至少约97%,至少约98%,至少约99%,或更高同一性的百分比同一性。譬如,通过计算所述序列中相同核苷酸(或氨基酸残基)的数量除以总核苷酸(或氨基酸残基)的长度减去任何空位的长度的比值来确定同一性的百分比。

为了方便起见,可使用本领域已知的计算机程序和数学算法来确定两个序列之间的同一性程度。计算百分比序列同一性的此类算法通常考虑了比较区域上的序列空位和错配。比较和比对序列的程序,如clustalw(序列比对)(thompsonetal.,(1994)nucleicacidsres.,22:4673-4680),align(myersetal.,(1988)cabios,4:11-17),fasta(pearsonetal.,(1988)pnas,85:2444-2448;pearson(1990),methodsenzymol.,183:63-98)和空位的blast(altschuletal.,(1997)nucleicacidsres.,25:3389-3402)均可用于此目的。所述blast或blast2.0(altschuletal.,j.mol.biol.215:403-10,1990)可从包括国家生物信息中心(ncbi)和互联网在内的,用于连接序列分析程序blastp、blastn、blastx、tblastn和tblastx的多个来源获取。更多信息可在ncbi网站获悉。

在一些实施方案,序列比对和百分比同一性计算可使用blast程序采用其标准默认参数来确定。对于核苷酸序列比对和序列同一性计算,blastn程序可以其默认参数(空位开放罚分=5,空位延伸罚分=2,核匹配=1,核不匹配=-3,期望值=10.0,字大小=11)进行使用。对于多肽序列比对和序列同一性计算,blastp程序可以其默认参数(空位开放=11,空位延伸罚分=2;核匹配=1;核不匹配=-3,期望值=10.0;字大小=11;矩阵blosum62)进行使用。或者,使用以下程序和参数:克隆管理组件(clonemanagersuite)版本5(sci-ed软件)的比对加强版(alignplus)软件;dna比较:总体比较(globalcomparison),标准线性评分矩阵(standardlinearscoringmatrix),不匹配罚分=2,开放空位罚分=4,延伸空位罚分=1。氨基酸比较:总体比较(globalcomparison),blosum62评分矩阵。

本发明使用的术语“同源性”是指两个或更多个核酸序列或两个或更多个氨基酸序列之间的同一性。序列同一性可用百分比同一性(或相似性或同源性)来衡量;百分比越高,序列彼此越接近相同。当使用标准方法比对时,核酸或氨基酸序列的同源物或直系同源物具有相对高度的序列同一性。譬如,参考蛋白或核酸的“同源物”分别包括与参考蛋白或核酸具有至少约50%,至少约55%,至少约60%,至少约65%,至少约70%,至少约75%,至少约80%,至少约85%,至少约90%,至少约95%,至少约96%,至少约97%,至少约98%,至少约99%的序列同一性。如上所述,用于序列比对和分析的各种程序是众所周知的,并且可用于确定两个序列是否为彼此的同源物。

短语“严格杂交条件”是指探针通常在核酸的复合混合物中与其靶子序列杂交,但不与其他序列杂交的条件。严格条件是依赖于序列的,并且在不同情况下会有所不同。较长的序列在较高温度下特异性杂交。有关核酸杂交的广泛指南可参见tijssen,techniquesinbiochemistryandmolecularbiology—hybridizationwithnucleicprobes,“overviewofprinciplesofhybridizationandthestrategyofnucleicacidassays”(1993)。通常,严格条件选定为比限定的离子强度ph值下特定序列的热熔点(tm)低约5-10℃。所述tm是平衡时(因为靶序列过量存在,在tm下,50%的探针在平衡状态下被占用)与靶标互补的50%探针与靶序列杂交的温度(在限定的离子强度、ph值和核酸浓度下)。严格条件也可通过加入去稳定剂如甲酰胺来实现。对于选择性或特异性杂交,阳性信号至少是背景的两倍,优选为背景杂交的10倍。示例性的严格杂交条件可以如下:50%甲酰胺、5×ssc、和1%sds,在42℃下孵育,或5×ssc、1%sds、在65℃下孵育,在65℃下在0.2×ssc、和0.1%sds中洗。

如果它们编码的多肽基本上是相同的,那么在严格条件下不相互杂交的核酸仍然是基本上相同的。譬如,当使用遗传密码允许的最大密码子简并性生成核酸的拷贝时,便会发生此种情况。在此情况下,核酸通常在中度严格杂交条件下杂交。示例性的“中等严格杂交条件”包括在37℃下在40%甲酰胺、1mnacl、1%sds的缓冲液中杂交,并在45℃下在1×ssc中洗。阳性杂交至少是背景的两倍。本领域普通技术人员将容易认识到,可利用其他杂交和清洗条件来提供相似严格条件。在许多参考文献例如currentprotocolsinmolecularbiology,ed.ausubeletal中提供了用于确定杂交参数的其他指南。

“保守氨基酸置换”是其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的侧链(r基团)的另一氨基酸残基置换的情况。通常,保守氨基酸置换不会实质上改变蛋白的功能特性。在两个或两个以上氨基酸序列由于保守置换而彼此不同的情况下,可以向上调整百分比序列同一性或同源性程度以校正所述置换的保守性质。进行此类调整的手段是本领域技术人员所熟知的(参见如pearsonw.r.,1994,methodsinmol.biol25:365-89)。

以下六组各自含有彼此保守置换的氨基酸:1)丝氨酸(s),苏氨酸(t);2)天冬氨酸(d),谷氨酸(e);3)天冬酰胺(n),谷氨酰胺(q);4)精氨酸(r),赖氨酸(k);5)异亮氨酸(i),亮氨酸(l),丙氨酸(a),缬氨酸(v);和6)苯丙氨酸(f),酪氨酸(y),色氨酸(w)。

本发明使用的术语“变体氨基酸残基”是指参考蛋白的变体形式中的氨基酸改变或氨基酸置换。譬如,变体氨基酸残基“i10t”是指在变体蛋白中通常具有异亮氨酸(i)的参考蛋白的位置10被氨基酸残基苏氨酸(t)置换。在另一实施例,变体氨基酸残基“a216v”是指在变体蛋白中通常具有氨基酸残基丙氨酸(a)的参考蛋白的位置216被氨基酸残基缬氨酸(v)置换。

适于确定百分比序列同一性的算法的一个实例是在基本局部比对搜索工具(以下称为“blast”)中使用的算法,参见例如altschuletal.,j.mol.biol.215:403-410(1990)和altschuletal.,nucleicacidsres.,15:3389-3402(1997),其是通过国家生物技术信息中心(以下简称“ncbi”)可公开获取。

本发明使用的术语“目的蛋白”是指其生成是所期望的任何蛋白或多肽。在一些实施方案,术语“目的蛋白”是指在融合蛋白内需要其表达的蛋白。

本发明使用的术语“融合蛋白”是指通过两个或更多个蛋白通过在一个蛋白的氨基端和另一个蛋白的羧基端之间形成的肽键连接而生成的蛋白。“融合基因”的翻译产生具有衍生自每种原始蛋白的功能特性的单一融合蛋白。

本发明使用的术语“蛋白稳定性”用于结构的背景下时,即与蛋白的结构完整性有关。在一个实施方案,所述蛋白稳定性是指力的净平衡,其决定蛋白是否处于其天然折叠构象,所述折叠构象被保护免受降解或处于易降解的变性状态。在一个实施方案,所述蛋白稳定性可在功能的背景下测定,即与蛋白或其融合蛋白的状态有关,以随时间推移赋予其功能和/或活性。

关于蛋白的术语“稳定”可用作相对术语表示蛋白被保护免受蛋白降解的相对状态。譬如,麦芽糖依赖性降解决定子在与麦芽糖接触或与麦芽糖结合的条件下与不与麦芽糖接触或结合的情况相比,被认为是更稳定的。在一个实施方案,通过比较与其融合的报告基因(例如,绿色荧光蛋白)的活性来测定在存在或不存在麦芽糖的情况下,麦芽糖依赖性降解决定子的稳定性。

术语蛋白的“半衰期”通常是指宿主细胞或细胞提取物中的蛋白浓度降低一半所需的时间。

本发明使用的“与麦芽糖接触”或“与麦芽糖结合”的麦芽糖依赖性降解决定子或融合蛋白是指所述麦芽糖依赖性降解决定子与麦芽糖具有物理依附性或密切相关性。譬如,所述结合可由氢键、疏水力、范德华力、共价键或离子键结合而成。

本发明使用的术语“生物分子”是指可存在于细胞中的任何内源性或异源性分子。术语“生物分子”可指,譬如,核酸类、蛋白类、肽类、氨基酸类、脂质类、碳水化合物类、代谢物类和代谢产物类。

本发明使用的术语“靶分子”是指目的分子,其量或表达水平直接或间接受融合蛋白活性的影响,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白。术语“靶分子”可指,譬如,酶类、其他蛋白类、肽类、氨基酸类、核酸类、脂质类、碳水化合物类、代谢物类、代谢产物类和非分解代谢化合物类。

gal80基因是指编码参与抑制gal调节子基因表达的转录调控因子gal80p的基因。酵母的半乳糖调节子中的转录调控是由正调节蛋白gal4p和负调节蛋白gal80p之间的相互作用来确定。本发明使用的gal80p可指野生型gal80p,其任何变体或任何修饰形式。譬如,本发明使用的gal80基因可编码野生型gal80p或可编码采用与其n端融合的组成型降解决定子修饰以增加其蛋白周转的gal80p。

本发明使用的短语,例如选定基因的“功能性地破坏”或“功能性破坏”,是指所述选定基因以此种方式改变,使得宿主细胞中由选定基因编码的蛋白的活性降低。同理,选定蛋白的“功能性地破坏”或“功能性破坏”,是指所述蛋白以此种方式改变,使得宿主细胞中所述蛋白的活性降低。在一些实施方案,由所述选定基因编码的所述选定蛋白的活性在宿主细胞中消除。在其他实施方案,由所述选定基因编码的所述选定蛋白的活性在宿主细胞中降低。所述选定基因的功能性破坏可通过删除全部或部分基因来实现,从而消除或减少基因表达,或者消除或降低基因产物的活性。所述选定基因的功能性破坏还可通过使所述基因的调节元件突变,例如基因的启动子突变从而消除或减少表达,或通过使基因的编码序列突变,使得所述基因产物的活性消除或减少来实现。在一些实施方案,所述选定基因的功能性破坏导致去除所述选定基因的完整开放阅读框。

本发明使用的术语“天然的”或“内源性”是指可在宿主细胞中天然存在的物质或过程/方法。

本发明使用的术语“遗传修饰的”表示包含异源性核苷酸序列的宿主细胞。

本发明使用的术语“异源性”是指通常在自然界中不存在的。譬如,当与核酸(dna或rna)或蛋白关联使用时,术语“异源性”是指作为生物体、细胞、基因组或存在于其中的dna或rna序列的一部分非天然存在的核酸或蛋白,或存在于基因组或dna或rna序列中的细胞或位点上并与天然存在的区分开来的核酸或蛋白。当与核酸(dna)关联使用时,术语“异源性”还可指与内源性启动子之外的启动子可操作地连接的核酸。术语“异源性化合物”是指由通常不生成所述化合物的细胞生成的化合物,或者以通常不由细胞生成的水平生成的化合物。

本发明使用的短语“异源性酶”是指在自然界中通常不存在于给定细胞中的酶。术语包含的酶有:(a)对于给定细胞是外源性的(即,由宿主细胞中天然不存在的或天然不存在于宿主细胞给定背景下的核苷酸序列编码);和(b)在宿主细胞中天然存在(例如,所述酶由对细胞而言是内源性的核苷酸序列编码),但在宿主细胞中以非自然量(例如,比天然存在的量更多或更少)生成。

本发明使用的术语“天然存在的”是指在自然界中发现存在的。譬如,存在于生物体中的麦芽糖结合蛋白可从自然界的来源分离得到,并在实验室没有被人有意修饰,其是天然存在的麦芽糖结合蛋白(例如,基因库(genbank)中的麦芽糖结合蛋白序列)。相反,本发明使用的术语“天然不存在的”是指在自然界中未发现存在但可由人为干预生成的。

术语“氨基酸序列”、“肽”、“寡肽”、“多肽”和“蛋白”在本发明中可交换使用,并且是指任何长度的氨基酸的聚合形式,其可以或不可以进行化学或生物化学修饰。

术语“多核苷酸”和“核酸”在本发明中可交换使用,是指任何长度的聚合形式,核糖核苷酸和脱氧核糖核苷酸两者。

术语“分离的核酸”当应用于dna时,是指与在其起源的生物体的天然存在的基因组中紧邻的序列进行分离的dna分子。“分离的核酸”还包括非基因组核酸,例如cdna或其他非天然存在的核酸分子。

术语“cdna”在本发明中定义为可通过从获自细胞的成熟的、剪接的mrna分子逆转录而制得的dna分子。cdna缺乏通常存在于相应基因组dna中的内含子序列。

本发明使用的短语“可操作地连接”是指核酸序列之间的功能性连接,使得所述连接的启动子和/或调控区功能性地控制所述编码序列的表达。

本发明使用的术语“生成量/生成量/产生量”通常是指由本发明提供的遗传修饰的宿主细胞生成的非分解代谢化合物的量。在一些实施方案,生成量表示为由所述宿主细胞生成的所述非分解代谢化合物的产量。在其他实施方案,生成量表示为生成所述非分解代谢化合物时宿主细胞的生产率。

术语“产率”是指由宿主细胞生成非分解代谢化合物的量,以由所述宿主细胞消耗的每碳源量生成的非分解代谢化合物的量表示,以重量计。在一些实施方案,术语“产率”是指每加入到发酵容器或烧瓶中的总还原糖的量所生成的非分解代谢化合物的量(即非分解代谢产物的克数除以所加总还原糖的克数,以百分数表示)。所述总还原糖是以克计的糖的测量单位。还原糖是能够用作还原剂的任何糖,因为其具有游离的醛基基团或游离的酮基团。所有的单糖,如半乳糖、葡萄糖和果糖均是还原糖类。譬如,如果通过向宿主细胞中加入100克葡萄糖(即100克还原糖)生成10克非分解代谢化合物,则每还原糖产物的产率为10%。

本发明使用的术语“生产率”是指由宿主细胞生成非分解代谢化合物的量,表示为每发酵液的量生成的非分解代谢化合物的量(以重量计),在所述发酵液中所述宿主细胞按时间(每小时)进行培养(按体积计)。

术语“发酵”用于指培养利用碳源(例如糖)作为能源来生成所需产物的宿主细胞。

术语“培养基”是指使细胞生物量生长并由宿主细胞生成代谢物的培养基。其含有碳源,还可进一步含有氮源、磷源、维生素源,矿物质源等。

本发明使用的术语“发酵培养基”可与“培养基”同义使用。通常,术语“发酵培养基”可用于指适合长时间培养宿主细胞以生成所需化合物的培养基。

术语“培养基/媒介”是指培养基和/或发酵培养基。所述“培养基/媒介”可以是液体或半固体。给定的培养基/媒介可以是培养基和发酵培养基两者。

术语“全细胞液(wholecellbroth)”是指容器(例如,烧瓶、板、发酵罐等)的全部内容物,包括细胞、水相、在烃相和/或乳液中生成的化合物。因此,全细胞液包括含有水、碳源(例如糖)、矿物质类、维生素类、其他溶解或悬浮的物质、微生物类、代谢物类、和由宿主细胞生成的化合物类、以及保持在由宿主细胞制备非分解代谢化合物的容器中的材料的所有其他成分的培养基的混合物。

术语“发酵组合物”可与“全细胞液”交换使用。如果所述发酵组合物是在发酵过程中加至发酵容器中,则发酵组合物也可包括覆盖物。

术语“生物合成途径”是指具有一组合成代谢或分解代谢生物化学反应的途径,用于将一种化学物质转化成另一种化学物质,从而生成分子的生物合成。如果基因产物平行或串联作用于相同的底物,生成相同的产物,或作用于或生成所述相同底物和代谢物终产品之间的代谢中间体(例如代谢物),则所述基因产物属于相同的“生物合成途径”。

本发明使用的术语“启动子”是指能够赋予、激活或增强dna编码序列表达的合成的或天然来源的核酸。启动子可包含一个或多个特异性转录调控序列以进一步增强表达和/或改变所述编码序列的空间表达和/或时间表达。启动子可位于其控制下的所述编码序列的5'位(上游)。所述启动子与待表达的编码序列之间的距离可与所述启动子和其控制的天然核酸序列之间的距离大致相同。如本领域所知,可适应所述距离的变化而不丧失启动子功能。在一些实施方案,本发明使用的调控启动子通常使编码转录调控因子(例如,激活因子如gal4p,或抑制因子如gal80p)的核酸序列在许可环境(例如,麦芽糖存在下)下转录,但在非许可环境下(例如,在不存在麦芽糖情况下)停止编码转录调控因子的核酸序列的转录。

术语“麦芽糖响应型启动子”或“pmal”启动子是指由受麦芽糖调控的转录激活因子进行结合并受其调控的启动子序列。譬如,麦芽糖诱导型启动子是由mal操纵子激活因子(例如,mal转录激活因子)或其功能同源物进行调控。

术语“mal操纵子激活因子”或“mal转录激活因子”是指麦芽糖操纵子或麦芽糖响应型启动子的dna结合、麦芽糖依赖性转录激活因子。

术语“半乳糖诱导型启动子”或“pgal”启动子是指由受半乳糖调控的转录激活因子进行结合并受其调控的启动子序列。譬如,所述半乳糖诱导型启动子是由gal4p或其功能同源物进行调控。

术语“pgmal”启动子是指具有pgal启动子序列的合成启动子,所述pgal启动子序列的gal转录激活因子(例如gal4p)结合位点被mal转录激活因子的一个或多个结合位点置换。因此,pgmal启动子是被mal转录激活因子而非gal转录激活因子激活。

术语“合成启动子”是指具有启动子活性并在自然界中未知的核苷酸序列。在一个实施方案,合成启动子是由多个彼此异源的元件组装而成。

短语“菌株稳定性”通常是指通过本发明所述的遗传修饰的宿主细胞在长时间的发酵过程中生成异源性化合物的稳定性。具体而言,稳定性是指在延长培养时间例如约3至20天时,微生物维持非分解代谢发酵产物的有利生成特性(即,高产率(每克底物的化合物克数)和/或生产率(每升发酵液每小时的克数))的能力。遗传稳定性,是指生成微生物群倾向于随着时间的推移几乎不改变与产品生成相关的基因的预期等位基因频率,所述遗传稳定性在产品的持续生成中起主要作用。

除非另有说明,培养基或培养溶液中麦芽糖或其他组分的浓度单位是重量/体积百分数。定义为溶质浓度(w/v%)=(溶质重量(g)/溶液体积(ml))×100。

术语“转录调控因子”是指控制基因表达的蛋白。

术语“转录激活因子”是指激活或正调控基因表达的转录调控因子。

术语“转录抑制因子”是指抑制或负调控基因表达的转录调控因子。

术语“影响细胞生长的基因”或“编码影响细胞生长的蛋白的核酸”是指编码影响细胞的细胞生长(例如,生长速率或细胞生物量)的蛋白的核酸。

术语“必需基因”是指在所有营养物均可用的最佳条件下维持生命所绝对需要的基因。

术语“条件性必需基因”是指仅在某些情况或生长条件下必需的基因。

术语“调节子”是指由相同调控蛋白(例如,转录调节子)进行调控的基因组或核酸组。调节子的基因具有调控结合位点或具有由共同转录调控因子进行调控的启动子。包含调节子的基因组或核酸组可连续地或不连续地位于宿主细胞的基因组中。

术语“诱导型启动子”是指被诱导物激活以诱导其控制的基因的转录的启动子。

短语“组成型启动子”是指不需要存在诱导物来诱导其控制的基因的转录的启动子。

除非另有说明,术语“表达”是指通过相关基因的转录和/或通过基因转录生成蛋白,然后进行mrna翻译而生成mrna。

本发明使用的术语“分解代谢”是指分子分解或将大分子降解成更小分子的过程/方法。

术语“非分解代谢”是指从较小单元构建分子的过程/方法,并且所述这些反应通常需要能量。术语“非分解代谢化合物”是指通过非分解代谢过程/方法生成的化合物。

除非上下文另有明确指出,否则术语“一个”、“一种”和“所述”表示“至少一个”。

6.2麦芽糖依赖性降解决定子

6.2.1.麦芽糖依赖性降解决定子和mbp突变体的麦芽糖依赖性稳定性的测定

本发明中有用的麦芽糖依赖性降解决定子依赖于与麦芽糖结合来维持其稳定性和其融合蛋白。在本发明提供的组合物和方法中,所述麦芽糖依赖性降解决定子及其融合蛋白的麦芽糖依赖性稳定性在某种意义上的条件是,当麦芽糖依赖性降解决定子与麦芽糖接触时它们是稳定的,和当麦芽糖从与麦芽糖依赖性降解决定子的接触脱离时它们是不稳定的。譬如,当表达麦芽糖依赖性降解决定子和/或其融合蛋白的宿主细胞在含有麦芽糖的培养基中培养时,与它们在不含麦芽糖的培养基中培养的情况相比,它们更稳定。在某些实施方案,当从培养基中除去麦芽糖时,所述融合蛋白的半衰期与对照(例如,包含与野生型麦芽糖结合蛋白融合的目的蛋白或单独的目的蛋白的融合蛋白)相比降低了。

可使任何合适量的麦芽糖与麦芽糖依赖性降解决定子和/或其融合蛋白接触以保持其稳定性。譬如,表达麦芽糖依赖性降解决定子和/或其融合蛋白的遗传修饰的宿主细胞可在包含浓度(w/v)为至少约0.25%、0.5%、0.75%、1.0%、1.25%、1.5%、1.75%、2.0%、2.25%、2.5%、2.75%、3.0%、3.25%、3.75%、4.0%、4.25%、4.5%、4.75%、5.0%或更多的麦芽糖的培养基中进行培养。当期望在宿主细胞中以更快的速率使麦芽糖依赖性降解决定子和/或其融合蛋白不稳定或降解时,可将所述宿主细胞在不含麦芽糖或含足够低的量的麦芽糖(例如,小于约0.25%、小于约0.1%、0%等)的新培养基中进行培养。在下述6.4节中进一步详细描述了维持麦芽糖依赖性降解决定子和/或其融合蛋白稳定性的麦芽糖的合适量。

在一些实施方案,麦芽糖依赖性降解决定子可通过向已结合麦芽糖的天然蛋白引入去稳定突变,由麦芽糖结合蛋白(mbp)衍生得到。不受任何理论限制,所述mbp中的突变导致突变蛋白依赖麦芽糖的结合能适当地折叠,并在不含麦芽糖情况下,所述突变蛋白可能无法适当地折叠并以更快速度降解。当与另一蛋白融合时,在不存在麦芽糖情况下,整个融合蛋白便会成为降解的目标。

在一些实施方案,mbp突变体可通过诱变编码野生型mbp的核酸(例如,seqidno:1的核苷酸序列或seqidno:27的核苷酸序列,除了seqidno:1的核苷酸序列之外,其还包含连接体序列)得到。在一些实施方案,编码野生型mbp的核酸可随机进行诱变。在其他实施方案,编码野生型mbp的核酸可基于其已知结构和/或功能进行合理诱变。此外,由随机或合理诱变得到的mbp突变体中的突变可被组合以生成另外的mbp突变体。通过在不存在结合配体的情况下引入扰乱蛋白构象的一个或多个突变,已在以下第6.2.2节和实施例部分中识别和描述了可用作麦芽糖依赖性降解决定子的mbp突变体。

可用作麦芽糖依赖性降解决定子的mbp突变体表现出一个或多个以下特征。有用的麦芽糖依赖性降解决定子的特征之一包括在麦芽糖存在下,相较不存在或含足够低的量的麦芽糖,其融合蛋白的稳定性增加了。不受任何理论约束,如果麦芽糖与麦芽糖依赖性降解决定子的结合使得其融合蛋白构象更稳定,那么所述融合蛋白可通过宿主细胞的降解机制以较慢的速率进行降解。有用的麦芽糖依赖性降解决定子的另一个特征包括其通过操纵培养基中的麦芽糖含量来调节下游靶分子的表达水平或表达量的条件性稳定性。麦芽糖结合蛋白和/或其融合蛋白的麦芽糖依赖性稳定性的所述这些和其他特征可使用下文所述的任何合适的测定方法来确定。

在一些实施方案,用于筛选mbp突变体(以及确定麦芽糖依赖性降解决定子的麦芽糖依赖性特征)的合适测定方法可包括测定包含报告蛋白的融合蛋白的麦芽糖依赖性稳定性。譬如,与mbp突变体框内融合的报告蛋白可用于测定存在或不存在麦芽糖时的报告基因(reporter)活性。如实施例部分中实施例7.8所述,可使用报告基因,如荧光标记蛋白(例如gfp)作为融合配偶体。在所述这些实施方案中,包含报告融合蛋白的遗传修饰的宿主细胞群可进行预培养,以在包含麦芽糖的培养基中表达所述融合蛋白。然后,将所述遗传修饰的宿主细胞群或亚群分成两组并平行培养,其中一组细胞在含麦芽糖的培养基中培养,另一组细胞在不含麦芽糖的培养基中培养。在合适的时间段之后(例如,培养48小时后或当对照gfp报告基因在宿主细胞中表达最大时),比较在存在和不存在麦芽糖情况下培养的所述宿主细胞的荧光水平。如果在麦芽糖存在下,gfp融合蛋白的相对gfp强度高于不存在麦芽糖(或含低量麦芽糖)时的情况,则mbp突变体被视为麦芽糖依赖性降解决定子。

对于这些比较实验,遗传修饰的宿主细胞通常在包含相同量(例如,摩尔量或重量)碳源的培养基中进行培养。譬如,包含麦芽糖的培养基可含有约2.3%(w/v)蔗糖和约1.7%(w/v)麦芽糖,和不含麦芽糖的培养基可含有约4%蔗糖。

在某些实施方案,如果融合蛋白的相对gfp强度在麦芽糖存在下比不存在麦芽糖时高至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、或更多,则认为mbp突变体可用作麦芽糖依赖性降解决定子。譬如,与对照相比(即,在麦芽糖存在下单独的gfp的gpf强度),图.8b所示的表达mbp突变体l8_v4d的宿主细胞在麦芽糖存在下表现出约95%的相对gfp强度,和在不存在麦芽糖情况下相对gfp强度为约30%。由于mbp突变体l8_v4d融合蛋白的报告基因活性(即,荧光强度)在麦芽糖存在下比不存在麦芽糖时高约316%,所以mbp突变体l8_v4d是有用的并被认为是麦芽糖依赖性降解决定子。

在图.8b中,将融合蛋白的相对gfp强度相对于未融合的gfp的gfp强度归一化为100%。在一些实施方案,可将融合蛋白的相对gfp强度相对于与在麦芽糖存在下或不存在麦芽糖时表达的野生型mbp融合的gfp的gfp强度进行归一化。譬如,在麦芽糖存在下与野生型mbp融合的gfp的gfp强度可被定标为具有100%的强度,并且相对于野生型mbp融合蛋白,其他融合蛋白的gfp强度可被定标。在另一实施例,如图.8c所示,可计算对照(例如,与野生型mbp融合的gfp)和与各种mbp突变体融合的每个gfp在麦芽糖存在和不存在麦芽糖情况下的gfp荧光的比率。可将每个mbp突变体的计算比率与对照的计算比率进行比较。如果mbp突变体的计算gfp荧光比率比对照高至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、或更多,则认为mbp突变体可用作麦芽糖依赖性降解决定子。

尽管上文描述了使用gfp作为报告基因,但融合蛋白稳定性的确定不限于使用gfp或相对gfp强度测定。本领域技术人员认为合适的其他合适的报告基因或测定方法均可用于比较存在麦芽糖或不存在(或以足够低的量存在)麦芽糖时的融合蛋白稳定性,以确定mbp突变体对其稳定性的麦芽糖依赖性。

在另一实施方案,用于筛选mbp突变体(或确定麦芽糖依赖性降解决定子的麦芽糖依赖特征)的合适测定方法可包括测定直接或间接受包含mbp突变体的融合蛋白的稳定性影响的靶分子的表达水平或表达量。使用靶分子的此类筛选测定可使用图.1a和1b中所示的示例性实施方案来说明。如所述图中所示,融合蛋白包含与麦芽糖依赖性降解决定子(或mbp突变体)框内融合的gal80p。gal80p是抑制型转录调控因子,其与gal启动子的主要转录激活因子gal4p结合。在图.1a和1b所示的实施方案中,一个或多个pgal启动子可操作地连接至生物合成途径基因。如果宿主细胞中的gal80p融合蛋白与麦芽糖结合在麦芽糖依赖性降解决定子(或mbp突变体)的部分是稳定的,则其将抑制gal4p转录激活因子,导致极少或不表达途径酶。这转而将消除或减少由所述途径酶生成的任何异源性化合物的量。如果gal80p融合蛋白由于麦芽糖依赖性降解决定子(或mbp突变体)不与麦芽糖接触而不稳定,如图.1b所示,则所述融合蛋白也不稳定或失活,从而解除gal80p对gal4p的抑制。这将导致途径酶的更高表达水平和由所述途径酶生成的异源性化合物的量增加。在此示例性实施方案中,异源性化合物的麦芽糖依赖性生成量可用作下游靶分子,以筛选与gal80p融合的mbp突变体是否适合作为麦芽糖依赖性降解决定子。

在一些实施方案,类异戊二烯法呢烯可用作下游靶分子。在此实施方案中,图.1a和1b所示的途径酶基因可包括编码甲羟戊酸途径酶和法呢烯合酶的基因,和宿主细胞将生成类异戊二烯法呢烯作为下游靶分子之一。当稳定的gal80p抑制生物合成途径基因表达时,经遗传修饰的宿主细胞在包含麦芽糖的培养基中将不生成或生成少量的法呢烯(参见图.1a)。当所述这些宿主细胞在不存在麦芽糖情况下进行培养时,如图.1b所示,所述宿主细胞将生成法呢烯(当不稳定或失活的gal80p不再抑制生物合成途径基因的表达时)。因此,在此示例性实施方案中,在不存在或存在麦芽糖情况下由所述宿主细胞生成的法呢烯的量可用于筛选与gal80p融合的mbp突变体是否表现为麦芽糖依赖性降解决定子,其依赖于与麦芽糖结合而稳定。

在图.1a和1b所示的示例性实施方案中,其中所述融合蛋白起到靶分子的负调控因子的作用,如果mbp突变体的麦芽糖依赖性稳定性导致宿主细胞在不存在麦芽糖情况下比麦芽糖存在时生成更多量的靶分子(例如,法呢烯),则mbp突变体可视为有用的麦芽糖依赖性降解决定子。宿主细胞中生成的靶分子(例如,法呢烯)的量可使用本领域中任何已知的技术进行测定。譬如,可使用实施例部分中实施例7.2、7.3或7.4所述的法呢烯效价测定方法。在图.1a和1b所示的示例性实施方案中,如果由不含麦芽糖培养的宿主细胞生成的靶分子(例如,法呢烯)的量比含麦芽糖培养的宿主细胞生成的靶分子的量高至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、或更多,则mbp突变体被视为是有用的麦芽糖依赖性降解决定子。

在一些实施方案,上述讨论的靶分子生成量的相对增加百分比可通过将不存在麦芽糖情况下的靶分子生成量的原始测定值(例如,实施例7.2中所述的uv法呢烯效价测定)除以在麦芽糖存在下靶分子生成量的原始测定值来计算得到。在一些实施方案,由所述宿主细胞生成的靶分子的量可在将两个值分配之前相对于对照进行归一化。譬如,对照可包括由在麦芽糖存在下组成型生成靶分子的宿主细胞生成的靶分子的量。对照量可被定标为100,并由包含mbp突变体的宿主细胞得到的所有其他靶分子生成量的值可相对于此值进行归一化。

在另一实施方案,用于筛选mbp突变体的合适测定方法包括使用营养缺陷型菌株和合适的阳性和阴性选择方案,以筛选显示麦芽糖依赖性稳定性的mbp突变体。譬如,可设计遗传策略来筛选mbp突变体,其在与组成型转录的gal80p融合时会导致gal80p从麦芽糖存在下的功能性(例如,稳定)状态转换为不存在麦芽糖情况下的非功能性(例如,不稳定)状态。

用于筛选测定的示例性遗传策略在图.4中示出,并在实施例部分的实施例7.6中进行了描述。如图.4所示,所述gal80基因与编码mbp突变体的核酸框内融合。在此示例性实施方案中,包含与pgal10可操作连接的lys2基因的赖氨酸营养缺陷型酵母菌株可用作报告基因菌株,以筛选表现为麦芽糖依赖性降解决定子的mbp突变体。如果与gal80p融合的mbp突变体依赖于与麦芽糖结合来维持其稳定性,那么它将赋予gal80p融合蛋白麦芽糖依赖性稳定性。因此,在报告基因菌株中,所述gal80p功能及其麦芽糖依赖性稳定性可由归因于来自gal80调控的启动子(例如,pgal10)的lys2基因的表达或抑制的表型进行报告。

在此示例性筛选测定中,lys2基因可操作地连接至pgal10启动子,如图.4所示。所述lys2基因编码氨基己二酸还原酶、赖氨酸生物合成所需的酶。当mbp突变体具有麦芽糖依赖性降解决定子的性质时,则与mbp突变体融合的gal80p在不存在麦芽糖情况下将是不稳定的,并且不会抑制可操作地连接至pgal10的lys2的表达。结果,氨基己二酸还原酶将从lys2基因表达,使得报告酵母在缺乏赖氨酸的培养基上生长。为了排除表现出麦芽糖依赖性稳定性的通常去稳定的mbp突变体,可进行阴性或反选筛选。在反选筛选中,将报告菌株在含有α-氨基己二酸作为唯一氮源的培养基上培养。表达lys2的报告菌株不会在此种培养基上生长。如果mbp突变体依赖于麦芽糖来维持其稳定性,则与其融合的gal80p在麦芽糖存在下将是稳定的和具有功能的,从而抑制pgal10和不表达lys2。因此,在反选筛选过程中,可选择包含mbp突变体的报告菌株,所述mbp突变体依赖于与麦芽糖结合而稳定。图.4所示的用于筛选mbp突变体的阳性选择方案和阴性选择方案仅仅是示例性的。具有阳性方案和反选方案的其他合适的营养缺陷型报告菌株(例如,ura3或trp1营养缺陷型)可用于筛选mbp突变体。

用于确定本发明所述的mbp突变体、麦芽糖依赖性降解决定子及其融合蛋白的麦芽糖依赖性稳定性的测定方法仅仅是示例性的。本领域技术人员可容易地确定其他麦芽糖依赖性稳定性测定方法,以筛选mbp突变体,所述mbp突变体在本发明提供的组合物和方法中可用作麦芽糖依赖性降解决定子。譬如,也可使用实施例7.7中所述的几轮竞争性选择/反选择生长方案。

6.2.2.麦芽糖依赖性降解决定子序列

6.2.2.1麦芽糖依赖性降解决定子氨基酸序列

一方面,本发明提供了表现出麦芽糖依赖性稳定性的麦芽糖依赖性降解决定子的氨基酸序列。在某些实施方案,麦芽糖依赖性降解决定子是突变体,所述突变体衍生自可结合麦芽糖的任何合适的野生型麦芽糖结合蛋白。在某些实施方案,与它们的野生型对应物相比,所述麦芽糖依赖性降解决定子包含一个或多个去稳定突变(例如,一个或多个氨基酸添加、置换、缺失或插入)。与麦芽糖结合时相比,不与麦芽糖结合时麦芽糖依赖性降解决定子更不稳定。

在一些实施方案,麦芽糖依赖性降解决定子包含与具有seqidno:2的野生型麦芽糖结合蛋白具有一定程度序列同一性的氨基酸序列。在某些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2具有至少约70%,至少约75%,至少约80%,至少约85%,至少约90%,至少约95%,至少约96%,至少约97%,至少约98%,或至少约99%序列同一性的氨基酸序列。在某些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2具有至少约70%,至少约75%,至少约80%,至少约85%,至少约90%,至少约95%,至少约96%,至少约97%,至少约98%,或至少约99%序列同一性的氨基酸序列,和与seqidno:2相比包含至少一个变体氨基酸残基。

在一些实施方案,麦芽糖依赖性降解决定子包含与具有seqidno:28的野生型麦芽糖结合蛋白具有一定程度序列同一性的氨基酸序列,所述seqidno:28在seqidno:2的c端具有连接体序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:28具有至少约70%,至少约75%,至少约80%,至少约85%,至少约90%,至少约95%,至少约96%,至少约97%,至少约98%,或至少约99%序列同一性的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2具有至少约70%,至少约75%,至少约80%,至少约85%,至少约90%,至少约95%,至少约96%,至少约97%,至少约98%,或至少约99%序列同一性的氨基酸序列,和与seqidno:28相比包含至少一个变体氨基酸残基。

在一些实施方案,麦芽糖依赖性降解决定子包含氨基酸序列,所述氨基酸序列包含位于选自以下的一个或多个位置的至少一个或多个变体氨基酸残基:7、10、11、21、24、28、42、43、64、68、83、88、92、95、98、101,110、117、134、135、136、149、168、177、186、187、193、198、210、216、217、229、236、237、242、263、291、304、321、322、339、351、357、367、370和374,其中所述这些变体氨基酸残基的位置对应于seqidno:2或seqidno:28的氨基酸位置。

在一些实施方案,麦芽糖依赖性降解决定子包含含有一个或多个变体氨基酸残基的氨基酸序列,其中所述一个或多个变体氨基酸残基选自由k7r、i10t、w11g、l21s、v24a、f28y、d42v、k43e、a64t、f68s、d83g、d88n、p92t、w95r、v98i、n101i、a110t、i117v、p134s、a135t、l136m、m149i、y168c、y168n、y177h、n186s、a187p、l193s、d198v、d210e、a216v、a217d、g229c、i236n、d237n、n242d、l263m、l291v、a304s、t321n、m322l、a339t、a351t、t357s、t367s、s370p和n374s组成的组。所述这些变体氨基酸残基的位置对应于seqidno:2或seqidno:28的氨基酸位置。

在一些实施方案,麦芽糖依赖性降解决定子可包含与具有seqidno:2的野生型mbp相比被截短的氨基酸序列。譬如,麦芽糖依赖性降解决定子可包含在seqidno:2的氨基酸位置365之后被截短的氨基酸序列。因此,在某些实施方案,麦芽糖依赖性降解决定子包含seqidno:2的位置1至位置365的氨基酸序列,和在选自由以下组成的组的位置处包含一个或多个变体氨基酸残基:7、10、11、21、24、28、42、43、64、68、83、88、92、95、98、101,110、117、134、135、136、149、168、177、186、187、193、198、210、216、217、229、236、237、242、263、291、304、321、322、339、351和357,其中所述这些变体氨基酸残基的位置对应于seqidno:2的氨基酸位置。

在一些实施方案,麦芽糖依赖性降解决定子包含seqidno:2的位置1至位置365的氨基酸序列,和包含一个或多个以下变体氨基酸残基:k7r、i10t、w11g、l21s、v24a、f28y、d42v、k43e、a64t、f68s、d83g、d88n、p92t、w95r、v98i、n101i、a110t、i117v、p134s、a135t、l136m、m149i、y168c、y168n、y177h、n186s、a187p、l193s、d198v、d210e、a216v、a217d、g229c、i236n、d237n、n242d、l263m、l291v、a304s、t321n、m322l、a339t、a351t和t357s,其中所述这些变体氨基酸残基的位置对应于seqidno:2的氨基酸位置。在某些实施方案,麦芽糖依赖性降解决定子可包含短于365个氨基酸残基的氨基酸序列,和包含一个或多个本发明所述的变体氨基酸残基。

在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有四个变体氨基酸残基的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有五个变体氨基酸残基的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有六个变体氨基酸残基的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有七个变体氨基酸残基的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有八个变体氨基酸残基的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有九个变体氨基酸残基的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有十个变体氨基酸残基的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有十一个变体氨基酸残基的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有少于四个变体氨基酸残基(例如,1、2、或3个)的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含与seqidno:2或seqidno:28相比具有多于十一个变体氨基酸残基(例如,12、13、14、15个、或更多个)的氨基酸序列。

在一些实施方案,麦芽糖依赖性降解决定子包含氨基酸序列,所述氨基酸序列包含位于位置10、24、42、149和216的至少5个变体氨基酸残基,其中所述这些变体氨基酸残基的位置对应于seqidno:2的位置。在一些实施方案,麦芽糖依赖性降解决定子包含至少5个包含i10t、v24a、d42v、m149i和a216v的变体氨基酸残基,其中所述这些变体氨基酸残基的位置对应于seqidno:2的位置。在一些实施方案,包含所述这些变体氨基酸残基的氨基酸序列的麦芽糖依赖性降解决定子在氨基酸位置365或更小位置处被截短。

在一些实施方案,所述麦芽糖依赖性降解决定子包含氨基酸序列,所述氨基酸序列包含选自以下变体氨基酸残基组的至少一组变体氨基酸残基,其中所述变体氨基酸残基的位置对应于seqidno:2或seqidno:28的氨基酸位置:

(a)i10t、v24a、d42v、k43e、d83g、p92t、m149i、y168n、n186s、a216v、和t357s;

(b)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、a216v、和d237n;

(c)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、a216v、和a339t;

(d)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、a216v、和n242d;

(e)i10t、v24a、d42v、a110t、m149i、和a216v;

(f)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、和a216v;

(g)l21s、a64t、l136m、y177h、a187p、a304s、t321n、和a351t;

(h)k7r、d83g、v98i、l193s、i236n、和n374s;

(i)w11g、d88n、p134s、a135t、d210e、和m322l;

(j)i117v、y168n、g229c、l263m、t367s、和s370p;

(k)f68s、w95r、n186s、和d198v;和

(l)f28y、k43e、n101i、y168c、a217d、和l291v。

在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:4(mbp突变体3a6)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:6(mbp突变体4d3)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:8(mbp突变体5a2)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:10(mbp突变体5f3)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:12(mbp突变体l8)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:14(mbp突变体l8_v4d)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:16(mbp突变体h8)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:18(mbp突变体h9)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:20(mbp突变体h10)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:22(mbp突变体m1)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:24(mbp突变体m5)的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:26(mbp突变体m13)的氨基酸序列。

上述许多mbp突变体(例如5a2、5f3、l8等)在365个氨基酸长度处被截短,并且起到麦芽糖依赖性降解决定子的作用。因此,在一些实施方案,一些更长的mbp突变体可以截短的形式用作麦芽糖依赖性降解决定子。譬如,在一些实施方案,有用的麦芽糖依赖性降解决定子包含seqidno:16(mbp突变体h8)的位置1至365的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含seqidno:18(mbp突变体h9)的位置1至365的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含seqidno:20(mbp突变体h10)的位置1至365的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含seqidno:22(mbp突变体m1)的位置1至365的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含seqidno:24(mbp突变体m5)的位置1至365的氨基酸序列。在一些实施方案,麦芽糖依赖性降解决定子包含seqidno:26(mbp突变体m13)的位置1至365的氨基酸序列。

与具有seqidno:2的野生型mbp相比,一些mbp突变体在c端包含另外的连接体序列。由于连接体序列不一定是麦芽糖依赖性降解决定子功能所必需的,所以有用的麦芽糖依赖性降解决定子包含具有与野生型mbp相同长度的氨基酸序列。譬如,在一些实施方案,有用的麦芽糖依赖性降解决定子包含seqidno:16(mbp突变体h8)的位置1至370的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:18(mbp突变体h9)的位置1至370的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:20(mbp突变体h10)的位置1至370的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:22(mbp突变体m1)的位置1至370的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:24(mbp突变体m5)的位置1至370的氨基酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子包含seqidno:26(mbp突变体m13)的位置1至370的氨基酸序列。

在一些实施方案,麦芽糖依赖性降解决定子包含具有置换、缺失或插入的本发明所述的任何合适的氨基酸序列。通常,氨基酸变化可能较小,使得麦芽糖依赖性降解决定子保留其麦芽糖依赖性条件性稳定性。譬如,所述置换、缺失或插入可包括1至约30个氨基酸,并且可包括例如在羧基末端或在氨基末端处具有约30个氨基酸残基或更少的较小肽连接体。

在一些实施方案,麦芽糖依赖性降解决定子包含具有保守氨基酸置换的本发明所述的任何合适的氨基酸。以下六组各自含有彼此保守置换的氨基酸:1)丝氨酸(s),苏氨酸(t);2)天冬氨酸(d),谷氨酸(e);3)天冬酰胺(n),谷氨酰胺(q);4)精氨酸(r),赖氨酸(k);5)异亮氨酸(i),亮氨酸(l),丙氨酸(a),缬氨酸(v);和6)苯丙氨酸(f),酪氨酸(y),色氨酸(w)。通常不会改变特定活性的氨基酸置换是本领域已知的,例如在h.neurathandr.l.hill,1979,in,theproteins,academicpress,newyork中所描述的。最常见的置换有ala/ser,val/ile,asp/glu,thr/ser,ala/gly,ala/thr,ser/asn,ala/val,ser/gly,tyr/lys/arg,asp/asn,leu/ile,leu/val,ala/glu和asp/gly。

除了20个标准氨基酸之外,可用非标准氨基酸(例如4-羟脯氨酸,6-n-甲基赖氨酸,2-氨基异丁酸,异缬氨酸和α-甲基丝氨酸)置换本发明所述的麦芽糖依赖性降解决定子的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可置换氨基酸残基。非天然氨基酸可在蛋白合成后进行修饰,和/或在其侧链中具有与标准氨基酸不同的化学结构。

尽管本发明描述了麦芽糖依赖性降解决定子的特定氨基酸序列和特定变体氨基酸残基,但适用于本发明组合物和方法的麦芽糖依赖性降解决定子氨基酸序列不限于这些特定氨基酸序列或变体。譬如,图.8b示出了许多其他麦芽糖依赖性降解决定子(例如,1-b9、4-e12、4-g10、4-f11、4-f4、2-f10、2-e8、2-g8、1-f7、4-h4、和2-a4),其表现出麦芽糖依赖性稳定性。

此外,可将本发明所述的去稳定突变引入包含seqidno:2或seqidno:28的mbp的任何同源物中。譬如,通过本领域已知的序列比对算法,可容易地确定去稳定突变的相应位置的其他同源物。参考seqidno:2或seqidno:28的本发明所述氨基酸置换可应用于其来自不同物种或生物体的同源物。譬如,参考seqidno:2或seqidno:28的位置描述的氨基酸置换可衍生自大肠杆菌mbp的同源物(例如,源自鼠疫耶尔森氏菌(yersiniapestis),霍乱弧菌(vibriocholerae),海栖热袍菌(thermotogamaritima),嗜热高温球菌(thermococcuslitoralis),强烈火球菌(pyrococcusfuriosus)等的mbp)。在一些实施方案,所述这些同源物中的一些可与seqidno:2或seqidno:28具有至少约50%、60%、70%、80%、90%、95%、96%、97%、98%、或99%的序列同一性。在其他实施方案,麦芽糖依赖性降解决定子可源自不是大肠杆菌mbp同源物的mbp,但依赖于与麦芽糖的结合而稳定。因此,其他麦芽糖依赖性降解决定子(例如,使用本发明所述的测定方法筛选的mbp突变体)属于本发明范围内,并可用于本发明提供的组合物和方法中。

6.2.2.2麦芽糖依赖性降解决定子核酸序列

另一方面,本发明提供了编码麦芽糖依赖性降解决定子的分离的核酸分子。术语“核酸分子”是指现有技术中已知的dna、rna或两者的组合或其任何修饰物。此类核酸分子是单链或双链的、直链或环状的并且没有任何大小限制。本发明的核酸分子可通过重组技术例如pcr获得,或者可合成得到。在具体实施方案中,本发明的核酸分子是dna分子,例如cdna。

在一些实施方案,所述分离的核酸分子包含编码本发明所述的任何麦芽糖依赖性降解决定子的核苷酸序列(例如,在6.2.2.1节中所述)。譬如,所述分离的核酸分子包含编码与seqidno:2或seqidno:28具有至少约70%,至少约75%,至少约80%,至少约85%,至少约90%,至少约95%,至少约96%,至少约97%,至少约98%,或至少约90%序列同一性的麦芽糖依赖性降解决定子的核酸序列,和与seqidno:2或seqidno:28相比,包含至少一个变体氨基酸残基。

在一些实施方案,所述分离的核酸分子包含编码麦芽糖依赖性降解决定子的核苷酸序列,所述麦芽糖依赖性降解决定子包含一个或多个变体氨基酸残基,所述一个或多个变体氨基酸残基位于选自由以下组成的组的一个或多个位置:7、10、11、21、24、28、42、43、64、68、83、88、92、95、98、101,110、117、134、135、136、149、168、177、186、187、193、198、210、216、217、229、236、237、242、263、291、304、321、322、339、351、357、367、370和374,其中所述这些变体氨基酸残基的位置对应于seqidno:2或seqidno:28的野生型mbp氨基酸位置。

在一些实施方案,所述分离的核酸分子包含编码麦芽糖依赖性降解决定子的核苷酸序列,与seqidno:2或seqidno:28相比,所述麦芽糖依赖性降解决定子包含的一个或多个变体氨基酸残基,和其中所述一个或多个变体氨基酸残基选自由k7r、i10t、w11g、l21s、v24a、f28y、d42v、k43e、a64t、f68s、d83g、d88n、p92t、w95r、v98i、n101i、a110t、i117v、p134s、a135t、l136m、m149i、y168c、y168n、y177h、n186s、a187p、l193s、d198v、d210e、a216v、a217d、g229c、i236n、d237n、n242d、l263m、l291v、a304s、t321n、m322l、a339t、a351t、t357s、t367s、s370p和n374s组成的组。

在一些实施方案,所述分离的核酸分子包含编码麦芽糖依赖性降解决定子的核苷酸序列,所述麦芽糖依赖性降解决定子与具有seqidno:2的野生型mbp相比被截短。譬如,所述核苷酸序列可编码包含seqidno:2的氨基酸残基1至365的麦芽糖依赖性降解决定子,并包含本发明所述的一个或多个变体氨基酸残基。在一些实施方案,所述分离的核酸序列包含编码麦芽糖依赖性降解决定子的核苷酸序列,所述麦芽糖依赖性降解决定子在短于365个氨基酸残基的位置处被截短。

在一些实施方案,所述分离的核酸分子包含编码麦芽糖依赖性降解决定子的核苷酸序列,所述麦芽糖依赖性降解决定子包含具有选自以下变体氨基酸残基组的至少一组变体氨基酸残基的氨基酸序列,其中所述变体氨基酸残基的位置对应于seqidno:2或seqidno:28的氨基酸位置:

(a)i10t、v24a、d42v、k43e、d83g、p92t、m149i、y168n、n186s、a216v、和t357s;

(b)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、a216v、和d237n;

(c)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、a216v、和a339t;

(d)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、a216v、和n242d;

(e)i10t、v24a、d42v、a110t、m149i、和a216v;

(f)i10t、v24a、d42v、k43e、d83g、m149i、y168n、n186s、和a216v;

(g)l21s、a64t、l136m、y177h、a187p、a304s、t321n、和a351t;

(h)k7r、d83g、v98i、l193s、i236n、和n374s;

(i)w11g、d88n、p134s、a135t、d210e、和m322l;

(j)i117v、y168n、g229c、l263m、t367s、和s370p;

(k)f68s、w95r、n186s、和d198v;和

(l)f28y、k43e、n101i、y168c、a217d、和l291v。

在一些实施方案,所述分离的核酸分子包含在严格条件下与和seqidno:1或seqidno:27互补的核苷酸序列杂交的核酸分子,并编码麦芽糖依赖性降解决定子,所述麦芽糖依赖性降解决定子包含至少一种上述特定突变并保留麦芽糖依赖性蛋白稳定性。在一些实施方案,所述严格条件是在65℃下以对应于0.1×ssc和0.1%sds的盐浓度进行一次、两次或三次清洗。

在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:3(mbp突变体3a6)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:5(mbp突变体4d3)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:7(mbp突变体5a2)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:9(mbp突变体5f3)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:11(mbp突变体l8)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:13(l8_v4d)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:15(mbp突变体h8)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:17(mbp突变体h9)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:19(mbp突变体h10)的序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:21(mbp突变体m1)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:23(mbp突变体m5)的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:25(mbp突变体m13)的核苷酸序列。

上述许多mbp突变体核酸(例如,5a2、5f3、l8等)在1098个核苷酸长度处被截短,并且当翻译成蛋白时,起到麦芽糖依赖性降解决定子的作用。因此,在一些实施方案,具有长于1098个核苷酸的序列的麦芽糖依赖性降解决定子可以截短的形式使用。譬如,在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:11的位置1至位置1098的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:15的位置1至位置1098的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:17的位置1至位置1098的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:19的位置1至位置1098的序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:21的核苷酸序列的位置1至位置1098。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:23的位置1至位置1098的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:25的核苷酸序列。

与具有seqidno:1的野生型mbp核酸相比,一些mbp突变体核酸在其c端包含另外的连接体序列。因此,在一些实施方案,所述这些mbp突变体核酸可在其c端不具有所述另外的连接体序列的情况下使用。譬如,在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:11的位置1至位置1113的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:15的位置1至位置1113的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:17的位置1至位置1113的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:19的位置1至位置1113的序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:21的核苷酸序列的位置1至位置1113。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:23的位置1至位置1113的核苷酸序列。在一些实施方案,所述麦芽糖依赖性降解决定子核酸分子包含seqidno:25的核苷酸序列。

可通过常规方法诸如聚合酶链式反应(pcr,参见sambrookjetal.,molecularcloning:alaboratorymanual,coldspringharborpress,newyork(2001),ausubelfmetal.,currentprotocolsinmolecularbiology,johnwileyandsons,newyork(1999),adamsaetal.,methodsinyeastgenetics,coldspringharborpress,newyork(1997)),或通过随机诱变技术,例如使用诱变剂(紫外线或化学剂如亚硝基胍(ntg)或甲基磺酸乙酯(ems)),或使用pcr技术(dna改组或易错pcr),将突变引入本发明公开的任何序列(例如,具有seqidno:1的野生型mbp)中。在一些实施方案,编码所述麦芽糖依赖性降解决定子的任何核酸序列可通过本领域普通技术人员已知的遗传/蛋白工程技术,如定向进化或合理诱变来进行优化。使用这些方法生成的突变体可使用本发明所述的任何测定方法或本领域技术人员认为合适的其他测定方法来筛选其麦芽糖结合稳定性。因此,所述麦芽糖依赖性降解决定子核酸的范围不限于本发明公开的特定序列,而是还包括任何mbp突变体核酸,其在编码成蛋白时表现出麦芽糖依赖性稳定性。

由于遗传密码的固有简并性,编码6.2.2.1节中描述的基本相同或功能等同的多肽的其他多核苷酸也可用于本发明提供的组合物和方法中。

如本领域技术人员所理解的,修饰编码序列以增强其在特定宿主中的表达可能是有利的。所述遗传密码是冗余的,具有64个可能的密码子,但大多生物体通常使用所述这些密码子的子集。在物种中最常使用的密码子被称为最佳密码子,而那些不常使用的密码子则被归类为罕见或低使用密码子。在有时被称为“密码子优化”或“控制物种密码子偏误”的过程中,可置换密码子以反映宿主的优选密码子使用。

可制备含有由特定原核或真核宿主(murrayetal.,1989,nuclacidsres.17:477-508)优选的密码子的优化编码序列,譬如,以提高翻译速率或生成具有所需特性的重组rna转录物。翻译终止密码子也可进行修改以反映宿主的偏好。譬如,酿酒酵母和哺乳动物的典型终止密码子分别是uaa和uga。单子叶植物类的典型终止密码子是uga,而昆虫和大肠杆菌通常使用uaa作为终止密码子(dalphinetal.,1996,nuclacidsres.24:216-8)。

虽然遗传密码的简并性和优化编码序列是在麦芽糖依赖性降解决定子的背景下讨论的,但此原理可应用于本发明所述的任何编码序列。

6.2.3.融合蛋白

另一方面,本发明提供了麦芽糖依赖性降解决定子,其可与任何目的蛋白融合,以通过操纵培养基中的麦芽糖含量来控制其稳定性。譬如,目的蛋白可包括转录调控因子、酶、信号传导蛋白、转运蛋白等。在一些实施方案,目的蛋白可包括直接影响细胞功能如细胞生长速率的蛋白。在其他实施方案,选择目的蛋白,使得目的蛋白的麦芽糖依赖性稳定性可通过操纵麦芽糖含量来暂时改变所需靶分子的水平。

在一些实施方案,可选择转录调控因子作为目的蛋白以与麦芽糖依赖性降解决定子融合。与麦芽糖依赖性降解决定子框内融合的转录调控因子可全面影响许多不同下游靶分子的表达。可与麦芽糖依赖性降解决定子融合的转录调控因子的实例包括gal80p或gal4p。与麦芽糖依赖性降解决定子框内融合的转录调控因子的麦芽糖依赖性稳定性可进而调节转录调控因子下游的靶分子的表达水平或表达量。譬如,所述靶分子可包括由生物合成途径中的生物合成基因编码的酶类、代谢物类或通过酶催化反应生成的异源性化合物类。

生成融合蛋白和融合dna构建体的方法是本领域众所周知的。简言之,所述方法包括在相同的翻译阅读框中将编码目的基因或其部分的dna连接至编码麦芽糖依赖性降解决定子的dna。所述编码的目的蛋白可框内连接至所述麦芽糖依赖性降解决定子的氨基端或羧基端。在一些实施方案,麦芽糖依赖性降解决定子的编码序列可直接连接至目的蛋白的编码序列。在其他实施方案,融合蛋白可包含将麦芽糖依赖性降解决定子连接至目的蛋白的连接体(例如,肽连接体)。

6.2.4.核酸构建体和表达载体

另一方面,本发明提供了包含编码融合蛋白的核酸的核酸构建体,所述融合蛋白包含与目的蛋白框内融合的麦芽糖依赖性降解决定子。在一些实施方案,编码融合蛋白的核酸可与一个或多个控制序列可操作地连接,所述控制序列指导所述融合蛋白在适合所述控制序列的条件下在宿主细胞中的表达。所述控制序列可包括任何合适的启动子序列、转录端序列、聚腺苷酸化序列等。所述这些控制序列可以是调控选择的宿主细胞中的转录活性的任何核苷酸序列,并且可从编码与宿主细胞同源或异源的目的蛋白的基因获得。在一些实施方案,用于遗传修饰的宿主细胞的核酸构建体包含用于选择转化的宿主细胞和对宿主细胞施加选择压力以维持外源dna的一种或多种可选标记。本领域已知的任何合适的控制序列或标记序列可用于生成核酸构建体。

在一些实施方案,可操作地连接至所述融合核酸的启动子序列可以是编码目的蛋白的核酸的内源性启动子序列。在一些情况下,可能需要将所述融合蛋白表达水平的时间响应与所述目的蛋白的内源性表达水平的时间响应相匹配。譬如,如果选择gal80p作为目的蛋白,则其内源性启动子可用于驱动融合gal80p蛋白的表达。

在一些实施方案,与融合核酸可操作连接的启动子序列可以是麦芽糖响应型启动子。通过将麦芽糖响应型启动子与编码包含麦芽糖依赖性降解决定子的融合蛋白的核酸构建体组合,所述组合物和方法可使用单一配体(例如,麦芽糖)来控制所述融合核酸构建体的转录和由其编码的融合蛋白的翻译后稳定性。合适的麦芽糖响应型启动子的实例将在下面的6.3节中进一步详细描述。

另一方面,本发明提供了表达载体(vector)或染色体整合构建体,其包含编码融合蛋白的核酸,所述融合蛋白包含目的蛋白和麦芽糖依赖性降解决定子。所述重组表达载体可以是适于表达所述融合蛋白的任何载体(例如,质粒、病毒载体、粘粒)。载体的选择将取决于载体与待引入载体的宿主细胞的相容性以及所述宿主细胞的最终应用。在一些实施方案,所述载体可进一步包括允许所述载体整合到宿主细胞的基因组中的元件。在其他实施方案,所述载体可以是染色体外存在于宿主细胞的自主复制载体。

6.2.5.在调节蛋白稳定性和生成非分解代谢化合物的方法中使用麦芽糖依赖性降解决定子

另一方面,本发明提供了使用麦芽糖依赖性降解决定子和麦芽糖调节蛋白稳定性的方法。所述方法包括提供融合蛋白,所述融合蛋白包含与任何合适的麦芽糖依赖性降解决定子框内融合的目的蛋白。在某些实施方案,所述方法包括使所述融合蛋白与麦芽糖接触,使得当所述麦芽糖依赖性降解决定子与麦芽糖接触(例如结合)时,与麦芽糖依赖性降解决定子不与麦芽糖接触时相比,所述融合蛋白更稳定。

在某些实施方案,所述方法可在无细胞系统(例如,细胞提取物)中进行。譬如,从遗传修饰以表达融合蛋白的宿主细胞获得的细胞提取物可用于本发明提供的方法中。不含麦芽糖的细胞提取物中的融合蛋白可能是不稳定的,并以比期望更快的速率降解。当期望增加所述融合蛋白的稳定性并降低降解速率时,可在本发明提供的方法中将麦芽糖添加至所述细胞提取物中。在无细胞系统中,可使用任何合适的技术来测定融合蛋白的麦芽糖依赖性条件性稳定性。譬如,如果所述融合蛋白包含荧光标记作为麦芽糖依赖性降解决定子的融合配偶体,则可使用合适的成像技术和/或定量试剂盒来测定细胞提取物的荧光水平。

在一些实施方案,调节蛋白稳定性的方法可用表达本发明实施方案的融合蛋白的遗传修饰的宿主细胞进行。譬如,采用编码融合蛋白的核酸进行遗传修饰的宿主细胞可在包含麦芽糖的培养基中培养以维持所述融合蛋白的稳定性。当期望消除或降低宿主细胞中的融合蛋白稳定性时,可改变培养基,使得麦芽糖在培养基中不存在或以足够低的量存在。譬如,可将宿主细胞转移至包含培养基的新发酵罐中,所述培养基不含麦芽糖。与宿主细胞转移的任何残余麦芽糖可被新发酵罐中的宿主细胞消耗,并且可添加麦芽糖以外的碳源(例如,蔗糖)以维持所述宿主细胞。

维持麦芽糖依赖性降解决定子(和融合蛋白)稳定性的麦芽糖的合适量可凭经验确定。譬如,维持麦芽糖依赖性降解决定子及其融合蛋白的稳定性的麦芽糖的饱和或最佳量,可以通过在培养基中麦芽糖的量增加的情况下作蛋白稳定性(麦芽糖依赖性降解决定子和/或融合蛋白)曲线,即麦芽糖滴定法。譬如,表达麦芽糖依赖性降解决定子(或其融合蛋白)的遗传修饰的宿主细胞群可分成多个亚群并平行培养,其中每个亚群在包含不同的,例如增加量的麦芽糖(包括不含麦芽糖)的培养基中生长,并且在限定的时间段后测定麦芽糖依赖性降解决定子或融合蛋白的表达。麦芽糖滴定曲线将显示出至少两种浓度的麦芽糖,其中宿主细胞中所述麦芽糖依赖性降解决定子或融合蛋白的稳定性水平处于其最低水平,因此它们在宿主细胞中的稳定性水平达到其最高水平。麦芽糖的饱和或最佳量是培养基中麦芽糖的量或浓度,其中宿主细胞中麦芽糖依赖性降解决定子或融合蛋白的稳定性达到其最高水平。在第6.4节中将进一步详细描述用于稳定麦芽糖依赖性降解决定子及其融合蛋白的麦芽糖的合适量。

在一些实施方案,宿主细胞进行遗传修饰以包含与编码融合蛋白的核酸可操作地连接的麦芽糖响应型启动子。这些实施方案将在6.2.6节和6.8节中进一步详细描述。在所述这些实施方案,麦芽糖的饱和或最佳量包括能够激活麦芽糖响应型启动子以驱动融合基因以最高水平表达以及保持由其编码的融合蛋白的最大翻译后稳定性的量。通常,为了增加麦芽糖响应型启动子的活性和融合蛋白的稳定性,麦芽糖以至少约5克/升,典型地以至少约10克/升的量存在于培养基中,更典型地以至少约20克/升的量存在于培养基中。通常,麦芽糖以小于约100克/升,典型地小于约60克/升,更典型地小于约50克/升的量存在于培养基中。

在一些实施方案,当融合蛋白中麦芽糖依赖性降解决定子与麦芽糖接触时,本发明实施方案所述的融合蛋白比不与麦芽糖接触时稳定至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%或以上。

对于给定融合蛋白,其麦芽糖依赖性稳定性可以许多不同的方式进行调节。在其中一个实施方案,麦芽糖的浓度可在培养基中进行调整。譬如,如果融合蛋白需要最大的稳定性,则可将由滴定曲线确定的麦芽糖的最佳量加至培养基中。在一些实施方案,麦芽糖可以比麦芽糖滴定曲线确定的最佳量更高的浓度进行使用,以确保融合蛋白的最大稳定性可以实现。在另一实施例,如果融合蛋白需要适度的稳定性水平,则可向培养基中加入次最佳量的麦芽糖(例如,最佳量的一半)。

在另一实施方案,融合蛋白的麦芽糖依赖性稳定性可通过选择合适的麦芽糖依赖性降解决定子作为目的蛋白的融合配偶体来调节。在给定浓度的麦芽糖或不存在麦芽糖时,当与目的蛋白融合时,不同的麦芽糖依赖性降解决定子可赋予不同水平的稳定性(例如,根据融合蛋白活性测定)。譬如,如图.8b所示,无论是在麦芽糖存在下还是在麦芽糖不存在下,包含与麦芽糖依赖性降解决定子4-h10(例如h10)融合的gfp的融合蛋白的稳定性水平低于包含gfp和麦芽糖依赖性降解决定子l8_v4d的融合蛋白的稳定性水平。在需要较高稳定性水平的融合蛋白的实施方案中,可使用麦芽糖依赖性降解决定子,如l8_v4d作为融合配偶体。在融合蛋白需要较低稳定性水平的另一实施方案中,麦芽糖依赖性降解决定子4-h10可用作融合配偶体。在一些实施方案,可能需要使融合蛋白(当与麦芽糖接触时)的稳定性水平与宿主细胞中目的蛋白的内源性稳定性水平相匹配。在此类实施方案中,可选择赋予适当水平的麦芽糖依赖性稳定性的合适麦芽糖依赖性降解决定子作为目的蛋白的融合配偶体。

在一些实施方案,基于其降解速率分布,可选择麦芽糖依赖性降解决定子作为融合配偶体。如图.11a和11b所示,麦芽糖依赖性降解决定子中的一些在不含麦芽糖的细胞中具有比其他麦芽糖依赖性降解决定子更快的降解速率。譬如,当与gfp融合时,麦芽糖依赖性降解决定子5f3与麦芽糖依赖性降解决定子h8相比,以更快的速率降解融合蛋白。如果在从培养基中除去麦芽糖之后目的蛋白需要较慢降解速率,则可使用具有较慢降解速率的麦芽糖依赖性降解决定子如h8作为融合配偶体。另一方面,如果在除去麦芽糖之后目的蛋白需要较快降解速率,那么具有较快降解速率的麦芽糖依赖性降解决定子如5f3可用作目的蛋白的融合配偶体。

在一些实施方案,可能需要在遗传修饰的宿主细胞中使用麦芽糖依赖性降解决定子来控制多种蛋白的稳定性。譬如,可能需要使用麦芽糖来控制生物合成途径中两种或更多种酶的稳定性。在所述这些实施方案中,相同的麦芽糖依赖性降解决定子可用作所有目的蛋白的融合配偶体。或者,每种目的蛋白可与不同的麦芽糖依赖性降解决定子融合,这取决于每种目的蛋白所需的稳定性。

在一些实施方案,选择作为麦芽糖依赖性降解决定子的融合配偶体的目的蛋白可在宿主细胞中进行内源性表达。由于内源性目的蛋白的表达可使得融合蛋白的麦芽糖依赖性稳定性变得模糊,因此在一些实施方案中,编码目的蛋白(例如gal80p)的内源性基因可被功能性地破坏。譬如,所述内源性基因可从宿主基因组中删除。在另一实施例,包含编码融合蛋白的核酸的核酸构建体可整合到宿主基因组中编码目的蛋白的内源性基因的位点。可使用本领域已知的任何合适的方法将编码融合蛋白的核酸整合到宿主基因组中的期望靶位点。譬如,编码融合蛋白的异源性核酸可在被核酸酶,例如锌指核酸酶、tal效应因子结构域核酸酶、和/或crispr/cas核酸酶系统进行酶切之后整合到选定的基因中。所述这些技术是已知的,并描述在例如美国专利号8,685,737;和horwitzetal.(2015),cellsystems1,1-9中,其通过引用其全文并入本文。

可选择任何合适的目的蛋白作为本发明实施方案所述的麦芽糖依赖性降解决定子的融合配偶体。在一些实施方案,选择目的蛋白使得当其与麦芽糖依赖性降解决定子融合时,其可通过操纵麦芽糖浓度直接影响细胞功能。譬如,目的蛋白可包括参与脂肪酸合成的基因产物,所述脂肪酸合成可改善细胞生长。当需要细胞生长时,在发酵的细胞生物量构建阶段期间,采用麦芽糖在培养基中开启与麦芽糖依赖性降解决定子融合的此基因产物。在需要减少细胞生长的情况下,可通过在发酵的生成阶段去除麦芽糖来关闭它们,从而可将细胞的资源转移至由宿主细胞制备所需的异源性化合物。通过调节培养基中的麦芽糖浓度,可在发酵过程的不同阶段根据需要直接调节和暂时调节包含此类目的蛋白的融合蛋白的稳定性。

在其他实施方案,选择目的蛋白作为麦芽糖依赖性降解决定子的融合配偶体,使得目的蛋白的麦芽糖依赖性稳定性可用于通过操纵麦芽糖含量将其作用级联至一个或多个下游靶分子上。在所述这些实施方案中,包含麦芽糖依赖性降解决定子的融合蛋白可与宿主细胞中的一种或多种生物分子(例如,其他蛋白或核酸)相互作用,以间接调节一种或多种靶分子的表达水平或表达量。譬如,生物合成途径的一种或多种酶的间接调控可通过将麦芽糖依赖性降解决定子与单一异源性转录调控因子融合来实现,所述单一异源性转录调控因子的表达又转而调控所述生物合成途径的一种或多种酶(例如,所有酶)的表达。间接调控的示例性实施方案通过图.1a至2b的原理图示出,其示出了作为gal调节子的多种生物合成途径基因的调控。

酵母中的gal调节子提供了可与本发明所述的麦芽糖依赖性降解决定子组合使用的激活因子、抑制因子和启动子的示例性调控网络。酵母可利用半乳糖作为碳源通过表达gal基因进入半乳糖并在细胞内代谢。所述gal基因包括分别编码半乳糖激酶、半乳糖渗透酶、α-d-半乳糖-1-磷酸尿苷酰转移酶、和尿苷二磷酸半乳糖-4-差向异构酶的结构基因gal1、gal2、gal7和gal10基因,以及调控因子基因gal4、gal80和gal3。所述gal4基因产物是正调控因子(即激活因子),而gal80基因产物是gal1、gal2、gal7和gal10基因表达的负调控因子(即抑制因子/阻遏物)。gal4p通过结合上游激活序列(uas),例如所述gal结构基因的那些,即在pgal1、pgal7和pgal10启动子内激活转录。在不存在半乳糖情况下,由于gal80p与gal4p相互作用并阻止gal4p转录活性,所以通常检测到极少量的结构蛋白(gal1p、gal2p、gal7p和gal10p)的表达。然而,在半乳糖存在情况下,gal3p与gal80p相互作用,从而解除了gal80p对gal4p的抑制。这使得gal4p结合序列如gal1、gal2、gal7和gal10基因产物的下游基因表达。

图.1a和1b示出了示例性实施方案,其中与一种或多种生物分子间接和负相互作用的融合蛋白使用所述gal调节子来调节一种或多种靶分子的表达水平或表达量。在图.1a和1b示出的实施方案中,转录调控因子gal80p是与麦芽糖依赖性降解决定子框内融合的目的蛋白。gal80p是与pgal启动子如pgal1、pgal2、pgal7或pgal10(例如,生物分子)结合的转录激活因子gal4p(例如,生物分子)的抑制型辅助因子(即转录抑制因子)。如图.1a所示,pgal启动子可操作地连接至编码生物合成途径中的酶的一个或多个基因(例如,靶分子)。在培养基中存在麦芽糖的情况下,如图.1a所示,麦芽糖与麦芽糖依赖性降解决定子结合,并且融合蛋白被稳定并以相对较高的水平进行表达。所述融合蛋白的gal80p部分结合至并抑制转录激活因子gal4p从而激活所述pgal启动子。此举转而抑制来自pgal启动子的生物合成途径基因的转录,降低由酶(例如,非分解代谢化合物)的催化反应生成的酶和其他下游靶分子的表达水平。因此,在图.1a所示的实施方案中,当麦芽糖与麦芽糖依赖性降解决定子接触时,所述融合蛋白负调节靶分子(例如,酶、非分解代谢化合物等)的表达水平或表达量。

在图.1b中,当从培养基中除去麦芽糖时,宿主细胞中包含gal80p的融合蛋白是不稳定的并且以更快的速率降解,导致宿主细胞中gal80p表达水平低于图.1a中所示的阶段。这解除了对转录激活因子gal4p的抑制,而转录激活因子gal4p又可与pgal启动子结合并驱动生物合成途径基因的表达。因此,当培养基中存在麦芽糖时,与图.1a所示阶段相比,酶反应催化的靶分子如酶类、代谢物类、异源性化合物类的水平增加。

图.2a和2b示出了与一种或多种生物分子相互作用以间接和正调节一种或多种靶分子的表达水平或表达量的融合蛋白。如图.2a所示,宿主细胞包含转录激活因子gal4p作为与麦芽糖依赖性降解决定子融合的目的蛋白。当向培养基中加入麦芽糖时,如图.2a所示,融合蛋白采用麦芽糖与麦芽糖依赖性降解决定子接触而稳定。这增加了包含gal4p的融合蛋白的整体稳定性,gal4p又转而结合pgal启动子(例如,生物分子)以驱动生物合成途径基因(例如,靶分子)的表达。生物合成途径基因的表达转而又增加了下游靶分子例如这些酶的催化反应产物的异源性化合物的生成量。在此实施方案中,当需要降低或消除宿主细胞中生成的一种或多种靶分子的表达水平或表达量时,可降低麦芽糖含量或除去麦芽糖,如图.2b所示。在此示例性实施方案中,内源性gal80基因的表达可被功能性破坏,使得作为gal4p的抑制因子的内源性gal80p不存在负调节gal4p活性。

在一些实施方案,融合蛋白调节的不同模式可共同存在于单个宿主细胞中。譬如,宿主细胞可包含直接影响细胞功能(例如,细胞生长)的融合蛋白和正调节一种或多种靶分子的表达水平或表达量的另一融合蛋白。在另一实施例,宿主细胞可包含直接影响细胞功能的融合蛋白和负调节一种或多种靶分子的表达水平或表达量的另一融合蛋白。在另一实施例,宿主细胞可包含负调节一种或多种靶分子的表达水平或表达量的融合蛋白和正调节一种或多种靶分子的表达水平或表达量的融合蛋白。

图.1a至2b所示的实施方案仅仅是示例性的,目的蛋白的任何合适的组合可用作麦芽糖依赖性降解决定子的融合配偶体,并可在本发明提供的组合物和方法中使用任何合适的调节模式的组合。

6.2.6.麦芽糖响应型启动子和麦芽糖依赖性降解决定子的双重转录控制和翻译后控制

另一方面,本发明提供了通过操纵麦芽糖含量来提供基因表达的转录控制和基因产物的翻译后稳定性控制的方法。通过将可赋予麦芽糖依赖性翻译后稳定性的遗传元件与任何基因组合,所述基因与由麦芽糖诱导的启动子框内融合,本发明提供的组合物和方法可对目的蛋白(和任何下游靶分子)的表达和稳定性的时机施加非常稳健且严格的控制。

因此,本发明提供了使用麦芽糖依赖性降解决定子和麦芽糖响应型性启动子来控制遗传修饰的宿主细胞中目的蛋白的表达和稳定性的时机的方法。在某些实施方案,宿主细胞包含可操作地连接至编码融合蛋白的异源性核酸的麦芽糖响应型启动子,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白。在存在足够量的麦芽糖情况下,异源性核酸的转录被激活(或增加),和由其编码的融合蛋白被稳定。在适当的时间点,可在麦芽糖不存在或以足够低的量存在的培养基中培养宿主细胞,使得麦芽糖响应型启动子活性和融合蛋白稳定性与培养基包含足够量的麦芽糖时相比降低了。结果是,在不存在(或以足够低的量存在)麦芽糖时,异源性核酸的表达可被负调控。因此,在所述这些实施方案中,可利用相同的效应因子分子(例如,麦芽糖)来提供目的基因的同时转录控制和基因产物的翻译后控制。

图.3a和3b表示原理图,其示出了使用麦芽糖和麦芽糖依赖性降解决定子的示例性基因表达的双重转录控制和基因产物的翻译后控制。如图.3a和3b所示,编码包含gal80p和麦芽糖依赖性降解决定子的融合蛋白的核酸可操作地连接至麦芽糖响应型启动子(例如,天然启动子pmal或合成麦芽糖响应型启动子如pgmal启动子)。在存在麦芽糖情况下,如图.3a所示,所述pmal或pgmal启动子被激活(或其活性增加),和所述融合dna构建体被转录以编码融合蛋白,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的gal80p。在存在麦芽糖情况下,所述融合蛋白与结合麦芽糖依赖性降解决定子的麦芽糖是稳定的,从而提供高水平的融合蛋白表达和稳定性。如图.3b所示,当从培养基中除去麦芽糖时,所述麦芽糖响应型启动子失活或活性降低,和由融合dna构建体编码的任何融合蛋白变得不稳定并以更快速率降解。

图.3a和3b所示实施方案仅仅是示例性的。使用麦芽糖响应型启动子和麦芽糖依赖性降解决定子的双重转录控制和翻译后控制可应用于需要严格控制融合蛋白和/或下游靶分子的表达和稳定性的时机的任何情况。

6.2.6.1使用麦芽糖响应型启动子与麦芽糖依赖性降解决定子和麦芽糖含量操作的组合作为生成非分解代谢化合物的开关

在具体实施方案中,本发明提供的方法和组合物利用麦芽糖响应型启动子和麦芽糖依赖性降解决定子结合操纵发酵培养基中的麦芽糖含量,以直接或间接调控在遗传修饰的宿主细胞中能够影响非分解代谢化合物生成量的异源性酶的表达和/或稳定性。在所述这些实施方案中,编码图.3a和3b所示的一种或多种靶分子的核酸可包括编码生物合成途径基因的异源性核酸,所述生物合成途径基因编码能够实现非分解代谢化合物(例如,类异戊二烯化合物)生成的酶(例如,甲羟戊酸途径酶)。

麦芽糖(或其类似物或衍生物)便宜、无毒且稳定。用于控制基因表达和蛋白稳定性的时机是有吸引力的分子,特别是对于大规模生成过程。在一些实施方案,当与目的基因可操作地连接时,天然存在的麦芽糖响应型启动子不总是提供延长的生成过程所需的紧密转录控制。因此,在一些实施方案,麦芽糖依赖性降解决定子可与麦芽糖响应型启动子组合使用,以同时控制基因表达和/或蛋白(例如,在发酵过程中,在遗传修饰的宿主细胞中生成非分解代谢化合物的生物合成途径的酶)稳定性的时机。在其他实施方案,合成的麦芽糖响应型启动子也可与麦芽糖依赖性降解决定子组合使用,以同时控制非分解代谢化合物生成中的基因表达和/或蛋白稳定性的时机。

在其中一个实施方案,当在麦芽糖(例如,至少约0.1%麦芽糖)存在下进行宿主细胞的发酵时,非分解代谢化合物生成基本上减少或关闭。当发酵培养基中麦芽糖的量减少或消除时,开启或增加非分解代谢化合物生成。因此,在一些实施方案,本发明所述的遗传修饰的细胞包含异源性生物合成途径基因,所述异源性生物合成途径基因是由麦芽糖响应型启动子和融合蛋白调控,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白。此类系统能够使用发酵培养基中的麦芽糖含量作为生成非分解代谢化合物的开关。控制非分解代谢化合物生成的时机仅在需要生成时发生,将非生成阶段期间的碳通量重新导向细胞维持和细胞生物量。碳的这种更有效的使用极大地减少了宿主细胞的代谢负担,改善了细胞生长,增加了异源性基因的稳定性,减少了菌株退化,并有助于改善细胞的整体健康和生存力。

在一些实施方案,所述发酵方法包括利用麦芽糖作为开关以实现“关闭”和“开启”阶段的两步过程/方法。在不需要生成化合物的第一步(即“构建”阶段,步骤(a))中,使遗传修饰的宿主细胞在包含麦芽糖的生长或“构建”培养基中生长,所述麦芽糖的量足以在麦芽糖响应型启动子的控制下诱导基因表达,和所述诱导的基因产物用于负调控非分解代谢化合物的生成。所述融合dna构建体在麦芽糖响应型启动子控制下转录后,所述融合蛋白的稳定性在翻译后控制。在第二步(即所述“生成”阶段,步骤(b))中,所述发酵是在包含碳源的培养基中进行,其中麦芽糖不存在或以足够低的量存在使得麦芽糖响应型启动子的活性降低或失活并且使所述融合蛋白不稳定。结果,通过所述宿主细胞生成异源性非分解代谢化合物的量被开启或增加。

在其他实施方案,麦芽糖响应型启动子可以可操作地连接至编码生物合成途径的一种或多种酶的一种或多种异源性核酸。在所述培养基中存在活化量的麦芽糖增加了所述生物合成途径的所述一种或多种酶的表达。此外或可选地,在某些实施方案,编码所述酶的一种或多种异源性核酸可与编码麦芽糖依赖性降解决定子的核酸框内融合。在所述这些实施方案中,在所述培养基中存在足够量的麦芽糖将增加所述生物合成途径的一种或多种酶的表达,和所述融合酶在麦芽糖存在下被稳定。以此种方式,可将麦芽糖响应型启动子和麦芽糖依赖性降解决定子连接起来作为非分解代谢化合物生成的正调控因子。

6.3麦芽糖响应型启动子

另一方面,本发明提供了用于本发明所述组合物和方法中的麦芽糖响应型启动子,以促进可操作连接的dna编码序列在麦芽糖存在下的转录。在一些实施方案,衍生自各种生物体的麦芽糖发酵系统的调控网络的未修饰的麦芽糖响应型启动子(例如,pmal启动子)可用于控制可操作连接的dna编码序列的转录。在其他实施方案,合成的麦芽糖响应型启动子可用于控制可操作连接的dna编码序列的转录。如下文详细描述的,本发明提供的合成麦芽糖响应型启动子提供某些优点,因为与未修饰的麦芽糖响应型启动子相比,它们可减少在未诱导条件下(例如,在不存在麦芽糖情况下)的基因表达的“渗漏”。

6.3.1.pmal启动子

在一些实施方案,可用于本发明提供的方法和组合物的麦芽糖响应型启动子促进可操作连接的dna编码序列在麦芽糖存在下的转录。在一些实施方案,本领域已知的任何麦芽糖响应型启动子可用于调控能够生成非分解代谢化合物的酶的表达。在一些实施方案,所述麦芽糖响应型启动子选自由pmal1(seqidno:12),pmal2(seqidno:13),pmal11(seqidno:14),pmal12(seqidno:15),pmal31(seqidno:16)和pmal32(seqidno:17)组成的组。在一些实施方案,pmal启动子包括与未修饰的pmal启动子相比启动子活性增加或降低的这些启动子的修饰形式。示例性修饰的pmal启动子包括pmal32_v1(seqidno:78)。

可用于本发明提供的方法和组合物的其他有用的麦芽糖响应型启动子可以衍生自酿酒酵母的麦芽糖发酵系统的调控网络。酿酒酵母种类中的麦芽糖发酵需要存在五个未连接的mal基因座中的至少一个:mal1、mal2、mal3、mal4和mal6。这些基因座中的每一个均由参与麦芽糖代谢的基因复合物组成;所述复合物包括麦芽糖渗透酶(malx1,其中x代表所述五个基因座之一),负责细胞内水解所述糖的麦芽糖酶(malx2)和在麦芽糖的存在下诱导两个先前基因转录的正调控蛋白(malx3)。参见如cheng&michels,j.bacteriol.173:1817-1820(1991);dubinetal.,j.bacteriol.164:605-610(1985);changetal.,curr.genet.14:201-209(1988);higginsetal.,appl.environ.microbiol.65:680-685(1999)。在mal6基因座处,激活因子由mal63基因进行编码。mal63p是麦芽糖依赖性诱导编码麦芽糖渗透酶和麦芽糖酶的所述mal结构基因所需的dna结合转录激活因子。

mal激活因子中间体复合物在不存在诱导物麦芽糖的情况下是稳定的,但添加麦芽糖将导致可诱导的mal激活因子从活性形式的复合物释放,所述活性形式能够进行dna结合和转录激活。参见如ran,f.andmichels.,c.a.,j.biol.chem.285(18):13850-13862(2010)。已经将在不同转录的mal61-62启动子中的mal63蛋白的结合位点表征为mal基因的上游激活序列。参见如ni,b.andneedleman,r.,“identificationoftheupstreamactivatingsequenceofmalandthebindingsitesforthemal63activatorofsaccharomycescerevisiae,”molecularandcellularbiology10(7):3797-3800(1990),其内容通过引用其全文并入本文。

在mal1基因座、mal2基因座、mal3基因座和mal4基因座处,所述激活因子分别由mal13基因、mal23基因、mal33基因和mal43基因进行编码。vidgrenetal.,appl.environ.microbiol.71(12):7864-7857(2005)。mal13p、mal23p、mal33p和mal43p是由麦芽糖依赖性诱导所述mal结构基因所需的那些基因进行编码的dna结合转录激活因子。

可用于本发明提供的方法和组合物中的其他麦芽糖响应型启动子可衍生自大肠杆菌的麦芽糖/麦芽糖糊精代谢系统的调控网络。所述malt核酸编码malt,四个麦芽糖响应型启动子(ppq、pefg、pkbm和ps)的正调控因子。malt和mal启动子的组合产生了严格调控的表达系统,其已被证明可作为由添加的麦芽糖诱导的强启动子。参见例如schleif,“twopositivelyregulatedsystems,araandmal,”pp.1300-1309inescherichiacoliandsalmonellacellularandmolecularbiology,secondedition,neidhardtetal.,eds.,asmpress,washington,d.c.,1996;和boos,w.andshuman,h.,“maltose/maltodextrinsystemofescherichiacoli:transport,metabolismandregulation,”microbiologyandmolecularbiologyreviews,62(1):204-229(1998)),其内容通过引用其全文并入本文。

可用于本发明提供的方法和组合物中的其他麦芽糖响应型启动子包括berkneretal.,“inducibleandconstitutivepromotersforgeneticsystemsinsulfolobusacidocaldarious,”extremophiles14:249-259(2010);和美国专利号5,824,545中的那些。

6.3.2.合成麦芽糖响应型启动子

在一些实施方案,有用的麦芽糖响应型启动子包括合成的麦芽糖响应型启动子。在一些实施方案,与天然的、未修饰的麦芽糖响应型启动子(例如,pmal32)可操作地连接的基因即使在不存在麦芽糖的情况下也可低水平表达基因产物。此外,当在不存在麦芽糖情况下促进低细胞生长速率的条件下培养细胞时,可以正调控与天然麦芽糖响应型启动子可操作连接的基因的表达。参见实施例7.14和图.14a和14b。

因此,本发明提供了合成麦芽糖响应型启动子,其与天然未修饰的麦芽糖响应型启动子相比,可在不存在麦芽糖或存在足够低的量的麦芽糖的情况下减少基因产物的渗漏表达。在一些实施方案,使用半乳糖诱导型pgal启动子通过去除至少一个或全部gal4p结合位点以及插入mal操纵子激活因子(即mal转录激活因子)的一个或多个结合位点来构建合成麦芽糖响应型启动子。譬如,所有4个gal4p结合位点可从pgal1启动子去除,并且mal操纵子激活因子的结合位点的各种拷贝数(例如,如图.13所示的malx3p的结合位点,其包括例如mal13p、mal23p、mal33p、mal43p、和mal63p)可插入到修饰的pgal1启动子中。在一些实施方案,可将mal转录激活因子的单个结合位点插入修饰的pgal启动子中。在一些实施方案,可将mal转录激活因子的2、3、4、5、6、7、8、9、10个或更多个结合位点插入修饰的pgal启动子中。所述这些具有被去除了gal4p结合位点以及插入的mal转录激活因子的结合位点的修饰的pgal启动子在本发明中被称为pgmal启动子。

在一些实施方案,可使用pgal1_gal10启动子(seqidno:82)作为背景启动子来生成pgmal启动子。在一些实施方案,pgal1启动子衍生自不同的gal1_gal10启动子(johnston&davis,mol.cellbiol.4(8):1440-1448(1984))。所述pgal1_gal10启动子包括4个gal4p结合位点(位于seqidno:82的位置216至232,位置235至251,位置253至269以及位置317和333)。所有这些gal4p结合位点可从pgal1_gal10启动子去除,并且可加入一个或多个mal转录激活因子结合位点以生成另外的合成麦芽糖响应型启动子。所述这些源自pgal1_gal10启动子的合成启动子包括,譬如,pgmal_v5(seqidno:35),pgmal_v6(seqidno:36),pgmal_v7(seqidno:37),pgmal_v9(seqidno:38),pgmal_v10(seqidno:39),pgmal_v11(seqidno:40),pgmal_v12(seqidno:41),pgmal_v13(seqidno:42),pgmal_v14(seqidno:43),pgmal_v15(seqidno:44),pgmal_v16(seqidno:45),pgmal_v17(seqidno:46),和pgmal_v18(seqidno:47)。

在一些实施方案,pgal2启动子(seqidno:83)可用作背景启动子以生成pgmal启动子。pgal2启动子包括四个gal4p结合位点和两个重叠的gal4p结合位点(位于seqidno:83的位置230至246,位置344至360,位置363至379,位置427至443和位置432至448)。至少一个或所有这些gal4p结合位点可从pgal2启动子去除,并可加入一个或多个mal转录激活因子结合位点以生成另外的合成麦芽糖响应型启动子。所述这些源自pgal2启动子的合成启动子包括,譬如,pg2mal_v1(seqidno:48),pg2mal_v2(seqidno:49),pg2mal_v3(seqidno:50),pg2mal_v5(seqidno:51),pg2mal_v6(seqidno:52),pg2mal_v7(seqidno:53),pg2mal_v8(seqidno:54),pg2mal_v9(seqidno:55),和pg2mal_v10(seqidno:56)。

在一些实施方案,可使用pgal7启动子(seqidno:79)作为背景启动子来生成pgmal启动子。所述pgal7启动子包括两个gal4p结合位点(位于seqidno:79的位置471至487和位置558至574)。至少一个或所有这些gal4p结合位点可从pgal7启动子去除,并可加入一个或多个mal转录激活因子结合位点以生成另外的合成麦芽糖响应型启动子。所述这些源自pgal7启动子的合成启动子包括,例如,pg7mal_v2(seqidno:57),pg7mal_v4(seqidno:58),pg7mal_v6(seqidno:59),pg7mal_v8(seqidno:60),和pg7mal_v9(seqidno:61)。

在一些实施方案,杂合启动子可通过组合来自pgal1、pgal2和pgal7中的两个或更多个的序列来构建。从所述杂合启动子,可去除至少一个或全部gal4p结合位点,并可添加一个或多个mal转录激活因子结合位点以生成另外的合成麦芽糖响应型启动子。所述这些源自杂合启动子的合成启动子包括,例如,pg172_mal_v13(seqidno:62),pg271_mal_v12(seqidno:63),pg721_mal_v11(seqidno:64),和pg712_mal_v14(seqidno:65)。

在一些实施方案,pgcy1、pgal80或其他pgal启动子可用作背景启动子以生成pgmal启动子。所述这些启动子序列和所述gal4p结合位点是众所周知的。参见例如酵母属基因组数据库(http://www.yeastgenome.org/)。gal4p结合位点的核苷酸序列也是众所周知的,其可被去除并可被mal转录激活因子结合位点置换。

在一些实施方案,合成启动子可包含本发明公开的pgmal启动子序列的一部分,所述部分保留启动子功能,而非与seqid号相关的整个序列。在一些实施方案,公开的启动子序列中间或末端的一些核苷酸碱基可能不是其启动子功能所必需的。因此,在某些实施方案,合成麦芽糖响应型启动子通常可以包括至少约200、250、300、350、400、450、475、500、525、550、575、600、625、650、575、600、625、650个核苷酸或更多的本发明所述的特定序列,其保留启动子功能。譬如,所述这些序列的部分可包括转录激活因子和其他转录调控因子结合位点以保留启动子功能。在一些实施方案,本发明公开的合成麦芽糖响应型启动子序列可通过例如添加或去除mal转录激活因子的结合位点数来进一步修饰。在其他实施方案,本发明公开的合成麦芽糖响应型启动子序列可进一步包含另外的序列,如启动子序列的n'端和/或c'端的连接体序列。譬如,可将24或36个核苷酸的连接体序列添加至本发明提供的pgmal序列中以在所述启动子序列和所述编码序列之间提供足够空间。

在一些实施方案,合成启动子或天然来源的启动子无需具有本发明公开的确切序列从而保持其在遗传修饰的宿主细胞中的启动子功能。尽管许多启动子序列是高度保守的,但即使对于相同启动子,其在菌株或物种中也存在序列差异。因此,在一些实施方案,本发明提供了与本发明公开的启动子序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%序列同一性的合成或天然来源的启动子。

此外,如图.14a和14b所示,所述这些pgmal启动子中的每一个具有不同的启动子强度和特性。譬如,当采用麦芽糖诱导时,pgmal_v15的强度与天然启动子pmal32相当。在另一实施例,pgmal_v12是比pgmal_v15更强的启动子,其强度与启动子ptdh3相当。根据基因表达所需的启动子强度,可为本发明提供的组合物和方法选择任何合适的pgmal启动子。

在一些实施方案,除了pgal启动子之外的启动子可用作背景启动子以生成合成麦芽糖响应型启动子。背景启动子的选择可取决于宿主细胞的选择、所需的表达水平等。因此,在一些实施方案,对于任何选定的背景启动子,其内源性转录激活因子结合位点可被去除,并可插入mal转录激活因子的结合位点。譬如,可将来自双向启动子pmal12的mal转录激活因子结合位点序列并入背景启动子(除去天然转录激活因子结合位点)以生成合成麦芽糖响应型启动子。来自pmal12的四个mal转录激活因子结合位点的示例性序列包括以下11或12个碱基对的核苷酸序列及其反向互补序列:

pmal12_1:gataatatttc(seqidno:97);

pmal12_2:gaaaatttcgc(seqidno:98);

pmal12_3:gttaaagtttac(seqidno:99);

pmal12_4:gaaattttcgc(seqidno:100);

pmal12_1r:gaaatattatc(seqidno:101);

pmal12_2r:gcgaaattttc(seqidno:102);

pmal12_3r:gtaaactttaac(seqidno:103);和

pmal12_4r:gcgaaaatttc(seqidno:104)。

在一些实施方案,可将来自双向启动子pmal32的mal转录激活因子结合位点序列并入背景启动子(除去天然转录激活因子结合位点)以生成合成麦芽糖响应型启动子。来自pmal32的mal转录激活因子结合位点的示例性序列包括以下11或12个碱基对的核苷酸序列及其反向互补序列:

pmal32_1:tataatatttc(seqidno:105);

pmal32_2:gaaaatttcgc(与pmal12_2相同;seqidno:98);

pmal32_3:gtttaagtttac(seqidno:106);

pmal32_4:gaagttttcgc(seqidno:107);

pmal32_1r:gaaatattata(seqidno:108);

pmal32_2r:gcgaaattttc(与pmal12_2r中的第二个相同;seqidno:102);

pmal32_3r:gtaaacttaaac(seqidno:109);和

pmal32_4r:gcgaaaacttc(seqidno:110)。

代表mal转录激活因子结合位点的这些短的11或12个碱基对片段彼此具有至少约45%、50%、55%、60%、65%、70%、75%、80%、85%、或90%的序列同一性。此外,如图.13b所示,代表mal转录激活因子结合位点的这些短的11或12个碱基对片段包含以下序列基序之一:daaddttth、dwaddttth、daaddttwh、或dwaddttwh。

序列基序的符号具有以下含义:

a=核苷酸腺嘌呤;

t=核苷酸胸腺嘧啶;

w=核苷酸a(腺嘌呤)或t(胸腺嘧啶);

d=核苷酸g(鸟嘌呤)或a(腺嘌呤)或t(胸腺嘧啶);和

h=核苷酸a(腺嘌呤)或c(胞嘧啶)或t(胸腺嘧啶)。

因此,在一些实施方案,合成麦芽糖响应型启动子包含选自由daaddttth、dwaddttth、daaddttwh、dwaddttwh和其组合组成的组的序列基序。在一些实施方案,将所述这些序列基序的任何一个或组合并入具有去除其天然转录激活因子结合位点的背景启动子中。

在一些实施方案,合成麦芽糖响应型启动子包含核心启动子和一个或多个mal转录激活因子结合位点。如本发明所使用的,所述核心启动子是指适当启动与其可操作连接的选定dna序列的转录所需启动子的最小部分。术语“核心启动子”是指提供基础转录的启动子元件。其任选地包含tata盒或tata样盒并与rna聚合酶复合。在一些实施方案,合成麦芽糖响应型启动子包含本发明所述的mal转录激活因子结合位点的一个或多个拷贝。在一些实施方案,mal转录激活因子结合位点包含选自由daaddttth、dwaddttth、daaddttwh、dwaddttwh和其组合组成的组的序列基序。

在一些实施方案,在未诱导条件下(例如,在不含麦芽糖的培养基中培养的宿主细胞),合成麦芽糖响应型启动子的启动子活性小于天然麦芽糖响应型启动子的启动子活性,所述一种或多种mal转录激活因子结合位点(例如,pmal31、pmal11、pmal12等)衍生自所述天然麦芽糖响应型启动子。譬如,当包含与合成麦芽糖响应型启动子可操作地连接的报告基因(例如gfp)的宿主细胞在不含麦芽糖的培养基中培养时,在未诱导状态下,在所述合成麦芽糖响应型启动子下的报告基因表达是至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、300%或更多地少于可操作地连接至衍生出一个或多个mal转录激活因子结合位点的天然麦芽糖响应型启动子的报告基因表达。

本发明所述的mal转录激活因子结合位点序列仅是示例性的,来自其他麦芽糖响应型启动子的mal转录激活因子结合位点可被插入到合成麦芽糖响应型启动子中。在一些实施方案,合成启动子可包含插入其中的mal转录激活因子结合位点中的一个或任何组合。在一些实施方案,可将mal转录激活因子的1、2、3、4、5、6、7、8、9、10个或更多个结合位点插入合成启动子中。通常,合成启动子中mal转录激活因子结合位点的拷贝数越高,则越可增加启动子强度。

6.3.3.麦芽糖响应型启动子在异源性核酸表达和非分解代谢产物生成中的应用

在一些实施方案,虽然本发明所述的麦芽糖响应型启动子可与上述6.2.6节中所述的麦芽糖依赖性降解决定子一同使用,但麦芽糖响应型启动子可在没有麦芽糖依赖性降解决定子的情况下使用,以在麦芽糖存在下促进任何可操作连接的基因的转录。譬如,在细胞生物量构建阶段已知促进细胞生长的任何基因可以可操作地连接至合成麦芽糖响应型启动子,使得在此阶段的培养基中的麦芽糖可激活这些基因的转录。在生成阶段期间,可从培养基中除去麦芽糖,从而与合成麦芽糖响应型启动子可操作地连接的这些细胞生长促进基因的表达可被负调控以将细胞的资源转向生成所需产物。根据所需基因产物的水平,可在本发明提供的组合物和方法中选择具有合适启动子强度的合适麦芽糖响应型启动子。

因此,本发明提供了编码目的基因的异源性核酸,所述目的基因可操作地连接至保留启动子功能的麦芽糖响应型启动子或其部分。在一些实施方案,麦芽糖响应型启动子是合成麦芽糖响应型启动子,其由背景启动子(其对麦芽糖不响应)生成,且其天然转录激活因子结合位点被mal转录激活因子结合位点置换。在一些实施方案,合成麦芽糖响应型启动子是pgmal启动子。在一些实施方案,可操作地连接至合成麦芽糖响应型启动子的目的基因可包括转录调控因子。譬如,转录调控因子可包括gal80p或gal4p。在某些实施方案,与麦芽糖响应型启动子可操作地连接的目的基因可包括在发酵过程的生物量构建阶段期间有助于细胞生长速率的基因。在一些实施方案,与麦芽糖响应型启动子可操作连接的目的基因包括编码途径酶的基因。本发明提供的合成麦芽糖响应型启动子的应用不限于发酵环境,还可用作诱导型启动子来调控任何基因表达。

在一些实施方案,在制备异源性非分解代谢化合物的方法中,可在发酵环境中使用麦芽糖响应型启动子。本发明提供的方法利用经遗传修饰的宿主细胞,所述遗传修饰的宿主细胞包含编码用于制备异源性非分解代谢化合物的酶途径的一种或多种酶的异源性核酸。在一些实施方案,所述一种或多种酶的表达受到本发明所述麦芽糖响应型启动子的直接控制。即编码酶途径的所述一种或多种酶的所述一种或多种异源性核酸序列各自可操作地连接至(即位于3')麦芽糖响应型启动子,和所述麦芽糖响应型启动子驱动所述一种或多种异源性核酸中的每一种在麦芽糖存在下的表达。

在其他实施方案,酶途径的所述一种或多种酶的表达是由麦芽糖响应型启动子间接调控。譬如,可通过将麦芽糖响应型启动子与单个异源性转录调控因子可操作地连接来实现对所述途径的一种或多种酶的间接调控,所述单个异源性转录调控因子的表达转而直接调控所述一种或多种途径酶(例如全部酶成员)的表达。以上详细描述的酵母中的gal调节子提供了可与本发明所述的麦芽糖响应型启动子组合使用的激活因子、抑制因子和启动子的示例性调控网络。

在一些实施方案,一个或多个gal4激活的启动子,例如pgal1、pgal7、pgal10、pgcy1和/或pgal80,可操作地连接至并用于驱动制备异源性非分解代谢化合物的酶途径的所述一种或多种酶的表达。在一些实施方案,所述宿主细胞进一步包含编码gal4的核酸。在一些实施方案,gal4基因产物是组成型表达的,即处于组成型启动子的控制之下。在一些实施方案,所述宿主细胞在本发明所述的麦芽糖响应型启动子的控制下进一步包含编码gal80的核酸,并在麦芽糖存在下诱导gal80基因产物的表达。gal80p转而与gal4p相互作用并阻止gal4p转录活性。当麦芽糖被去除或被充分耗尽使得gal80表达不再被诱导时,则解除了gal80p对gal4p的抑制,并且自由地激活用于制备异源性非分解代谢化合物的酶途径的所述一种或多种酶的表达。

在上述实施方案中,如果需要,还可将一种或多种生长促进基因置于麦芽糖响应型启动子的控制下,以进一步利用麦芽糖开关将细胞生长期与异源性非分解代谢化合物的生成期分开。在一些实施方案,促进异源性非分解代谢化合物生成的一种或多种基因可与gal4激活的启动子可操作地连接,使得它们可与用于制备异源性非分解代谢化合物的酶途径的一种或多种酶一同进行表达。

在其他实施方案,所述天然pgal4启动子被包含麦芽糖响应型启动子的异源性核酸置换。在一些实施方案,所述宿主细胞包含异源性核酸,所述异源性核酸包含编码gal4p的核酸,所述gal4p可操作地连接至包含麦芽糖响应型启动子的异源性核酸。在其中一个实施方案,麦芽糖响应型启动子与gal4p的编码序列可操作地连接,和用于制备异源性非分解代谢化合物的酶途径的所述一种或多种酶(例如,全部酶成员)的编码序列可操作地连接至gal4响应型启动子,使得在麦芽糖存在下诱导所述一种或多种酶的表达。在一些实施方案,所述gal4响应型启动子是pgal1。在一些实施方案,所述gal4响应型启动子是pgal7。在一些实施方案,所述gal4响应型启动子是pgal10。在一些实施方案,所述gal4响应型启动子是pgcy1。在一些实施方案,所述gal4响应型启动子是pgal80。

在第6.5节中以及在美国专利公开号2015-0299713以及wo2015/020649中描述了使用麦芽糖响应型启动子生成非分解代谢化合物的方法的详细描述,其通过引用其全文并入本文用于所有目的。在本发明所述的组合物和方法中,可使用任何合适的麦芽糖响应型启动子(合成或天然启动子)来表达任何目的基因和/或用于生成非分解代谢化合物。

6.4抑制和非抑制的麦芽糖量

麦芽糖是由2个葡萄糖分子形成的二糖,如下所示。其具有化学式c12h22o11,分子量为343g/mol。

在一些实施方案,除了或替代麦芽糖(以上所示的及其异构体)之外,在本发明方法中与麦芽糖起类似作用的其他底物可用于稳定麦芽糖依赖性降解决定子和/或用于诱导麦芽糖响应型性启动子。譬如,特异性结合mbp、mbp突变体和麦芽糖依赖性降解决定子且适合作为其配体的底物可选自由麦芽糖、麦芽糖糊精、大分子α(1→4)连接的葡聚糖(例如,麦芽三糖)或其组合组成的组。在一些实施方案,所述这些底物的合适类似物或衍生物(即麦芽糖、麦芽糖糊精和大分子α(1→4)连接的葡聚糖)也可用于稳定麦芽糖依赖性降解决定子(或用于诱导麦芽糖响应型启动子)。在本发明中,术语“类似物”或“衍生物”可交换使用,是指在结构上和功能上与另一种物质相关的化学物质,在此种情况下,维持特异性结合麦芽糖结合蛋白和麦芽糖依赖性降解决定子的能力,以稳定麦芽糖依赖性降解决定子,和/或诱导麦芽糖响应型启动子。在一些实施方案,不像麦芽糖,它们不被宿主细胞代谢。麦芽糖类似物和衍生物的实例包括麦芽糖衍生物类,如甲基-α-麦芽糖苷和5-硫代麦芽糖。麦芽糖类似物和衍生物的其他实例包括麦芽七糖(β-环糊精)、麦芽糖醇、麦芽六糖、麦芽四糖醇、麦芽六糖醇、麦芽六糖酸、麦芽四糖等。与mbp、mbp突变体和麦芽糖依赖性降解决定子特异性结合,且稳定麦芽糖依赖性降解决定子和/或诱导麦芽糖响应型启动子的所述这些和其他底物统称为“麦芽糖基诱导物”。

在某些实施方案,尽管在整个本发明中麦芽糖被描述为mbp突变体以及麦芽糖依赖性降解决定子的配体,并描述为麦芽糖响应型启动子的诱导物,但可使用任何合适的麦芽糖基诱导物(例如,麦芽糖、麦芽糖糊精和大分子α(1→4)连接的葡聚糖的类似物或衍生物)代替麦芽糖。因此,与本发明所述的麦芽糖相关的任何公开也适用于其他麦芽糖基诱导物。同理,任何有关抑制和非抑制的麦芽糖量的讨论均适用于其他麦芽糖基诱导物。

在一些实施方案,麦芽糖的“诱导”量是足以诱导与麦芽糖响应型启动子可操作连接的编码序列的所需高表达水平和/或保留麦芽糖依赖性降解决定子和/或融合蛋白的稳定性的麦芽糖量。在一些实施方案,“诱导”量的麦芽糖是使麦芽糖依赖性降解决定子与麦芽糖“接触”或使麦芽糖依赖性降解决定子(或其融合蛋白)稳定的足够量的麦芽糖。在一些实施方案,麦芽糖的“诱导”量是麦芽糖的量,所述量与不含麦芽糖时的启动子活性相比激活了麦芽糖响应型启动子或提高了麦芽糖响应型启动子的活性。在一些实施方案,与在培养基中存在“诱导”量的麦芽糖相比,麦芽糖的“非诱导”量是低于使与麦芽糖响应型启动子可操作地连接的编码序列的表达不被诱导或降低的麦芽糖量的量。在一些实施方案,与在培养基中存在“诱导”量的麦芽糖时相比,麦芽糖的“非诱导”量是降低麦芽糖响应型启动子活性和/或降低麦芽糖依赖性降解决定子(及其融合蛋白)稳定性的麦芽糖的量。

用于本发明提供的方法中的麦芽糖的“诱导”量和“非诱导”量可针对能够生成如上所述的异源性非分解代谢化合物的任何遗传修饰的宿主细胞来确定。在一些实施方案,麦芽糖的非诱导量是通过在用于发酵过程的培养基中麦芽糖的量不断增加的情况下作基因表达曲线,即麦芽糖滴定来确定。譬如,遗传修饰的宿主细胞群可分成多个亚群并且平行培养,其中每个亚群在包含不同的,例如增加量的麦芽糖(包括不含麦芽糖)的培养基中生长,并且在限定的时间段之后分析报告基因表达或非分解代谢化合物生成量。

在一些实施方案,其中在麦芽糖存在下,麦芽糖响应型启动子(和/或麦芽糖依赖性降解决定子)被连接以实现非分解代谢化合物生成的“关闭”状态,麦芽糖滴定包含至少两种浓度的麦芽糖,由此使宿主细胞生成的非分解代谢化合物的量最低限度地稳定,即,在麦芽糖浓度增加的情况下,不会观察到化合物生成量的进一步降低。在一些实施方案,麦芽糖的“抑制”量至少是麦芽糖的最低量,在所述最低量时,由宿主细胞生成的非分解代谢化合物的量处在其最低水平(例如,大约为零)。所述量还可被称为用于抑制特定宿主细胞的非分解代谢化合物生成的麦芽糖的“饱和”或“最佳”量。在一些此类实施方案,即使在化合物生成量处于低水平的情况下,“抑制”量的麦芽糖可包括非分解代谢化合物生成量相对于“开启”状态已经降低的任何浓度的麦芽糖。在一些实施方案,在所述开关的此种配置中,麦芽糖的“非抑制”量是低于麦芽糖“抑制”量的任何麦芽糖量。在一些实施方案,麦芽糖的非抑制量为至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100倍或大于约100倍地小于麦芽糖的抑制量。在具体实施方案中,麦芽糖的非抑制量小于培养基的约0.8%(w/v)。在另一具体实施方案中,麦芽糖的非抑制量为培养基的约0%(w/v)。

在具体实施方案中,如上所述,对于给定的宿主细胞,麦芽糖的抑制量是最佳量或饱和量,并且非抑制量是不含麦芽糖。在另一具体实施方案中,麦芽糖的抑制量为至少约0.25%,非抑制量是不含麦芽糖。在另一具体实施方案中,麦芽糖的抑制量为约0.25%至3%的麦芽糖量,非抑制量是不含麦芽糖。在另一具体实施方案中,麦芽糖的抑制量为约0.5%至1%的麦芽糖量,非抑制量是不含麦芽糖。在另一具体实施方案中,麦芽糖的抑制量为至少约3%的麦芽糖量,限量是不含麦芽糖。

在一些实施方案,其中在麦芽糖存在下,麦芽糖响应型启动子(和/或麦芽糖依赖性降解决定子)被连接以实现非分解代谢化合物生成的“关闭”状态,培养基中麦芽糖的抑制量为至少约0.1%(每体积培养基的麦芽糖重量)。在一些实施方案,培养基中麦芽糖的抑制量为至少约0.25%。在一些实施方案,培养基中麦芽糖的抑制量为至少约0.5%。在一些实施方案,培养基中麦芽糖的抑制量为至少约0.75%。在一些实施方案,培养基中麦芽糖的抑制量为至少约1.0%。在一些实施方案,培养基中麦芽糖的抑制量为至少约1.25%。在一些实施方案,培养基中麦芽糖的抑制量为至少约1.5%。在一些实施方案,培养基中麦芽糖的抑制量为至少约1.75%。在一些实施方案,培养基中麦芽糖的抑制量为至少约2.0%。在一些实施方案,培养基中麦芽糖的抑制量为至少约2.25%。在一些实施方案,培养基中麦芽糖的抑制量为至少约2.5%。在一些实施方案,培养基中麦芽糖的抑制量为至少约2.75%。在一些实施方案,培养基中麦芽糖的抑制量为至少约3.0%。在一些实施方案,培养基中麦芽糖的抑制量为至少约3.25%。在一些实施方案,培养基中麦芽糖的抑制量为至少约3.5%。在一些实施方案,培养基中麦芽糖的抑制量为至少约3.75%。在一些实施方案,培养基中麦芽糖的抑制量为至少约4.0%。在一些实施方案,培养基中麦芽糖的抑制量为至少约4.25%。在一些实施方案,培养基中麦芽糖的抑制量为至少约4.5%。在一些实施方案,培养基中麦芽糖的抑制量为至少约4.75%。在一些实施方案,培养基中麦芽糖的抑制量为至少约5.0%。在一些实施方案,培养基中麦芽糖的抑制量是在约5%和50%之间。在一些实施方案,培养基中麦芽糖的抑制量为约5%、10%、15%、20%、25%、30%、35%、40%、45%或约50%。

在一些实施方案,麦芽糖的非抑制量是比根据上述方法测定的麦芽糖的抑制量低至少约2倍、10倍、100倍、1000倍、10,000倍或约100,000倍的量。在一些实施方案,麦芽糖的非抑制量是比根据上述方法测定的麦芽糖的饱和量低至少约2倍、10倍、100倍、1000倍、10,000倍或100,000倍的量。在一些实施方案,麦芽糖的非抑制量是小于约50%,小于约20%,小于约10%,小于约1%,小于约0.5%,小于约0.2%,小于约0.1%,小于约0.01%或小于约0.001%的根据上述方法测定的麦芽糖抑制量的量。在一些实施方案,麦芽糖的非抑制量是小于约50%,小于约20%,小于约10%,小于约1%,小于约0.1%,小于约0.01%或小于约0.001%的根据上述方法测定的麦芽糖饱和量的量。在具体实施方案中,麦芽糖的非抑制量为约0mg/l(0%),即不含麦芽糖。因此,在此具体实施方案中,宿主细胞在生成阶段期间在不包含麦芽糖的外部来源的细胞培养基中生长。

在一些实施方案,其中在麦芽糖存在下,麦芽糖响应型启动子(和/或麦芽糖依赖性降解决定子)被连接以实现非分解代谢化合物生成的“开启”状态,所述麦芽糖滴定包含至少两种浓度的麦芽糖,由此使宿主细胞的非分解代谢化合物生成最大限度地稳定,即,在麦芽糖浓度增加的情况下不会观察到化合物生成量的进一步增加。在一些实施方案,麦芽糖的“非抑制”量至少是麦芽糖的最低量,在所述最低量时,由宿主细胞生成的非分解代谢化合物的量处于其最高水平。在所述开关的此种配置中,所述量还可被称为用于诱导特定宿主细胞的非分解代谢化合物生成的麦芽糖的“饱和”量或“最佳”量。在一些此类实施方案中,即使在化合物生成量处于次优水平的情况下,“诱导”量或“非抑制”量的麦芽糖可包括非分解代谢化合物生成量相对于“关闭”状态已经升高的任何浓度的麦芽糖量。在一些实施方案,在所述开关的此种配置中,麦芽糖的“非诱导”量或“抑制”量是低于麦芽糖的“诱导”或“非抑制”量的任何麦芽糖量。在一些实施方案,麦芽糖的非诱导量或抑制量为至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100倍或大于约100倍地小于麦芽糖的诱导量或非抑制量。在具体实施方案中,麦芽糖的非诱导量小于培养基的约0.8%(w/v)。在另一具体实施方案中,麦芽糖的非诱导量为培养基的约0%(w/v)。

在具体实施方案中,如上所述,对于给定的宿主细胞,麦芽糖的诱导量是最佳量或饱和量,和非诱导量是不含麦芽糖。在另一具体实施方案中,麦芽糖的诱导量为至少约0.25%,非诱导量是不含麦芽糖。在另一具体实施方案中,麦芽糖的诱导量为约0.25%至3%的麦芽糖量,非诱导量是不含麦芽糖。在另一具体实施方案中,麦芽糖的诱导量为约0.5%至1%的麦芽糖量,非诱导量是不含麦芽糖。在另一具体实施方案中,麦芽糖的诱导量为至少约3%的麦芽糖量,限量是不含麦芽糖。

在一些实施方案,其中在麦芽糖存在下,麦芽糖响应型启动子(和/或麦芽糖依赖性降解决定子)被连接以实现非分解代谢化合物生成的“开启”状态,培养基中麦芽糖的诱导量为至少约0.1%(每体积培养基的麦芽糖重量)。在一些实施方案,培养基中麦芽糖的诱导量为至少约0.25%。在一些实施方案,培养基中麦芽糖的诱导量为至少约0.5%。在一些实施方案,培养基中麦芽糖的诱导量为至少约0.75%。在一些实施方案,培养基中麦芽糖的诱导量为至少约1.0%。在一些实施方案,培养基中麦芽糖的诱导量为至少约1.25%。在一些实施方案,培养基中麦芽糖的诱导量为至少约1.5%。在一些实施方案,培养基中麦芽糖的诱导量为至少约1.75%。在一些实施方案,培养基中麦芽糖的诱导量为至少约2.0%。在一些实施方案,培养基中麦芽糖的诱导量为至少约2.25%。在一些实施方案,培养基中麦芽糖的诱导量为至少约2.5%。在一些实施方案,培养基中麦芽糖的诱导量为至少约2.75%。在一些实施方案,培养基中麦芽糖的诱导量为至少约3.0%。在一些实施方案,培养基中麦芽糖的诱导量为至少约3.25%。在一些实施方案,培养基中麦芽糖的诱导量为至少约3.5%。在一些实施方案,培养基中麦芽糖的诱导量为至少约3.75%。在一些实施方案,培养基中麦芽糖的诱导量为至少约4.0%。在一些实施方案,培养基中麦芽糖的诱导量为至少约4.25%。在一些实施方案,培养基中麦芽糖的诱导量为至少约4.5%。在一些实施方案,培养基中麦芽糖的诱导量为至少约4.75%。在一些实施方案,培养基中麦芽糖的诱导量为至少约5.0%。在一些实施方案,培养基中麦芽糖的诱导量是在约5%和50%之间。在一些实施方案,培养基中麦芽糖的诱导量为约5%、10%、15%、20%、25%、30%、35%、40%、45%或约50%。

在一些实施方案,其中在麦芽糖存在下,麦芽糖响应型启动子(和/或麦芽糖依赖性降解决定子)被连接以实现非分解代谢化合物生成的“开启”状态,麦芽糖的抑制量是比根据上述方法测定的麦芽糖的非抑制量低至少约2倍、10倍、100倍、1000倍、10,000倍或约100,000倍的量。在一些实施方案,麦芽糖的抑制量是比根据上述方法测定的麦芽糖的饱和量低至少约2倍、10倍、100倍、1000倍、10,000倍或约100,000倍的量。在一些实施方案,麦芽糖的抑制量是小于约50%,小于约20%,小于约10%,小于约1%,小于约0.5%,小于约0.2%,小于约0.1%,小于约0.01%,或小于约0.001%的根据上述方法测定的麦芽糖非抑制量的量。在一些实施方案,麦芽糖的抑制量是小于约50%,小于约20%,小于约10%,小于约1%,小于约0.1%,小于约0.01%,或小于约0.001%的根据上述方法测定的麦芽糖饱和量的量。在具体实施方案中,麦芽糖的抑制量为约0mg/l(0%),即不含麦芽糖。因此,在此具体实施方案中,宿主细胞在构建阶段期间在不包含麦芽糖的外部来源的细胞培养基中生长。

虽然在生成非分解代谢化合物的方法的背景下主要讨论了麦芽糖的“诱导”量、“非诱导”量、“抑制”量和“非抑制”量,但所述这些术语及其含义适用于本发明提供的任何组合物和方法。譬如,“诱导”量的麦芽糖包括足够量的麦芽糖以诱导融合蛋白的稳定性,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的目的蛋白。在另一实施例,“非诱导”量的麦芽糖包括足够低的量的麦芽糖或不含麦芽糖,使融合蛋白不稳定。

6.5使用麦芽糖依赖性降解决定子和/或麦芽糖响应型启动子生成非分解代谢化合物

在本发明提供的发酵方法的一些实施方案中,利用麦芽糖响应型启动子和/或麦芽糖依赖性降解决定子结合操纵麦芽糖条件,在构建阶段(上述方法的步骤(a))期间非分解代谢化合物的生成量少于遗传修饰的宿主生成的最大非分解代谢化合物的量的约50、40、30、20或10%,例如,当在生成阶段(上述方法的步骤(b))培养宿主细胞时,生成非分解代谢化合物的量的约50、40、30、20或10%。

发酵过程的构建阶段和生成阶段的时间可以变化,并且取决于诸如宿主细胞的生长速率、宿主细胞的固有生长速率等因素;和其他培养条件如ph值、温度,取决于宿主细胞的特定要求、发酵、和过程。然而,由于与非分解代谢化合物生成相关的某些负选择压力在“关闭”状态下得到缓解,预计构建阶段的任何持续时间均会对发酵的最终生产率产生一定益处。

在一些实施方案,所述构建阶段进行一段时间,足以生成可在生成阶段期间支持非分解代谢化合物生成的细胞生物量。在一些实施方案,所述构建阶段进行一段时间,足以使接种时存在的细胞群经历多次倍增,直至达到所需的细胞密度。在一些实施方案,所述构建阶段进行一段时间,足以使宿主细胞群在其中进行所述构建阶段的发酵容器或容器中达到约0.01和400之间的细胞密度(od600)。在一些实施方案,进行所述构建阶段直至达到至少0.01的od600。在一些实施方案,进行所述构建阶段直至达到至少约0.1的od600。在一些实施方案,进行所述构建阶段直至达到至少约1.0的od600。在一些实施方案,进行所述构建阶段直至达到至少约10的od600。在一些实施方案,进行所述构建阶段直至达到至少约100的od600。在一些实施方案,进行所述构建阶段直至达到约0.01和100之间的od600。在一些实施方案,进行所述构建阶段直至达到约0.1和10之间的od600。在一些实施方案,进行所述构建阶段直至达到约1和100之间的od600。在其他实施方案,所述构建阶段进行至少约12、24、36、48、60、72、84、96小时或约96小时以上的时间。

在一些实施方案,所述生成阶段进行一段时间,足以生成所需非分解代谢化合物的量。在一些实施方案,所述生成阶段进行至少约12、24、36、48、60、72、84、96小时或约96小时以上的时间。

在一些实施方案,所述生成阶段进行约3和20天之间的时间。在一些实施方案,所述生成阶段进行约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20天或约20天以上的时间。

在一些实施方案,生成非分解代谢化合物的方法包括在分开的构建和生成培养基中培养宿主细胞。譬如,所述方法可包括在构建阶段培养遗传修饰的宿主细胞,其中在非生成条件下培养细胞以生成接种物,然后在适于诱导化合物生成的条件下将所述接种物转移至第二发酵培养基中,并在第二发酵阶段中维持稳态条件以生成含有非分解代谢产物的细胞培养物。在一些实施方案,麦芽糖存在于构建培养基中,而发酵培养基中不存在麦芽糖从而生成含有非分解代谢产物的细胞培养物。与构建培养基中的细胞一起转移的任何残留量的麦芽糖将在发酵阶段期间被所述细胞代谢。

在一些实施方案,本发明提供的方法足以生成一种或多种非分解代谢化合物,其量大于约10克每升发酵培养基。在一些此类实施方案中,以每升细胞培养物约10至约50克,多于约15克,多于约20克,多于约25克,或多于约30克的量生成非分解代谢衍生的化合物。

在一些实施方案,本发明提供的方法足以生成一种或多种非分解代谢化合物,其量大于约50毫克每克干细胞重量。在一些实施方案,生成得到的重组生成的非分解代谢化合物的量为约50至约1500毫克,多于约100毫克,多于约150毫克,多于约200毫克,多于约250毫克,多于约500毫克,多于约750毫克,或多于约1000毫克每克干细胞重量。

在一些实施方案,与由不包含在非生成条件下培养宿主细胞的生成阶段的方法得到的生成量相比,本发明提供方法的实施导致由遗传修饰的宿主细胞群生成的非分解代谢化合物的量增加。在一些实施方案,所述方法的实施导致生成一种或多种非分解代谢化合物,其量比由不包含非生成条件下培养宿主细胞的生成阶段的方法生成的非分解代谢化合物的量高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1,000倍或更多,基于每单位体积的细胞培养物。

在一些实施方案,所述方法的实施导致生成一种或多种非分解代谢化合物,其量比由不包含非生成条件下培养宿主细胞的生成阶段的方法生成的非分解代谢化合物的量高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1,000倍或更多,基于每单位干细胞重量。

在一些实施方案,所述方法的实施导致生成一种或多种非分解代谢化合物,其量比由不包含非生成条件下培养宿主细胞的生成阶段的方法生成的非分解代谢化合物的量高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1,000倍或更多,基于每单位时间的每单位体积的细胞培养物。

在一些实施方案,所述方法的实施导致生成一种或多种非分解代谢化合物,其量比由不包含非生成条件下培养宿主细胞的生成阶段的方法生成的非分解代谢化合物的量高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1,000倍或更多,基于每单位时间的每单位干细胞重量。

6.6稳定化构建体及其在偶联细胞生长与非分解代谢化合物生成中的用途

另一方面,本发明提供的组合物和方法可抵消自发突变对由遗传修饰的宿主细胞生成异源性非分解代谢化合物的潜在负面影响。如上所述,与遗传修饰的宿主细胞异源的非分解代谢化合物的生成通常需要atp、nadph和碳的净输入,通常需要大量的氧供应来帮助平衡系统的氧化还原反应。此种环境使得进化趋向于更低级的产物,更高的生物量产生更有利的基因型,并且突变在宿主细胞中自发地发生,包括产生突变的丧失。因此,产物产率降低的突变宿主细胞与原始的高产物产率亲本细胞相比具有“适应性优势”,因为更多的突变宿主细胞的代谢资源用于构建生物量。这导致具有较高生长速率的低产物产率或无产物产率细胞(称为“破碎菌株”)的突变体超过具有较慢生长速率的原始高产物产率亲本细胞的突变体。所述这些细胞的不同生长速率又转而导致所述突变体,低产物产率或无产物产率的突变体细胞最终接管发酵罐中的细胞群(称为“菌株退化”过程),并随着时间的推移产物产率大幅下降。

为了稳定异源性非分解代谢化合物的生成,在某些实施方案,使编码影响细胞生长的蛋白的核酸的表达与生成异源性非分解代谢化合物偶联。譬如,编码影响细胞生长的蛋白的核酸和编码用于生成非分解代谢化合物的生物合成途径的酶的一种或多种核酸与它们各自的启动子可操作地连接,所述启动子由相同的转录调控因子共调控。换言之,通常不由相同转录调控因子调控的所述这些核酸作为调节子被共调控。结果是,负面影响转录调控因子的表达或稳定性的任何自发突变将负面影响调节子中所有核酸的表达。当调节子中的影响细胞生长的基因的表达由于自发突变而降低时,与高产物产率的亲本细胞相比,这将导致这些突变细胞的生长不利条件。因此,由相同转录调控因子共调控的调节子的表达对可能会减少异源性非分解代谢化合物生成的突变更稳定。

由于其对非分解代谢化合物生成的稳定作用,本发明使用的短语“稳定化构建体”是指编码影响细胞生长的蛋白的核酸,所述核酸可操作地连接至由目的调节子(即作为单元被调控的一组目的基因)的共同转录调控因子进行调控的启动子。此外,在某些实施方案使用的术语“编码影响细胞生长的蛋白的异源性核酸”是指编码影响细胞生长的蛋白的核酸可操作地连接至异源性启动子而非其内源性启动子。同理,在某些实施方案,术语“编码生物合成途径的酶的异源性核酸”用于指编码酶的核酸可操作地连接至异源性启动子而非其内源启动子。

在一些实施方案,对目的调节子的共同转录调控因子响应的启动子用于驱动代谢途径的条件性必需基因的表达,所述代谢途径的终产物可被遗传修饰的宿主细胞消耗。譬如,条件性必需基因可以是用于生成赖氨酸作为终产物的生物合成途径中的lys9基因。在此实施方案中,代谢途径的所述条件性必需基因是影响细胞生长的基因,因为条件性必需基因的功能性破坏将影响细胞生长或生存力。含有此种基因设计的细胞群需要目的调节子(当在不存在外部添加的赖氨酸情况下进行培养时)的高表达,因此,所述调节子的表达对可能减少调节子表达的突变更稳定。此种调节子稳定性的方法与包含具有基因开关的基因设计的宿主细胞相容,所述基因开关当需要时,例如,在生物量构建阶段期间(例如,图.17中所示的gal调节子)条件性地降低调节子表达。在构建阶段期间,通过向生长培养基提供目的代谢物(例如,赖氨酸)可补偿由条件性必需基因表达的减少引起的营养缺陷。此类示例性实施方案在图.17中示出,并在下面进一步详细描述。

图.17所示的示例性实施方案涉及通过生物合成途径的酶生成异源性非分解代谢化合物,而本发明提供的组合物和方法具有更广泛的应用。譬如,它们可用于生成任何异源性非分解代谢化合物,如由宿主细胞中的异源性核酸编码的目的蛋白。目的异源性蛋白的实例包括抗体类、疫苗类、抗生素类、激素类(例如,胰岛素或人生长因子)等。与通过生物合成途径的酶生成的非分解代谢化合物类似,当生成大量的目的异源性蛋白时,则对宿主细胞的代谢资源施加压力。此环境可有利于向突变细胞进化,所述突变细胞具有较低级产物、较高的生物量产生的基因型,导致异源性目的蛋白的生成不稳定。因此,可将本发明提供的稳定化构建体的表达与编码任何目的异源性蛋白的核酸的表达偶联以稳定其在发酵过程中的生成。与通过本发明所述的生物合成途径的酶生成非分解代谢化合物有关的任何讨论也适用于生成同样是非分解代谢化合物的任何目的异源性蛋白。

6.6.1.共同转录调控因子偶联细胞生长和非分解代谢化合物的生成

可使用任何合适的转录调控因子来偶联编码影响细胞生长的蛋白的核酸的表达和非分解代谢化合物(或任何目的蛋白)的生成。在一个实施方案,gal调节子的转录调控因子可用于将编码生物合成途径的一种或多种酶的一种或多种异源性核酸的表达与编码影响细胞生长的蛋白的异源性核酸的表达偶联。在一个实施方案,转录激活因子gal4p可用作共同转录调控因子来调控调节子中所有异源性核酸的表达。在另一实施方案,转录抑制因子gal80p可用作共同转录抑制因子来抑制调节子中所有异源性核酸的表达。在一些实施方案,gal4p和gal80p均被用作共同转录调控因子来共调控调节子中所有异源性核酸的表达。

gal调节子的转录调控因子的使用仅仅是示例性的,任何合适的转录调控因子均可用于共调控和控制调节子中核酸的表达。譬如,mal转录激活因子可用作共同转录调控因子来调控调节子中核酸的表达,其中每种核酸可操作地连接至麦芽糖响应型启动子。在另一实施例,当每种核酸与pho调节子启动子可操作地连接时,pho调节子激活因子可用作共同转录调控因子以调控调节子中核酸的表达。

在一些实施方案,人工转录调控因子可用于共调控调节子中核酸的表达。譬如,与激活结构域融合的lexa可用作人工转录调控因子。转录调控因子通常由可分离的功能结构域组成:与特定dna序列相互作用的dna结合结构域;以及与其他蛋白相互作用以模拟启动子转录的激活结构域。转录调控因子的可分离的功能结构域能够用天然和非天然的对应物替换dna结合结构域和激活结构域,从而生成人工转录调控因子。

用于偶联编码影响细胞生长的蛋白和生物合成途径(或任何目的蛋白)的一种或多种酶的异源性核酸的转录和表达的共同转录调控因子的选择将取决于宿主细胞、异源性非分解代谢化合物所需的生成水平、以及与遗传修饰的宿主细胞相关的其他参数的选择。

6.6.2.编码影响细胞生长的蛋白的核酸可操作地连接至共同调控的启动子作为稳定化构建体

编码影响细胞生长的蛋白的任何合适的核酸可用于稳定化构建体中,使得其表达通过共同转录调控因子偶联生成非分解代谢化合物(或任何目的蛋白)的生物合成途径的一种或多种酶的表达。本发明使用的术语“编码影响细胞生长的蛋白的核酸”或“影响细胞生长的基因”是指编码蛋白的核酸,所述蛋白影响遗传修饰的宿主细胞的细胞生长(例如,生长速率、细胞生物量或细胞活力)。对共同转录调控因子生成负面影响的任何自发突变也将负面影响编码影响细胞生长的蛋白的核酸的表达,从而对细胞生长生成负面影响。因此,包含此稳定化构建体的遗传修饰的宿主细胞对于可能会减少非分解代谢化合物生成的突变将更加稳定。

在一些实施方案,通过置换或取代宿主细胞基因组中的内源性启动子,将异源性启动子可操作地连接至编码影响细胞生长的蛋白的核酸。在其他实施方案,可操作地连接至编码影响细胞生长的蛋白的核酸的异源性启动子可在不同位置进行染色体整合,而其内源性对应物被功能性破坏。所述这些方法仅仅是示例性的,可使用其他合适的方法将稳定化构建体并入遗传修饰的宿主细胞中。

6.6.2.1先前确定的必需基因在稳定化构建体中的用途

在一些实施方案,编码影响细胞生长的蛋白的核酸包括必需基因,所述必需基因是在所有营养物质均可利用的最佳条件下维持生命所必需的。所述这些必需基因可在必需基因(deg)的数据库中获悉,其可从网站http://tubic.tju.edu.cn/deg/或http://www.essentialgene.org公开获得。deg数据库中的必需基因已由基因组规模的基因失活技术所进行鉴定。已在各种生物体的基因组中鉴定了必需基因,例如拟南芥(arabidopsisthaliana),烟曲霉菌(aspergillusgumigatus),秀丽隐杆线虫(caenorhabditiselegans),斑马鱼(daniorerio),黑腹果蝇(drosophilamelanogaster),智人(homosapiens),小家鼠(musmusculus),酿酒酵母(saccharomycescerevisiae),粟酒裂殖酵母(schizosacchromycespombe)等。参见如meinkeetal.(2008)trendsplantsci13:483-91;huetal.(2007)plospathog.3:e24;kamathetal.(2003)nature421:231-7;amsterdametal.(2004)procnatlacadsciusa,101:12792-7;spradlingetal.(1999)genetics153:135-77;liao(2008)procnatlacadsciusa105:1987-92;georgietal.(2013)plosgenetics9.5:e1003484;liao(2007)trendsgenet23:378-81;giaeveretal.(2002)nature418:387-91;和kimetal.naturebiotech28.6(2010)617-623。由必需基因编码的功能被认为是生命的基础,因此可能对所有细胞均是通用的。

在deg数据库中有很多种类的必需基因。所述这些包括参与蛋白合成、分泌和质量控制的基因,参与细胞包膜和细胞分裂的基因,参与代谢和生物合成的基因,参与dna复制和染色体维持的基因,参与rna合成和降解的基因等等。

参与酵母中蛋白合成的必需基因的实例包括但不限于efb1(翻译延伸因子1β;deg20010002;ncbinp_009398),rrn6(参与35srrna基因转录的蛋白;deg20010015;np_009539),rer2(参与多萜醇(dilichol)合成的顺式异戊烯转移酶;deg20010033;np_009556)等。

酵母中用于分泌和质量控制的必需基因的实例包括但不限于exo84(剪接体组装和胞吐中的必需蛋白;deg20010050;np_009660),sec31(分泌途径囊泡的copii包膜的必需磷蛋白成分;deg20010148;np_010086)等。

酵母中用于交配和细胞分裂的必需基因的实例包括但不限于mtw1(mind动粒复合体的必需组分;deg20010006;np_009367),cdc24(鸟嘌呤核苷酸交换因子;deg20010008;np_009359),cdc15(有丝分裂退出途径的蛋白激酶;deg20010012;np_009411;hta2(组蛋白h2a;deg20010013;np_009552),cdc27(deg20010028;np_009469);cmd1(钙调素;deg20010051;np_009667),cks1(细胞周期蛋白依赖性蛋白激酶调节亚基和适配体;deg20010055;np_009693),mec1(基因组完整性检查点蛋白;deg20010056;np_009694)等。

参与酵母中代谢或生物合成的必需基因的实例包括但不限于cdc19(丙酮酸激酶;deg20010007;np_009362),gp118(甘露糖基转移酶;deg20010034;np_009558),tsc3(刺激丝氨酸棕榈酰转移酶活性的蛋白;deg20010042;np_116327),alg14(deg20010044;np_009626),rib7(二氨基羟基磷酸核糖基氨基嘧啶脱氨酶;deg20010061;np_0097),rib5(核黄素合成酶;deg20010082;np_009815),fad1(黄素腺嘌呤二核苷酸合成酶;deg20010115;np_010239),hem13(粪卟啉原ⅲ氧化酶;deg20010163;np_010326)等。

参与酵母中dna复制的必需基因的实例包括但不限于rfa1(参与dna复制、修复和重组的异源三聚体复制蛋白a的亚基;deg20010010;np_009404),pol30(增殖细胞核抗原;deg20010048;np_009645),pol3(dna聚合酶δ的催化亚基;deg20010126;np_010181),cdc9(dna连接酶;deg20010144;np_010117)等。

参与酵母中rna合成和降解的必需基因的实例包括但不限于tfc3(rna聚合酶iii转录起始因子的六个亚基中的最大者;deg20010001;np_009400),mak16(必需核蛋白,66s前核糖体粒子的组分;deg20010003;np_009377),prp45(前mrna剪接所需的蛋白;deg20010004;np_009370),pop5(裂解前rrna和核rnasep的两个rnasemrp的亚基;deg20010005;np_009369),pta1(mrna和snorna3'端的裂解和多聚腺苷酸化所需的全-cpf的亚基;参与前trna处理;deg20010009;np_009356.1),sen34(rrna剪接内切酶的亚基;deg20010011;np_009405),abd1(甲基转移酶;deg20010075;np_009795)等。

上述必需基因仅仅是示例性的,在deg数据库中还有许多酵母以及其他生物体的其他必需基因。deg数据库中未包含的其他生物体中的其他必需基因可使用针对deg的同源序列搜索进一步分析和鉴定。由必需基因编码的功能被认为对于所有细胞通常是必需的。因此,如果使用blast比对的查询序列在deg中具有同源基因,那么所查询的基因可能也是必需的。必需基因数据库的附加描述和对同源序列的搜索进一步详细记载在下述文献中:例如zhangetal.,nuc.acidsres.2004jan;32:d271-272;和zhangandlin,nuc.acids.res.2009jan;37:d455-d458,其通过引用其全文并入本文。在遗传修饰的宿主细胞中,使用共同转录调控因子,可使用这些必需基因中的任何一个或组合来将它们的表达偶联至非分解代谢化合物的生成。

6.6.2.2条件性必需基因在稳定化构建体中的用途

在一些实施方案,编码影响细胞生长的蛋白的核酸可包括仅在特定环境或生长条件下必不可少的条件性必需基因。对细胞生长或影响细胞生长至关重要的因素可高度取决于给定的培养基或条件。条件性必需基因的实例包括营养缺陷型基因,其是条件性必需的。譬如,在培养基中不存在尿嘧啶的情况下,催化嘧啶的从头生物合成中的第六个酶促步骤的乳清苷-5'-磷酸脱羧酶基因ura3对于宿主细胞是必需的。在另一实施例,在培养基中不存在色氨酸的情况下,编码催化色氨酸生物合成第三步的磷酸核糖基邻氨基苯甲酸异构酶的trp1基因对于宿主细胞是必需的。在另一实施例,在培养基中不存在赖氨酸的情况下,编码氨基己二酸还原酶的lys2基因可能变得必需。所述这些条件性必需基因中的任一个可与由共同转录调控因子进行调控的启动子可操作地连接,所述共同转录调控因子也调控用于生成非分解代谢化合物(或任何目的异源性蛋白)的生物合成途径的一种或多种酶的表达。

有许多其他条件性必需基因编码用于合成必需化合物的酶,当宿主细胞在缺少这些必需化合物的培养基中生长时,所述必需化合物对于细胞生长是必需的。此类条件性必需基因的其他实例包括那些编码用于生成必需氨基酸类、脂肪酸类、核苷酸类等的生物合成途径中的酶。含有此类条件性必需基因的遗传修饰的宿主细胞将需要调节子的高表达,从而生成足够量的必需化合物。因此,此调节子将对可能会减少非分解代谢化合物生成的突变更加稳定。

存在许多提供各种生物合成途径包括用于合成必需化合物的生物合成途径的数据库。所述这些包括,例如,kegg途径数据库(参见如kanehishaetal.,(2002)nucleicacidsres.,30:42-46);和metacyc途径数据库(参见如altmanetal.(2013)bncbioinformatics14:112)。其他有用的数据库包括brenda数据库(参见如schomburgetal.(2002)nucleicacidsres.30:47-49);swiss-prot数据库(bairochandapweiler(2000)nucleicacidsres.28:45-48);ecocyc(karpetal.(2002)nucleicacidsres.30:56-8);和emp/mpw(selkovetal.(1998)nucleicacidsres.26:43-45)。许多所述这些途径数据库提供了编码用于生成必需化合物的生物合成途径的酶的基因的核苷酸序列。编码参与合成必需化合物的酶的任何合适的核酸均可用于稳定化构建体中。

在一些实施方案,编码必需氨基酸的氨基酸生物合成基因可用作稳定化构建体中的条件性必需基因。所述这些包括赖氨酸生物合成基因、蛋氨酸生物合成基因、亮氨酸生物合成基因、组氨酸生物合成基因、亮氨酸生物合成基因、色氨酸生物合成基因等中的一种或多种。合成这些氨基酸的生物合成途径是众所周知的。许多这些氨基酸生物合成基因的核酸序列对于许多生物体也是已知的并且是公众可获得的。参见例如基因库(genbank)序列数据库(由国家生物技术信息中心(nationalcenterforbiotechnologyinformation)维护)。

在一些实施方案,编码赖氨酸生物合成途径中的酶的核酸可用于稳定化构建体中。在酵母中,赖氨酸生物合成途径包括许多不同的酶以合成赖氨酸。所述这些包括将2-酮戊二酸和乙酰-coa(乙酰辅酶a)转化为高柠檬酸(例如,高柠檬酸合酶;lys21或lys20)的酶,将高柠檬酸转化为高乌头酸并将高乌头酸转化为高异柠檬酸(例如,高乌头酸酶;lys4)的酶,将高异柠檬酸转化为α-酮己二酸(例如,高异柠檬酸脱氢酶;lys12)的酶,将α-酮己二酸转化为l-2-氨基己二酸(例如,酶2.6.1.39;2-氨基己二酸氨基转移酶)的酶,将l-2-氨基己二酸转化为l-2-氨基己二酸6-半醛(例如,α-氨基己二酸还原酶;lys2)的酶,将l-2-氨基己二酸6-半醛转化为酵母氨酸(sacchropine)(例如,酵母氨酸脱氢酶(nadp+l-谷氨酸形成);lys9)的酶;和将酵母氨酸转化为l-赖氨酸(例如酵母氨酸脱氢酶(nad+,l-赖氨酸形成);lys1)的酶。

其他生物体可使用略微不同的途径和酶用于赖氨酸的生物合成。其他生物体中的生物合成途径、生物合成酶及其相应的核酸序列可在例如kegg数据库和metacyc数据库中获悉。譬如,编码将2-酮戊二酸转化为来自许多不同生物体的高柠檬酸(例如,高柠檬酸合酶)的酶的核酸可用作稳定化构建体中的条件性必需基因,以使遗传修饰的宿主细胞的细胞生长与异源性非分解代谢化合物的生成偶联。合适的核苷酸序列的示例性实例包括,但不限于:(lys20/ydl182w;酿酒酵母(saccharomycescerevisiae)),(lys21/ydl131w,其是lys20的旁系同源物;酿酒酵母(saccharomycescerevisiae)),(agos_adr107w;棉假囊酵母(eremotheciumgossypii)),(ecym_8045;cymbalariae假囊酵母),(klla0e23695g;乳酸克鲁维酵母(kluveromyceslactis)),(klla0f05489g;乳酸克鲁维酵母(kluveromyceslactis)),(klth0e12848g;lachanceathermotolerans),(klth0h02486g;lachanceathermotolerans),(kpol_2000p11;vanderwaltozymapolysopora),(zyro0a13222g;鲁氏接合酵母(zygosaccharomycesrouxii))等。

在一些实施方案,编码将高柠檬酸转化为高异柠檬酸的酶(例如,高柠檬酸酶)的核酸可用作稳定化构建体中的条件性必需基因,以使遗传修饰的宿主细胞的细胞生长与异源性非分解代谢化合物的生成偶联。合适的核苷酸序列的示例性实例包括,但不限于:(lys4/ydr234w;酿酒酵母(saccharomycescerevisiae)),(agos_abl106c;棉假囊酵母(eremotheciumgossypii)),(ecym_5123;cymbalariae假囊酵母),(klla0c15125g;乳酸克鲁维酵母(kluveromyceslactis)),(klth0e10582p;lachanceathermotolerans);(kpol_1031p57;venderwaltozymapolyspora),(k1705;鲁氏接合酵母(zygosaccharomycesrouxii))等。

在一些实施方案,编码将高异柠檬酸转化为α-酮己二酸(例如,高异柠檬酸脱氢酶)的酶的核酸可用作稳定化构建体中的条件性必需基因,以使遗传修饰的宿主细胞的细胞生长与异源性非分解代谢化合物的生成偶联。合适的核苷酸序列的示例性实例包括,但不限于:(lys12/yil094c;酿酒酵母(saccharomycescerevisiae))等。

在一些实施方案,编码将α-酮己二酸转化为l-2-氨基己二酸(例如,酶2.6.1.39;氨基己二酸氨基转移酶)的酶的核酸可用作稳定化构建体中的条件性必需基因,以使遗传修饰的宿主细胞的细胞生长与异源性非分解代谢化合物的生成偶联。合适的核苷酸序列的示例性实例包括,但不限于:(aadat,kat2,katii;智人(homosapiens)),(aadat;黑猩猩(pantroglodytes)),(aadat;倭黑猩猩(panpaniscus)),(aadat;苏门答腊猩猩(pongoabelii)),(aadat;红、白颊长臂猿(momascusleucogenys))等。

在一些实施方案,编码将l-2-氨基己二酸转化为l-2-氨基己二酸6-半醛(例如,α-氨基己二酸还原酶)的酶的核酸可用作稳定构建体中的条件性必需基因,以使遗传修饰的宿主细胞的细胞生长与异源性非分解代谢化合物的生成偶联。合适的核苷酸序列的示例性实例包括,但不限于:(lys2/ybr115c;酿酒酵母(saccharomycescerevisiae)),(agos_adl346w;棉假囊酵母(eremotheciumgossypii)),(ecym_3457;cymbalariae假囊酵母),(klla0b09218g;乳酸克鲁维酵母(kluveromyceslactis)),(klth0f10384g;lachanceathermotolerans),(kpol_1006p6;vanderwaltozymapolyspora),(zyro0c16566g;鲁氏接合酵母(zygosaccharomycesrouxii))等。

在一些实施方案,编码将l-2-氨基己二酸6-半乳醛转化为琥珀酸的酶的核酸(例如,琥珀胆碱脱氢酶,nadp+l-谷氨酸形成)可用作稳定化构建体中的条件性必需基因,以使遗传修饰的宿主细胞的细胞生长与异源性非分解代谢化合物的生成偶联。合适的核苷酸序列的示例性实例包括,但不限于:(lys9/ynr050c;酿酒酵母(saccharomycescerevisiae)),(sorbi_03g030510;双色高粱(sorghumbicolor)),(agos_abr116c;棉假囊酵母(eremotheciumgossypii)),(ecym_7008;cymbalariae假囊酵母),(klaa0c18744g;乳酸克鲁维酵母(kluveromyceslactis)),(klth0a07590g;lachanceathermotolerans),(kpol_1028p12;vanderwaltozymapolyspora),(zyro0d17578g;鲁氏接合酵母(zygosaccharomycesrouxii))等。

在一些实施方案,编码将酵母氨酸(sacchropine)转化为l-赖氨酸(例如,酵母氨酸(sacchropine)脱氢酶,nad+,l-赖氨酸形成)的酶的核酸可用作稳定化构建体中的条件性必需基因,以使遗传修饰的宿主细胞的细胞生长与异源性非分解代谢化合物的生成偶联。合适的核苷酸序列的示例性实例包括,但不限于:(lys1;yir034c;酿酒酵母(saccharomycescerevisiae)),(agos_acr167c;棉假囊酵母(eremotheciumgossypii)),(ecym_5636;eremotheciumcymbalariae),(klla0e07987g;鲁氏接合酵母(zygosaccharomycesrouxii)),(klth0c00594g;lachanceathermotolerans),(kpol_1057p13;vanderwaltozymapolyspora),(zyro0d00594g;鲁氏接合酵母(zygosaccharomycesrouxii))等。

编码赖氨酸生物合成途径中的酶的核酸作为条件性必需基因的用途仅仅是示例性的,编码其他氨基酸生物合成途径中的酶的核酸可用作稳定化构建体中的条件性必需基因。所述这些包括,譬如,编码蛋氨酸生物合成途径的酶:叶酰聚谷氨酸合成酶(例如,met7),n5-甲基四氢碟酰三谷氨酸-高半胱氨酸甲基转移酶(met6),l-天冬氨酸4-p转移酶(hom3);天冬氨酸β半醛脱氢酶(例如,hom2),高丝氨酸脱氢酶(例如hom6),高丝氨酸o-反式-乙酰基转移酶(例如,met2),o-乙酰高丝氨酸(硫代)-裂合酶(例如,met17)等的核酸。

其他实例包括编码亮氨酸生物合成途径的酶:α-异丙基苹果酸合酶小同工酶(leu9),α-异丙基苹果酸合酶(leu4);异丙基苹果酸异构酶(leu1),β-ipm脱氢酶(leu2);支链氨基酸转氨酶(例如,bat2),支链氨基酸氨基转移酶(bat1)等的核酸。

其他实例包括编码色氨酸生物合成途径的酶:邻氨基苯甲酸合酶(trp3和trp2),邻氨基苯甲酸磷酸核糖转移酶(trp4),n-(5'-磷酸核糖基)-邻氨基苯甲酸异构酶(trp),吲哚-3-甘油磷酸合酶(trp3),色氨酸合成酶(trp5)等的核酸。

其他实例包括编码组氨酸生物合成途径的酶:atp磷酸核糖基转移酶(his),磷酸核糖基-atp焦磷酸酶(his4),磷酸核糖基-amp环化水解酶(his4),磷酸核糖基-5-氨基-1-磷酸核糖基-4-咪唑甲酰胺(his6),咪唑甘油磷酸合酶(his7),咪唑甘油-磷酸脱水酶(his3),组氨醇-磷酸转氨酶(his5),组氨醇磷酸酶(his2),组氨醇脱氢酶(his4)等的核酸。

其他实例包括编码苯丙氨酸生物合成途径的酶:分支酸变位酶(aro7),预苯酸脱水酶(pha2),芳香族氨基酸氨基转移酶(aro8和aro9)等的核酸。

其他实例包括编码苏氨酸生物合成途径的酶:高丝氨酸激酶(thr1),苏氨酸合酶(thr4)等的核酸。

其他实例包括编码异亮氨酸生物合成途径的酶:苏氨酸脱氨酶(ilv1),乙酰乳酸合酶(ilv6,ilv2),乙酰羟酸还原异构酶(ilv5),二羟酸脱水酶(ilv3),支链氨基酸转氨酶(bat2),支链氨基酸转氨酶(bat1)等的核酸。

其他实例包括编码缬氨酸生物合成途径的酶:乙酰乳酸合酶(ilv6,ilv2),乙酰羟酸还原异构酶(ilv5),二羟酸脱水酶(ilv3),支链氨基酸转氨酶(bat2),支链氨基酸转氨酶(bat1)等的核酸。

在某些实施方案,编码核苷酸生物合成途径中的酶的核酸可用作本发明组合物和方法中的条件性必需基因。所述这些包括,譬如,编码用于生成腺嘌呤、胸腺嘧啶、尿嘧啶、鸟嘌呤或胞嘧啶的生物合成途径的酶的核酸。在其他实施方案,编码脂肪酸生物合成途径中的酶的核酸可用作本发明组合物和方法中的条件性必需基因。

在酵母中编码所述这些酶的核酸序列可从酵母属基因组数据库获得,并可在www.yeastgenome.org获悉。来自其他生物体的功能性同源物也可使用blast搜索获得。任何其他合适的条件性必需基因可用于生成条件性营养缺陷型的遗传修饰的宿主细胞,其可通过条件性必需基因的表达来缓解。

6.6.2.3筛选另外的影响细胞生长的基因候选物

在deg数据库中可能尚未被确定为必需基因或条件性必需基因的某些核酸对于特定培养基或选择用于发酵的条件的细胞生长可能还是非常重要的。在一些实施方案,所述影响细胞生长的基因可包括那些影响细胞生长的基因,从而与它们在特定培养基或条件下完全表达时相比,其表达不足或缺乏将导致细胞以显著较慢的生长速率生长。

可使用多种不同的方法筛选潜在适用于稳定化构建体的影响细胞生长的基因候选物。在一个实施方案,影响细胞生长的基因候选物可使用诱导型启动子进行筛选。诱导型启动子可与影响细胞生长的基因候选物可操作地连接,并且其诱导物用于开启或关闭影响细胞生长的基因候选物的表达。在合适的时间段(例如约24、48或72小时)培养之后,可比较诱导和非诱导条件下细胞的细胞生长表型。在非诱导条件下,诱导型启动子失活,影响细胞生长的基因候选物不再被转录。当细胞分裂时,由影响细胞生长的基因候选物编码的蛋白的量逐渐下降,最终达到模拟完全丧失功能的突变的耗尽状态。在诱导或非诱导条件下培养的细胞的细胞生长表型的差异将表明影响细胞生长的基因候选物对于细胞生长是否重要。

在一些实施方案,如果其表达失活(例如,在非诱导条件下)导致细胞生物量减少(例如,细胞计数或密度),与经过适当的时间段(例如约24小时,48小时或72小时)之后其表达被激活(例如在诱导条件下)至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多相比,在稳定化构建体中选择影响细胞生长的基因候选物作为影响细胞生长的基因。可比较在非诱导和诱导条件下的细胞密度或培养物计数。譬如,可比较诱导和非诱导的细胞培养物的光密度(od600)。在其他实施方案,如果细胞在琼脂板上生长,则可计数细胞形成单位(cfr)。在其他实施方案,可比较最大比生长速率。表示细胞生长的其他合适的方法可用于比较在诱导和非诱导条件下影响细胞生长的基因候选物表达的效果。

在某些实施方案,影响细胞生长的基因候选物与由调节子的共同转录调控因子调控的启动子组合进行筛选。譬如,如果编码用于生成非分解代谢化合物的生物合成途径的酶的核酸与pgal启动子可操作地连接,则影响细胞生长的基因候选物也可操作地连接至pgal启动子以筛选其作为稳定化构建体的适当性。在此实施例中,可进一步修饰筛选宿主细胞以功能性破坏抑制因子gal80的表达,使得转录激活因子gal4p可激活调节子的表达。

在一些实施方案,可在表达这些影响细胞生长的基因候选物中测试许多不同启动子强度的不同启动子。在影响细胞生长的基因候选物的低表达水平用于细胞生长的情况下,影响细胞生长的基因候选物可以可操作地连接至相对较弱的启动子。在需要影响细胞生长的基因候选物的高表达水平的其他情况下,影响细胞生长的基因候选物可以可操作地连接至强启动子。用于调节子的任何天然来源的或合成的启动子可用于驱动影响细胞生长的基因候选物的表达。譬如,如果使用gal调节子的转录调控因子,则可在筛选影响细胞生长的基因候选物期间使用gal调节子的任何启动子,pgal1、pgal2、pgal7、pgal10、pgcy1、pgal80,或由其生成的任何合成启动子。

6.6.3.发酵组合物和使用稳定化构建体生成非分解代谢化合物

另一方面,本发明提供了由遗传修饰的宿主细胞生成的发酵组合物和使用稳定化构建体生成异源性非分解代谢化合物的方法。在某些实施方案,生成异源性非分解代谢化合物的方法包括在培养基中培养遗传修饰的宿主细胞,所述宿主细胞包含:(a)编码用于生成异源性非分解代谢化合物的生物合成途径的酶的异源性核酸,其中所述异源性核酸可操作地连接至第一启动子;(b)编码影响细胞生长的蛋白的核酸,其中所述核酸可操作地连接至第二启动子;和(c)编码转录调控因子的核酸,其中所述第一启动子和所述第二启动子均由所述转录调控因子进行调控。在某些实施方案,所述发酵组合物包含本发明所述的遗传修饰的宿主细胞和由其在培养基中生成的异源性非分解代谢化合物。通常,将遗传修饰的宿主细胞在包含碳源的培养基中在合适条件下培养足以生成所需宿主细胞生物量和/或所需非分解代谢化合物的量的时间。在某些实施方案,宿主细胞包含编码作为非分解代谢化合物的目的蛋白的异源性核酸,而非编码用于生成非分解代谢化合物的生物合成途径的酶的异源性核酸。

在本发明提供的组合物和方法中,所述第一启动子和所述第二启动子均由一个或多个共同转录调控因子进行调控。由于所述共同转录调控因子调控编码生物合成途径的酶的异源性核酸和影响细胞生长的蛋白的异源性核酸两者的表达,因此对转录调控因子(例如,其表达或稳定性)产生负面影响的任何自发突变均将负向影响所述两种异源性核酸的表达。所述这些突变的细胞与高产物产率细胞相比将不会存活或生长速率慢得多,因此,高产物产率细胞(例如,具有原始高产物产率基因型的亲本细胞)将在发酵过程中在细胞群中占主导地位。因此,使编码用于生成非分解代谢化合物的生物合成途径的酶的异源性核酸的表达与影响细胞生长的蛋白的表达偶联,将稳定宿主细胞的高产物产率基因型,从而使得在长时间的发酵过程中非分解代谢化合物的稳定生成。类似地,使编码目的蛋白的异源性核酸的表达与影响细胞生长的蛋白的表达偶联,将稳定目的蛋白的生成。

在某些实施方案,所述第一启动子和所述第二启动子中的至少一个对于所述这些核酸是异源性的。譬如,通常驱动染色体中影响细胞生长的基因的表达的内源性启动子可用由共同转录调控因子调控的异源性启动子置换。在另一实施例,通常驱动用于生成非分解代谢化合物的生物合成途径基因的表达的内源性启动子可用异源性启动子置换。在某些实施方案,所述第一启动子和所述第二启动子对于它们各自的核酸均是异源性的。通过利用异源性启动子,通常不由相同转录调控因子调控的这些核酸可作为遗传修饰的宿主细胞中的调节子被共调控。

启动子序列的选择取决于编码影响细胞生长的蛋白的异源性核酸或生成非分解代谢化合物的生物合成途径的酶所需的表达水平。在一些实施方案,所述第一启动子序列和所述第二启动子序列是相同的。在其他实施方案中,所述第一启动子序列和所述第二启动子序列是不同的。在某些实施方案,所述第一启动子和所述第二启动子具有不同的启动子强度。譬如,天然来源的pgal启动子如pgal1、pgal2、pgal7和pgal10,是通常比衍生自这些pgal启动子(例如,pgal2_v3(seqidno:84),pgal7_v1(seqidno:85),pgal2_v4(seqidno:86),pgal1_v3(seqidno:87),pgal10_v3(seqidno:88),pgal2_v2(seqidno:89),pgal7_v2(seqidno:90))的合成启动子更强的启动子。如果期望与影响细胞生长的蛋白相比具有更高的生物合成途径酶的表达,则编码所述这些酶的核酸可以可操作地连接至天然来源的pgal启动子,而编码影响细胞生长的蛋白的核酸可以可操作地连接至天然来源的pgal启动子的较弱的合成启动子。一般而言,选择启动子使得它们的启动子强度平衡以匹配宿主细胞中影响细胞生长的基因的所需表达,以及生成非分解代谢化合物的生物合成途径基因的所需表达。

与6.5节和其他部分中描述的构建细胞生物量和生成非分解代谢化合物有关的其他细节也适用于包含本发明提供的稳定化构建体的组合物和方法。

6.6.4.稳定化构建体在组成型生成非分解代谢化合物中的用途

在某些实施方案,在整个发酵过程中组成型生成异源性非分解代谢化合物。对于对细胞相对无毒的某些异源性非分解代谢化合物,遗传修饰的宿主细胞可以在整个发酵过程中(即,在发酵构建阶段和发酵生成阶段)耐受这些化合物的存在。此类异源性化合物的实例包括各种乙酰-coa衍生的化合物,例如一些类异戊二烯、脂肪酸和聚酮化合物。所述这些化合物的具体实例将在下面章节6.11至6.13中进一步描述。

为了组成型生成异源性非分解代谢化合物,可使用任何合适的转录调控因子和启动子来调控编码生物合成途径的酶和影响细胞生长的蛋白的异源性核酸的表达。为了组成型生成异源性非分解代谢化合物,可使用已知的基因破坏技术来减少或消除启动子的任何内源性转录抑制因子的表达。譬如,如果异源性核酸是由gal调节子的转录调控因子调控,则抑制因子gal80可被功能性破坏。通过功能性破坏gal80的表达,gal80p不能再抑制gal4p的活性。

gal调节子的转录调控因子和启动子的使用仅仅是示例性的,并且任何合适的转录调控因子和启动子均可用于共调控和调控调节子(即,编码影响细胞生长的蛋白的核酸和编码用于生成非分解代谢化合物的生物合成途径的酶的核酸)的表达。譬如,可使用mal转录激活因子作为共同的转录调控因子以驱动所述两种异源性核酸的表达,其中每种异源性核酸可操作地连接至麦芽糖响应型启动子。在另一实施例,pho调节子激活因子可用作共同转录调控因子来驱动所述两种异源性核酸的表达,其中每种异源性核酸可操作地连接至pho调节子启动子。在另一实施例,人造转录调控因子可用于激活所述两种异源性核酸的表达。譬如,与激活结构域融合的lexa可用作人工转录调控因子。

6.6.5.使用具有开关的稳定化构建体来生成非分解代谢化合物

另一方面,本发明所述的稳定化构建体可与将发酵的生长期(即,细胞生物量的构建阶段)和发酵的生成阶段(即,异源性化合物的生成阶段)分开的开关进行组合使用。在构建阶段生成非分解代谢化合物可能是不需要的。这会导致细胞生长缓慢,并且细胞在生成阶段无法达到最佳的细胞密度。另一方面,在发酵的生成阶段的生物量生成是不需要的,因为它将代谢资源从异源性非分解代谢化合物的生成转移开来。在某些实施方案,开关可以与遗传修饰的宿主细胞中的稳定化构建体组合使用,以分离发酵的这两个不同的代谢阶段并最大化异源性非分解代谢化合物的生成。

在一个实施方案,所述构建阶段进行一段时间,足以生成一定量的细胞生物量,其可以在生成阶段期间支持异源性化合物的生成。所述构建阶段进行一段时间,足以使接种时存在的细胞群经历多次倍增,直至达到所需的细胞密度。在一些实施方案,所述构建阶段进行一段时间,足以使宿主细胞群在其中进行构建阶段的发酵容器或容器中达到约0.01和400之间的细胞密度(od600)。在一些实施方案,进行所述构建阶段直至达到至少0.01的od600。在一些实施方案,进行所述构建阶段直至达到至少约0.1的od600。在一些实施方案,进行所述构建阶段直至达到至少约1.0的od600。在一些实施方案,进行所述构建阶段直至达到至少约10的od600。在一些实施方案,进行所述构建阶段直至达到至少约100的od600。在一些实施方案,进行所述构建阶段直至达到约0.01和100之间的od600。在一些实施方案,进行所述构建阶段直至达到约0.1和10之间的od600。在一些实施方案,进行所述构建阶段直至达到约1和100之间的od600。在其他实施方案,所述构建阶段进行至少约12、24、36、48、60、72、84、96小时或约96小时以上的时间。

在一些实施方案,所述生成阶段进行一段时间,足以生成所需非分解代谢化合物的量。在一些实施方案,所述生成阶段进行至少约12、24、36、48、60、72、84、96小时或约96小时以上的时间。在一些实施方案,所述生成阶段进行约3和20天之间的时间。在一些实施方案,所述生成阶段进行约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20天或约20天以上的时间。

在其中使用开关来分离发酵的两个阶段的实施方案中,条件性必需基因可用作稳定化构建体中影响细胞生长的基因。譬如,条件性必需基因可编码代谢途径的酶,所述代谢途径的终产物是细胞生长所必需的必需化合物,其可由宿主细胞消耗。在稳定化构建体中含有此条件性必需基因的遗传修饰的宿主细胞将需要调节子的高表达,从而可生成足够量的必需化合物。发酵(即构建阶段)的“关闭”阶段,其中所述开关关闭条件性必需基因和生物合成途径基因的表达,将导致所述这些遗传修饰的宿主细胞的条件性营养缺陷型。所述条件性营养缺陷型可通过向培养基中添加必需化合物来补偿。在发酵的开启阶段(即生成阶段)期间,其中所述开关开启用于生成非分解代谢化合物的条件性必需基因和生物合成途径基因的表达,必需化合物不补充到培养基中。因此,只有能够表达所述条件性必需基因并生成足量必需化合物的细胞才能生长。此策略与遗传修饰的宿主细胞相容,所述遗传修饰的宿主细胞具有在所需时有条件地降低调节子表达的遗传开关,因为由调节子表达的降低引起的营养缺陷型可通过向培养基提供营养缺陷型所要的必需化合物来补偿。

因此,本发明提供了生成异源性非分解代谢化合物的方法,其中所述方法包括:(a)构建阶段,其中遗传修饰的宿主细胞群在限制异源性非分解代谢化合物生成的培养基中进行培养,其中所述培养基包含必需化合物,其次是(b)生成阶段,其中遗传修饰的宿主细胞群或亚群是在促进异源性非分解代谢化合物生成而不补充具有必需化合物的培养基(或补充足够低的量的必需化合物)的培养条件下进行培养。在此实施方案,遗传修饰的宿主细胞可包含:(i)编码目的蛋白(例如,用于生成异源性非分解代谢化合物的生物合成途径的酶)的异源性核酸,其中所述异源性核酸可操作地连接至第一启动子;(ii)编码用于生成必需化合物的生物合成途径的条件性必需基因产物的核酸,其中所述异源性核酸可操作地连接至第二启动子;和(iii)编码转录调控因子的核酸,其中所述第一启动子和所述第二启动子均由相同的转录调控因子进行调控。在所述生成阶段期间,由于没有将必需化合物加至培养基中(或以足够低的量加入),只有能够表达条件性必需基因的遗传修饰的宿主细胞才能生长。此举为转录调控因子的功能性表达增加了选择压力,这转而又提高了非分解代谢化合物的生成稳定性。

在构建阶段期间,可将任何合适量的必需化合物加至培养基中。在构建阶段期间,对于生长受到培养基中营养缺陷所需的必需化合物的浓度限制通常是不期望的。加入一定量的必需化合物使得包含条件性必需基因(在构建阶段期间其表达被抑制)的遗传修饰的营养缺陷型宿主细胞可以生长至如上所述的期望生物量浓度。在一些实施方案,在构建阶段培养基中合适量的必需化合物可通过在构建阶段培养基中存在增加量的必需化合物的情况下进行滴定曲线来确定。譬如,遗传修饰的宿主细胞群可分成多个亚群并平行培养,其中每个亚群是在包含不同(例如增加量)的必需化合物(包括不含必需化合物)的培养基中生长,并可在限定的时间段后测定细胞生物量(例如,od600读数)。

在其他实施方案,通过测定细胞生长速率,例如在不同浓度的必需化合物中遗传修饰的营养缺陷型宿主细胞的最大比生长速率,可确定构建阶段培养基中适宜量的必需化合物。术语“比生长速率”是指每单位时间所增加的生物量或细胞数量。术语“最大比生长速率”是指在培养指数增长阶段的“比生长速率”。通常在指数增长阶段期间,由于底物(或产物)对生长没有显著的抑制作用,所以比生长速率大致恒定。

在某些实施方案,所述必需化合物滴定法可包含至少一种浓度的必需化合物,由此宿主细胞生物量(例如,通过od600测定)或最大比生长速率在最大值时平稳,即,在增加量的必需化合物的情况下,没有观察到宿主细胞生物量或最大比生长速率的进一步增加。在一些实施方案,加至构建阶段培养基中的必需化合物的量至少是宿主细胞的生物量或最大比生长速率处于其最大值的必需化合物的最小量。所述量也可被称为必需化合物的“饱和”量。

在某些实施方案,可将饱和量的必需化合物加至构建阶段培养基中。在一些实施方案,可将必需化合物以大于饱和量的量加至构建阶段培养基中,以确保遗传修饰的宿主细胞达到所需的细胞生物量或最大比生长速率。例如,加至构建阶段培养基中的必需化合物是至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100倍或约100倍以上地大于从必需化合物滴定曲线确定的饱和量。在某些实施方案,如果期望将遗传修饰的营养缺陷型宿主细胞生长至较低的生物量浓度或最大比生长速率,则必需化合物可以少于所述饱和量的量加至构建阶段培养基中。例如,加至构建阶段培养基中的必需化合物可以是至少约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、100倍或约100倍以上地小于从必需化合物滴定曲线确定的饱和量。

此外,对于给定浓度的碳源(例如,每升培养基20克葡萄糖),营养缺陷型菌株的合适浓度的必需化合物如必需氨基酸是本领域普遍已知的。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约0.0001%(每体积培养基中必需化合物的重量)。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约0.0005%(w/v)。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约0.001%(w/v)。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约0.005%(w/v)。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约0.01%(w/v)。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约0.05%(w/v)。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约0.1%(w/v)。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约0.5%(w/v)。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约1%(w/v)。在一些实施方案,构建阶段培养基中必需化合物的浓度为至少约5%或10%(w/v)。设计用于培养营养缺陷型菌株的培养基是本领域公知的,并记载在例如酵母遗传学和分子生物学指南(guidetoyeastgeneticsandmolecularbiology),194(guthrieetal.,academicpress1990);酵母介质简介(introductiontoyeastmedia)(sigma-aldrich)中。

在所述构建阶段之后,用于培养遗传修饰的宿主细胞的生成阶段培养基不包含外部添加的必需化合物或具有足够低的量的必需化合物。如此,选择压力施加在宿主细胞上以保持条件性必需基因的表达,使得细胞能够生成营养缺陷所需的用于细胞生长的必需化合物。在某些实施方案,生成阶段培养基不包含外部添加的必需化合物。然而,在一些实施方案,必需化合物可以足够低的量加至生成阶段培养基中。譬如,生成阶段培养基可包含至少比饱和量的必需化合物少至少约10倍、100倍、1000倍、10,000倍或约100,000倍的量的必需化合物。在一些实施方案,生成阶段培养基包含比构建阶段培养基中的必需化合物的量少至少约10倍、100倍、1000倍、10,000倍或约100,000倍的量的必需化合物。

在一些实施方案,必需化合物是氨基酸,稳定化构建体中的条件性必需基因编码氨基酸生物合成途径中的酶。譬如,用于在构建阶段补充培养基的必需化合物是赖氨酸,和赖氨酸生物合成基因lys1、lys2、ly4、lys9、lys12、lys14、lys20或lys21中的任何一个或其组合可用于稳定化构建体中。在另一实施例,在构建阶段期间用于补充培养基的必需化合物是蛋氨酸。在6.6.2节中描述的其他氨基酸生物合成基因也可用于稳定化构建体中。

在其他实施方案,用于在构建阶段期间补充培养基的必需化合物可以是尿嘧啶、胸腺嘧啶、鸟嘌呤或胞嘧啶,和在所述这些核苷酸的生物合成途径中编码酶的基因中的任何一个或组合可用于稳定化构建体中。在其他实施方案,必需化合物是脂肪酸,和稳定化构建体中的条件性必需基因编码脂肪酸生物合成途径中的酶。

在某些实施方案,诱导型启动子及其诱导物可用作开关,以在构建阶段期间关闭异源性非分解代谢化合物的生成和在生成阶段期间开启所述生成。譬如,诱导型启动子与编码转录激活因子的核酸可操作地连接,所述转录激活因子可在发酵的生成阶段期间激活编码用于生成非分解代谢化合物和条件性必需基因产物的生物合成途径的酶的两种异源性核酸的表达。合适的诱导型启动子的实例包括麦芽糖响应型启动子,其可由配体如麦芽糖基诱导物诱导。麦芽糖响应型启动子和麦芽糖基诱导物的其他细节记载在上文第6.3节和第6.4中。适用于本发明方法的其他诱导型启动子包括氧敏感型启动子,如dan1启动子,其在需氧条件下是无活性的,但在厌氧条件下是高活性的。合适的氧敏感型启动子的实例记载在例如wo2015/020649中,其通过引用其全文并入本文。

在其他实施方案,诱导型启动子与编码转录抑制因子的核酸可操作地连接,所述转录抑制因子在发酵的构建阶段期间抑制编码用于生成非分解代谢化合物和条件性必需基因产物的生物合成途径的酶的两种异源性核酸的表达。包括上述或本领域已知的任何合适的诱导型启动子可用于这些实施方案中以激活转录抑制因子。

图.17中示出了使用诱导型启动子作为开关来关闭或抑制编码用于生成非分解代谢化合物和条件性必需基因产物的生物合成途径的酶的异源性核酸的表达的示例性实施方案。如图.17所示,编码gal调节子的转录抑制因子gal80p的核酸与麦芽糖响应型启动子pmal32可操作地连接。当将诱导量的麦芽糖加至培养基时,表达gal80p,其转而抑制转录激活因子gal4p的激活和用于生成异源性化合物的一种或多种生物合成酶的表达。gal80p同时抑制lys9的表达,lys9是赖氨酸生物合成途径中编码酶的条件性必需基因。在gal80p抑制调节子表达(包括条件性必需基因的表达)的构建阶段,将赖氨酸补充到培养基中以使细胞生长。

在图.17所示的示例性实施方案的生成阶段期间,遗传修饰的宿主细胞在不含麦芽糖或赖氨酸(或以其足够低的量存在)的培养基中进行培养。由于gal80不再被表达,转录激活因子gal4p不再被抑制,因此激活生物合成途径基因的表达以生成非分解代谢化合物。同时,gal4p也激活lys9的表达,而lys9又转而使赖氨酸生物合成途径生成必需化合物赖氨酸。由于遗传修饰的细胞能够生成赖氨酸,因此所述细胞可在生成阶段期间在不含赖氨酸的培养基中进行培养。在不含赖氨酸的培养基中在生成阶段期间为gal4p表达增加选择压力。因此,获得对gal调节子产生负面影响的自发突变的任何细胞将不能存活,从而在长时间的发酵过程中使高产物产率宿主细胞在细胞群中占主导地位。

6.7使用麦芽糖依赖性降解决定子和稳定化构建体生成非分解代谢化合物

另一方面,本发明提供了使用麦芽糖依赖性降解决定子和稳定化构建体生成异源性非分解代谢化合物的发酵组合物和方法。与转录调控因子框内融合的麦芽糖依赖性降解决定子可迫使转录调控因子变得依赖其与麦芽糖结合的稳定性。譬如,在培养基中不存在麦芽糖的情况下,包含与麦芽糖依赖性降解决定子融合的gal80p的融合蛋白将在生成阶段期间变得不稳定。因此,即使自发突变重新激活包含gal80p的融合蛋白的表达,所述融合蛋白在培养基中不存在麦芽糖时也将变得不稳定,并将在生成阶段期间不能抑制gal调节子的表达。当麦芽糖依赖性降解决定子与本发明所述的稳定化构建体组合使用时,异源性非分解代谢化合物的生成进一步稳定,因为所述两种构建体均可抵消自发突变的任何负面影响。

因此,本发明提供了在生成异源性非分解代谢化合物时提供至少两层稳定的组合物和方法。在一个实施方案,发酵组合物和方法包括在培养基中培养遗传修饰的宿主细胞,其中所述遗传修饰的宿主细胞包含:(a)编码融合蛋白的异源性核酸,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的转录调控因子;(b)编码用于生成异源性非分解代谢化合物的生物合成途径的一种或多种酶的一种或多种异源性核酸,所述一种或多种异源性核酸各自可操作地连接至由所述融合蛋白调控的启动子;和(c)稳定化构建体,其包含编码影响细胞生长的蛋白的异源性核酸,其中所述异源性核酸可操作地连接至由所述融合蛋白调控的启动子。遗传修饰的宿主细胞中的稳定化构建体为高产物产率细胞提供了生长有利条件,和对于低生成者或非生成者的自发突变细胞提供了生长不利条件,因此稳定了发酵过程中异源性非分解代谢化合物的生成。此外,麦芽糖依赖性降解决定子提供了融合蛋白的翻译后控制,所述融合蛋白包含与麦芽糖依赖性降解决定子框内融合的转录调控因子。通过操纵培养基中麦芽糖的含量,可控制麦芽糖依赖性降解决定子的稳定性,从而控制转录调控因子的翻译后稳定性和活性水平。此举转而又为生成异源性非分解代谢化合物提供了附加的稳定层。

在一些实施方案,融合蛋白包含与麦芽糖依赖性降解决定子框内融合的转录激活因子。在其中一个实施方案,选择转录激活因子gal4p作为融合蛋白中的转录调控因子。对于此实施方案,包含本发明所述的异源性核酸的遗传修饰的宿主细胞可在生成阶段期间在包含麦芽糖的培养基中进行培养。与麦芽糖结合的稳定融合蛋白转而可激活可操作地连接至gal4p响应型启动子的异源性核酸的表达,以表达生成非分解代谢化合物和影响细胞生长的蛋白的生物合成途径的酶。当麦芽糖依赖性降解决定子与转录激活因子框内融合时,调节子(例如,gal80p)的任何内源性转录抑制因子可被功能性破坏,使得其不干扰融合蛋白的活性。

在其他实施方案,融合蛋白包含与麦芽糖依赖性降解决定子框内融合的转录抑制因子。譬如,选择转录抑制因子gal80p作为融合蛋白中的转录调控因子。对于此实施方案,包含本发明所述的异源性核酸的遗传修饰的宿主细胞可在发酵的细胞生物量构建阶段期间在包含麦芽糖和必需化合物的培养基中进行培养。如此,与麦芽糖结合的融合蛋白中的转录抑制因子是稳定的,从而抑制gal4p的活性。此举转而抑制了编码用于在发酵的细胞生物量构建阶段期间生成非分解代谢化合物和影响细胞生长的蛋白的生物合成途径的一种或多种酶的异源性核酸的表达。

在一些实施方案,与本发明所述的非分解代谢化合物生成有关的任何麦芽糖依赖性降解决定子、融合蛋白、麦芽糖基诱导物、麦芽糖响应型启动子、培养条件和其他特征均可与稳定化构建体组合使用,以进一步改善由遗传修饰的宿主细胞生成非分解代谢化合物的量和稳定性。此外,与第6.5节和其他章节中描述的与非分解代谢化合物的生成和细胞生物量的构建有关的其他细节适用于包含本发明提供的麦芽糖依赖性降解决定子和稳定化构建体的组合物和方法。

6.8遗传修饰的宿主细胞

本发明提供了遗传修饰的宿主细胞,其包含编码本发明所述融合蛋白的异源性核酸。在某些实施方案,遗传修饰的宿主细胞是包含编码融合蛋白的异源性核酸的微生物(例如,遗传修饰的酿酒酵母(saccharomycescerevisiae)细胞),当麦芽糖依赖性降解决定子与麦芽糖接触时,与麦芽糖依赖性降解决定子不与麦芽糖接触时相比,所述融合蛋白更稳定。

在某些实施方案,编码融合蛋白的异源性核酸与宿主细胞中的麦芽糖响应型启动子可操作地连接。对于此类宿主细胞,可在合适的时间点调整培养基中的麦芽糖含量以激活(或增加)融合蛋白的dna编码序列的转录,并提高由其编码的融合蛋白的翻译后稳定性。

可进一步修饰根据某些实施方案所述的遗传修饰的宿主细胞以生成异源性非分解代谢化合物(例如,乙酰辅酶a衍生的化合物)。譬如,遗传修饰的宿主细胞可进一步包含编码用于生成非分解代谢化合物的生物合成途径的一种或多种酶的异源性核苷酸序列。在所述这些实施方案中,与缺乏本发明所述遗传修饰的亲本宿主细胞相比,遗传修饰的宿主细胞可生成更大量的由乙酰-coa生物合成的一种或多种化合物。

在某些实施方案,本发明提供了遗传修饰的宿主细胞,其包含用于稳定生成异源性非分解代谢化合物的稳定化构建体。在某些实施方案,本发明提供的遗传修饰的宿主细胞包含编码用于生成异源性非分解代谢化合物的生物合成途径的一种或多种酶的一种或多种异源性核酸,和编码一种或多种影响细胞生长的蛋白的一种或多种异源性核酸,其中所述异源性核酸中每一种与共同调控的启动子可操作地连接。

在某些实施方案,可将本发明所述的核酸和构建体的各种组合和亚组合引入遗传修饰的宿主细胞中,以稳定编码用于生成非分解代谢化合物的生物合成酶的异源性核酸的表达。譬如,可进一步修饰生成异源性非分解代谢化合物的宿主细胞以包含本发明所述的稳定化构建体和融合蛋白。

可使用本发明所述或本领域已知的任何合适的载体将本发明所述的异源性核酸引入宿主细胞中。使用表达载体或染色体整合构建体使宿主细胞进行遗传修饰的方法,例如实现在宿主细胞中增加一种或多种非分解代谢化合物的生成,是本领域众所周知的。参见,例如sherman,f.,etal.,methodsyeastgenetics,coldspringharborlaboratory,n.y.(1978);guthrie,c.,etal.(eds.)guidetoyeastgeneticsandmolecularbiologyvol.194,academicpress,sandiego(1991);sambrooketal.,2001,molecularcloning--alaboratorymanual,3rdedition,coldspringharborlaboratory,coldspringharbor,ny;和ausubeletal.,eds.,currentedition,currentprotocolsinmolecularbiology,greenepublishingassociatesandwileyinterscience,ny.;所述文献公开内容通过引用并入本文。此外,抑制基因表达(例如,导致细胞中一种或多种非分解代谢化合物的生成量增加)可通过缺失、突变和/或基因重排来完成。也可使用反义rna、sirna、mirna、核酶、三链dna以及转录和/或翻译抑制剂来进行。此外,可使用转座子来破坏基因表达,譬如,通过将其插入到启动子和编码区之间,或两个相邻基因之间,以使一个或两个基因失活。

在一些实施方案,细胞中非分解代谢化合物的生成量增加是通过使用表达载体来表达特定蛋白,例如,如上所述的参与生物合成途径的蛋白来实现。通常,表达载体是重组多核苷酸分子,其包含与编码多肽的核苷酸序列可操作地连接的复制信号和表达控制序列,例如启动子和终止子。用于表达编码多肽的核苷酸序列的表达载体包括病毒载体(例如,逆转录病毒类、腺病毒类和腺相关病毒类)、质粒载体和粘粒。适用于酵母细胞的表达载体的示例性实例包括但不限于cen/ars和2μ质粒。适用于酵母细胞的启动子的示例性实例包括但不限于,乳酸克鲁维酵母(k.lactis)的tef1基因的启动子,酿酒酵母(saccharomycescerevisiae)的pgk1基因的启动子,酿酒酵母的tdh3基因的启动子,抑制型启动子,例如酿酒酵母的ctr3基因的启动子,和诱导型启动子,例如酿酒酵母的半乳糖诱导型启动子(如gal1、gal7和gal10基因的启动子)。

可通过本领域技术人员已知的任何方法将表达载体和染色体整合构建体引入宿主细胞中,而没有限制。参见,例如hinnenetal.,proc.natl.acad.sci.usa75:1292-3(1978);creggetal.,mol.cell.biol.5:3376-3385(1985);美国专利号5,272,065;goeddeletal.,eds,1990,methodsinenzymology,vol.185,academicpress,inc.,ca;krieger,1990,genetransferandexpression--alaboratorymanual,stocktonpress,ny;sambrooketal.,1989,molecularcloning--alaboratorymanual,coldspringharborlaboratory,ny;和ausubeletal.,eds.,currentedition,currentprotocolsinmolecularbiology,greenepublishingassociatesandwileyinterscience,ny。示例性技术包括但不限于,原生质球、电穿孔、peg1000介导的转化、以及乙酸锂或氯化锂介导的转化。

6.8.1.宿主细胞

可用于本发明提供的方法和组合物中的细胞包括能够生成融合蛋白的任何细胞。在一些实施方案,细胞能够天然或重组生成非分解代谢化合物,例如类异戊二烯、聚酮化合物、脂肪酸等。在一些实施方案,所述细胞是原核细胞。在一些实施方案,所述细胞是细菌细胞。在一些实施方案,所述细胞是大肠杆菌(escherichiacoli)细胞。在一些实施方案,所述细胞是真核细胞。在一些实施方案中,所述细胞是酵母细胞。在一些实施方案,所述细胞是酿酒酵母(saccharomycescerevisiae)细胞。在一些实施方案,所述细胞是哺乳动物细胞。在一些实施方案,所述细胞是中国仓鼠卵巢(cho)细胞,cos-7细胞,小鼠成纤维细胞,小鼠胚胎癌细胞,或小鼠胚胎干细胞。在一些实施方案,所述细胞是昆虫细胞。在一些实施方案,所述细胞是s2细胞,施耐德(schneider)细胞,s12细胞,5b1-4细胞,tn5细胞,或sf9细胞。在一些实施方案,所述细胞是单细胞真核生物细胞,例如微生物细胞。

在一些实施方案,所述细胞是菌丝细菌细胞。在一些实施方案,所述菌丝细菌细胞属于放线菌属。在具体实施方案中,所述菌丝细菌细胞属于链霉菌属(streptomyces),譬如,产二素链霉菌(streptomycesambofaciens)、阿佛曼链霉菌(streptomycesavermitilis)、远青链霉菌(streptomycesazureus)、肉桂地链霉菌(streptomycescinnamonensis)、天蓝色链霉菌(streptomycescoelicolor)、curacoi链霉菌(streptomycescuracoi)、红霉素链霉菌(streptomyceserythraeus)、新霉素链霉菌(streptomycesfradiae)、加利利链霉菌(streptomycesgalilaeus)、淡青链霉菌(streptomycesglaucescens)、吸水链霉菌(streptomyceshygroscopicus)、变铅青链霉菌(streptomyceslividans)、微小链霉菌(streptomycesparvulus)、波塞链霉菌(streptomycespeucetius)、龟裂链霉菌(streptomycesrimosus)、玫瑰暗黄链霉菌(streptomycesroseofulvus)、耐热链霉菌(streptomycesthermotolerans)、紫红链霉菌(streptomycesviolaceoruber)。

在另一实施方案,所述细胞是真菌细胞。在更具体的实施方案中,所述细胞是酵母细胞。可用于本发明提供的方法和组合物中的酵母包括已保藏在微生物保藏库(例如,ifo、atcc等)中,且属于芽孢酵母属(aciculoconidium),神食酵母属(ambrosiozyma),节束酵母属(arthroascus),arxiozyma属,阿舒囊霉属(ashbya),babjevia属,本森顿酵母属(bensingtonia),葡萄藻属(botryoascus),botryozyma属,酒香酵母属(brettanomyces),布勒掷孢酵母属(bullera,bulleromyces),假丝酵母属(candida),固囊酵母属(citeromyces),棒孢酵母属(clavispora),隐球酵母菌属(cryptococcus),产黑色素酵母属(cystofilobasidium),德巴利酵母属(debaryomyces),德克酵母属(dekkara),拟双足囊菌属(dipodascopsis),双足囊菌属(dipodascus),eeniella属,endomycopsella属,eremascus属,假囊酵母属(eremothecium),担孢酵母属(erythrobasidium),fellomyces属,丝黑粉酵母属(filobasidium),耐碱酵母属(galactomyces),地丝菌属(geotrichum),季氏酵母属(guilliermondella),有孢汉逊酵母属(hanseniaspora),汉逊酵母属(hansenula),hasegawaea属,胶珊瑚属(holtermannia),hormoascus属,生丝毕赤酵母属(hyphopichia),伊萨酵母属(issatchenkia),克勒克酵母属(kloeckera),kloeckeraspora属,克鲁维酵母菌属(kluyveromyces),kondoa属,kuraishia属,克氏担孢酵母属(kurtzmanomyces),白冬孢酵母属(leucosporidium),油脂酵母属(lipomyces),路德酵母属(lodderomyces),马拉色氏霉菌属(malassezia),梅奇酵母属(metschnikowia),木拉克酵母属(mrakia),myxozyma属,拿逊酵母属(nadsonia),nakazawaea属,针孢酵母属(nematospora),ogataea属,卵孢酵母属(oosporidium),管囊酵母属(pachysolen),phachytichospora属,法夫酵母属(phaffia),毕赤酵母属(pichia),红冬孢酵母属(rhodosporidium),红酵母属(rhodotorula),酵母属(saccharomyces),类酵母属(saccharomycodes),复膜孢酵母属(saccharomycopsis),齐藤酵母属(saitoella),sakaguchia属,saturnospora属,裂芽酵母属(schizoblastosporion),裂殖酵母属(schizosaccharomyces),许旺酵母属(schwanniomyces),锁掷酵母属(sporidiobolus),掷孢酵母属(sporobolomyces),原孢酵母属(sporopachydermia),冠孢酵母属(stephanoascus),梗孢酵母属(sterigmatomyces),拟梗抱酵母(sterigmatosporidium),symbiotaphrina属,合轴酵母属(sympodiomyces),sympodiomycopsis属,有孢圆酵母属(torulaspora),trichosporiella属,丝孢酵母属(trichosporon),三角酵母属(trigonopsis),tsuchiyaea属,udeniomyces属,waltomyces属,威克酵母属(wickerhamia),拟威克酵母属(wickerhamiella),拟威尔酵母属(williopsis),yamadazyma属,亚罗酵母属(yarrowia),接合囊酵母属(zygoascus),接合酵母属(zygosaccharomyces),接合拟威尔酵母属(zygowilliopsis),和zygozyma属等等。

在具体实施方案中,本发明提供的方法和组合物中有用的酵母包括酿酒酵母(saccharomycescerevisiae),毕赤酵母(pichiapastoris),粟酒裂殖酵母(schizosaccharomycespombe),布鲁塞尔德克酵母(dekkerabruxellensis),乳酸克鲁维酵母(kluyveromyceslactis,此前称为乳酸酵母),马克思克鲁维酵母(kluveromycesmarxianus),arxulaadeninivorans,或多形汉森酵母(现称为安格斯毕赤酵母)。在一些实施方案,所述微生物是假丝酵母属(candida)的菌株,如解脂假丝酵母(candidalipolytica),吉利蒙假丝酵母(candidaguilliermondii),克鲁斯假丝酵母(candidakrusei),拟热带假丝酵母(candidapseudotropicalis),或产朊假丝酵母(candidautilis)。

在具体实施方案中,所述细胞是酿酒酵母细胞。在一些实施方案,所述酿酒酵母细胞的菌株选自由贝克氏(baker's)酵母、cbs7959、cbs7960、cbs7961、cbs7962、cbs7963、cbs7964、iz-1904、ta、bg-1、cr-1、sa-1、m-26、y-904、pe-2、pe-5、vr-1、br-1、br-2、me-2、vr-2、ma-3、ma-4、cat-1、cb-1、nr-1、bt-1和al-1组成的组。在一些实施方案,所述酿酒酵母的菌株选自由pe-2、cat-1、vr-1、bg-1、cr-1、和sa-1组成的组。在具体实施方案,所述酿酒酵母的菌株是pe-2。在另一具体实施方案,所述酿酒酵母的菌株是cat-1。在另一具体实施方案,所述酿酒酵母的菌株是bg-1。

在一些实施方案,所述细胞是单倍体微生物细胞。在其他实施方案,所述细胞是二倍体微生物细胞。在一些实施方案,所述细胞是杂合的。在其他实施方案,除了其交配型等位基因外,所述细胞是纯合的(即,如果细胞应形成孢子,则所得的四个单倍体微生物细胞除了它们的交配型等位基因在遗传上是相同的,其中在两个单倍体细胞中将是交配型a,而在另外两个单倍体细胞中将是交配型α)。

在一些实施方案,所述细胞是适于工业发酵(例如,生物乙醇发酵)的细胞。在具体的实施方案中,所述细胞习惯于在高溶剂浓度、高温、扩大的底物利用率、营养限制、由此生成的渗透压、酸性、亚硫酸盐和细菌污染、或其组合中存活,这些均是公认的工业发酵环境。

下文提供了示例性非分解代谢化合物生成细胞,例如,重组生成类异戊二烯、聚酮化合物和脂肪酸的细胞,以及生成此类细胞的方法。

6.9培养基和条件

用于培养物的维持和生长的材料和方法是微生物学或发酵科学领域的技术人员所熟知的(参见如baileyetal.,biochemicalengineeringfundamentals,secondedition,mcgrawhill,newyork,1986)。必须考虑适当的培养基、ph值、温度以及需氧、微氧或厌氧条件的要求,这取决于宿主细胞、发酵和过程方法的特定要求。

生成本发明提供的非分解代谢化合物的方法可在合适的培养基、在合适的容器(包括但不限于细胞培养板、烧瓶或发酵罐)中进行。此外,所述方法可以本领域已知的任何发酵规模进行,以支持微生物产品的工业生成。可使用任何合适的发酵罐,包括搅拌釜发酵罐、气升式发酵罐、泡沫发酵罐或其任何组合。在利用酿酒酵母作为宿主细胞的具体实施方案中,菌株可在发酵罐中生长,详细描述参见kosaric,etal,inullmann'sencyclopediaofindustrialchemistry,sixthedition,volume12,pages398-473,wiley-vchverlaggmbh&co.kdaa,weinheim,germany。此外,所述方法可以任何发酵体积进行,譬如,从实验室规模(例如约10ml至20l)发酵至中试规模(例如约20l至500l)发酵至工业规模(例如约500l至≥500,000l)发酵。

在一些实施方案,用于在本发明提供的生成非分解代谢化合物的方法中使用的培养基包括其中能够生成非分解代谢化合物的经遗传修饰的微生物可存活即支持并维持生长和生存力的任何培养基。在一些实施方案,所述培养基还促进生成所需非分解代谢化合物所必需的生物合成途径。

在一些实施方案,所述培养基是包含可同化的碳、氮和磷酸盐源的水性介质。此类介质还可包括适当的盐类、矿物质类、金属类和其他营养物类。在一些实施方案,将所述碳源和每种必需细胞营养物增量地或连续地添加到发酵培养基中,并将每种所需营养物保持在基本上通过使细胞生长,譬如,根据基于将碳源转化成生物量的细胞的代谢或呼吸功能的预定细胞生长曲线,有效同化所需的最低水平。

用于培养微生物的合适的条件和合适的培养基在本领域是众所周知的。在一些实施方案,合适的培养基补充有一种或多种附加试剂,例如诱导物(例如,当编码基因产物的一个或多个核苷酸序列处于诱导型启动子的控制下时),阻遏物(例如,当编码基因产物的一个或多个核苷酸序列处于阻抑型启动子控制下时),或选择剂(例如,选择包含遗传修饰的微生物的抗生素)。

在一些实施方案,所述碳源是单糖(简单糖类)、二糖、多糖、不可发酵的碳源、或其一种或多种组合。合适的单糖的非限制性实例包括葡萄糖、半乳糖、甘露糖、果糖、核糖、和其组合。合适的二糖的非限制性实例包括蔗糖、乳糖、麦芽糖、海藻糖、纤维二糖、和其组合。合适的多糖的非限制性实例包括淀粉、糖原、纤维素、几丁质、和其组合。合适的不可发酵碳源的非限制性实例包括乙酸盐和甘油。在一些实施方案,可使用包含碳源的不同组合的甘蔗糖浆。

培养基中的碳源例如葡萄糖的浓度应促进细胞生长,但不能高到抑制所用微生物的生长。通常,向培养物中添加一定水平的碳源(例如葡萄糖)以达到所需的生长水平和生物量水平,但达不到检测水平(检测限为约<0.1g/l)。在其他实施方案,培养基中的碳源(例如葡萄糖)的浓度大于约1g/l,典型地大于约2g/l,典型地大于约5g/l。此外,培养基中的碳源(例如葡萄糖)的浓度通常小于约100g/l,典型地小于约50g/l,和更典型地小于约20g/l。有时碳源的浓度在短时间内可大于100g/l,例如,当细胞初始添加至发酵罐时。应注意的是,提及培养物组分浓度可以指初始和/或正在进行的组分浓度。在一些情况下,可能需要在培养期间使培养基变得耗尽碳源。

可在合适的培养基中使用的可同化氮源包括但不限于简单氮源、有机氮源和复合氮源。此类氮源包括无水氨、铵盐、以及动物、植物和/或微生物来源的物质。合适的氮源包括但不限于蛋白水解产物、微生物生物量水解产物、蛋白胨、酵母提取物、硫酸铵、尿素和氨基酸。可将任何合适量的氮源加至培养基中。此外,在一些情况下,可能需要在培养期间使培养基变得耗尽氮源。

有效的培养基可含有其他化合物,如无机盐类、维生素类、微量金属类或生长促进剂类。此类其他化合物也可存在于有效培养基中的碳源、氮源或矿物源中,或者可特定地加至培养基中。

培养基还可含有合适的磷酸盐源。此类磷酸盐源包括无机和有机磷酸盐源。优选的磷酸盐源包括但不限于磷酸盐类如磷酸一钠或磷酸二钠和磷酸钾、磷酸铵及其混合物。可将任何合适量的磷酸盐源加至培养基中。

合适的培养基还可包括镁源,优选以生理学上可接受的盐形式,如七水合硫酸镁,尽管也可以使用浓度相似的镁的其他镁源。可将任何合适量的镁源加至培养基中。此外,在一些情况下,可能需要在培养期间使培养基变得耗尽镁源。

在一些实施方案,培养基还可包含生物学上可接受的螯合剂,例如柠檬酸三钠的二水合物。任何合适量的螯合剂可加至培养基中。

所述培养基最初还可包含生物学上可接受的酸或碱以维持培养基的所需ph值。生物学上可接受的酸包括但不限于盐酸、硫酸、硝酸、磷酸及其混合物。生物学上可接受的碱包括但不限于氢氧化铵、氢氧化钠、氢氧化钾及其混合物。在一些实施方案,所使用的碱是氢氧化铵。

在一些实施方案,所述培养基还可包含生物学上可接受的钙源,包括但不限于氯化钙。在一些实施方案,所述培养基还可包含氯化钠。在一些实施方案,所述培养基还可包含痕量金属。此类痕量金属可作为储备溶液加至培养基中,为了方便起见,可与其余培养基分开制备。可向培养基中加入任何合适量的钙源、氯化钠和痕量金属。

所述培养基可包括其他维生素,如生物素、钙、泛酸盐、肌醇、吡哆醇-hcl和硫胺素-hcl。可将此类维生素作为储备溶液加至培养基中,为了方便起见,其可与其余培养基分开制备。然而,向培养基中添加维生素超过一定浓度对于微生物的生长是不利的。

本发明所述的发酵方法可以常规培养模式进行,所述培养模式包括但不限于分批、补料分批、细胞再循环、连续和半连续。在一些实施方案中,所述发酵以补料分批模式进行。在此种情况下,在发酵的生成阶段期间培养基中的一些组分被耗尽。在一些实施方案,所述培养物可在开始时例如在生成阶段补充相对高浓度的这种组分,使得生长和/或非分解代谢化合物生成在需要添加之前支持一段时间。所述这些组分的优选范围在整个培养过程中通过进行添加来维持,因为组分水平通过培养耗尽。所述培养基中组分的水平可通过例如定期取样培养基并测定浓度来进行监测。或者,一旦开发了标准培养程序,可在整个培养的特定时间以对应于已知水平的时间间隔进行添加。如本领域技术人员将认识到的,随着培养基的细胞密度增加,培养期间营养物的消耗速率增加。此外,为了避免将外来微生物引入培养基中,如本领域已知的那样,使用无菌添加方法进行添加。此外,在培养过程中可加入少量的消泡剂。

培养基的温度可以是适于经遗传修饰的细胞生长和/或非分解代谢化合物生成的任何温度。譬如,在用接种物接种培养基之前,可使培养基保持在约20℃至约45℃的温度范围内,通常保持在从约25℃至约40℃,和更典型地在约28℃至约34℃的温度范围内。

培养基的ph值可通过向培养基中加入酸或碱来控制。在使用氨来控制ph值的情况下,其在培养基中也可方便地作为氮源。优选地,将ph值保持在约3.0至约8.0,典型地约3.5至约7.0,更典型地约4.0至约6.5。

在一些实施方案,在培养期间监测培养基的碳源浓度,例如麦芽糖或葡萄糖浓度。培养基的葡萄糖浓度可使用已知技术来监测,譬如,使用葡萄糖氧化酶测试或高压液相色谱法,其可用于监测上层清液中的葡萄糖浓度,例如培养基的无细胞组分和麦芽糖水平可类似地监测。如前所述,所述碳源浓度应保持在发生细胞生长抑制的水平以下。尽管此浓度可能会因生物体而异,但对于作为碳源的葡萄糖,在葡萄糖浓度大于约60g/l时可能发生细胞生长抑制,并且可通过试验容易地确定。因此,当使用葡萄糖作为碳源时,优选将葡萄糖送入发酵罐并维持在检测限以下。或者,培养基中的葡萄糖浓度维持在约1g/l至约100g/l的范围内,典型地在约2g/l至约50g/l的范围内,和有时在约5g/l至约20g/l的范围内。尽管通过添加例如基本上纯的葡萄糖溶液可将碳源浓度保持在所需水平内,但可通过添加等份的原始培养基来维持培养基的碳源浓度。原始培养基的等分试样的使用可能是合乎需要的,因为培养基中其他营养物(例如,氮源和磷源)的浓度可同时保持。同样,痕量金属浓度可通过加入等份的痕量金属溶液而保持在培养基中。

6.10非分解代谢化合物的回收

一旦宿主细胞生成非分解代谢物,就可使用本领域已知的任何合适的分离和纯化方法将其回收或分离用于随后的应用。在一些实施方案,包含非分解代谢物的有机相可通过离心从发酵中分离。在其他实施方案,包含非分解代谢化合物的有机相可自发地从发酵中分离。在其他实施方案,通过向发酵反应中加入破乳剂和/或成核剂,将包含非分解代谢衍生化合物的有机相从发酵中分离出来。破乳剂的示例性实例包括絮凝剂和凝结剂。成核剂的示例性实例包括非分解代谢化合物本身的液滴和有机溶剂如十二烷、肉豆蔻酸异丙酯和油酸甲酯。

在所述这些细胞中生成的非分解代谢化合物可存在于培养上层清液中和/或与宿主细胞结合。在所述非分解代谢化合物与宿主细胞结合的实施方案中,非分解代谢化合物的回收可包括透化或裂解细胞的方法。另外或同时,培养基中的非分解代谢物可使用包括但不限于色谱法、提取法、溶剂提取法、膜分离法、电渗析法、反渗透法、蒸馏法、化学衍生法和结晶法的回收方法进行回收。

在一些实施方案,所述非分解代谢化合物可与可能存在于有机相中的其他产物分离。在一些实施方案,使用吸附法、蒸馏法、气-液萃取法(汽提)、液-液萃取法(溶剂萃取)、超滤法和标准色谱技术来实现分离。

在一些实施方案,所述回收的非分解代谢化合物是纯的,例如至少约40%纯,至少约50%纯,至少约60%纯,至少约70%纯,至少约80%纯,至少约90%纯,至少约95%纯,至少约98%纯,或98%纯以上,其中在非分解代谢化合物的背景下,“纯”是指不含其它非分解代谢化合物、污染物等的非代谢分解化合物。

6.11类异戊二烯的生成

在一些实施方案,所述非分解代谢化合物是类异戊二烯。类异戊二烯衍生自异戊烯焦磷酸(ipp),其可通过甲羟戊酸依赖性(“mev”)途径或1-脱氧-d-木酮糖5-二磷酸(“dxp”)途径的酶进行生物合成。

6.11.1.mev途径

在本发明所述方法的一些实施方案中,经遗传修饰的微生物包含编码mev途径的一种或多种酶的一种或多种异源性核苷酸序列,与未经遗传修饰的亲本细胞相比,其增加了一种或多种类异戊二烯化合物的生成量。

在一些实施方案,所述类异戊二烯生成细胞包含编码可缩合两分子乙酰辅酶a以形成乙酰乙酰辅酶a的酶(如乙酰辅酶a硫解酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(nc_000913region:2324131.2325315;大肠杆菌),(d49362;脱氮副球菌),和(l20428;酿酒酵母)。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使乙酰乙酰辅酶a与另一分子乙酰辅酶a缩合以形成3-羟基-3-甲基戊二酰-辅酶a(hmg-coa)的酶(如hmg-coa合酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(nc_001145.补体19061.20536;酿酒酵母),(x96617;酿酒酵母),(x83882;拟南芥),(ab037907;griseola北里孢菌),(bt007302;智人),和(nc_002758,基因座标记sav2546,基因id1122571;金黄色酿脓葡萄球菌)。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使hmg-coa转化为甲羟戊酸的酶(如hmg-coa还原酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(nm_206548;黑腹果蝇),(nc_002758,基因座标记sav2545,基因id1122570;金黄色酿脓葡萄球菌),(nm_204485;原鸡),(ab015627;链霉菌属.ko3988),(af542543;野生烟草),(ab037907;griseola北里孢菌),(ax128213,提供编码截短的hmgr的序列;酿酒酵母),和(nc_001145:补体115734.118898;酿酒酵母)。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使甲羟戊酸转化为甲羟戊酸5-磷酸的酶(如甲羟戊酸激酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(l77688;拟南芥),和(x55875;酿酒酵母)。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶(如磷酸甲羟戊酸激酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(af429385;巴西橡胶树),(nm_006556;智人),和(nc_001145.补体712315.713670;酿酒酵母)。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使甲羟戊酸5-焦磷酸转化为ipp的酶(如甲羟戊酸焦磷酸脱羧酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(x97557;酿酒酵母),(af290095;屎肠球菌),和(u49260;智人)。

在一些实施方案,所述类异戊二烯生成细胞包含编码mev途径的多于一种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码mev途径的两种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码可使hmg-coa转化为甲羟戊酸的酶和编码可使甲羟戊酸转化为甲羟戊酸5-磷酸的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码mev途径的三种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码mev途径的四种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码mev途径的五种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码mev途径的六种酶的一种或多种异源性核苷酸序列。

在一些实施方案,所述类异戊二烯生成细胞还包含编码可使经由mev途径生成的ipp转化为其异构体二甲基烯丙基焦磷酸(“dmapp”)的酶的异源性核苷酸序列。dmapp可通过各种其他酶的作用进行缩合和修饰,以形成简单和更复杂的类异戊二烯(图.2)。

6.11.2.dxp途径

在本发明所述方法的一些实施方案中,所述类异戊二烯生成细胞包含编码dxp途径的一种或多种酶的一种或多种异源性核苷酸序列,与未经遗传修饰的亲本细胞相比,其增加了一种或多种类异戊二烯化合物的生成量。

在一些实施方案,所述类异戊二烯生成细胞包含编码可缩合两分子乙酰辅酶a以形成乙酰乙酰辅酶a的酶(如乙酰辅酶a硫解酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(nc_000913region:2324131.2325315;大肠杆菌),(d49362;脱氮副球菌),和(l20428;酿酒酵母)。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使丙酮酸与d-甘油醛3-磷酸缩合以制备1-脱氧-d-木酮糖-5-磷酸的酶(如1-脱氧-d-木酮糖-5-磷酸合酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(af035440;大肠杆菌),(nc_002947,基因座标记pp0527;恶臭假单胞菌kt2440),(cp000026,基因座标记spa2301;甲型副伤寒沙门氏菌,参见atcc9150),(nc_007493,基因座标记rsp_0254;类球红细菌2.4.1),(nc_005296,基因座标记rpa0952;沼泽红假单胞菌cga009),(nc_004556,基因座标记pd1293;特曼库拉木质部难养菌(xylellafastidiosatemecula1)),和(nc_003076,基因座标记at5g11380;拟南芥)。

在一些实施方案,所述类异戊二烯生成细胞包含编码酶如1-脱氧-d-木酮糖-5-磷酸还原异构酶的异源性核苷酸序列,所述酶可使1-脱氧-d-木酮糖-5-磷酸转化为2-c-甲基-d-赤藓糖醇-4-磷酸。核苷酸序列的示例性实例包括但不限于:(ab013300;大肠杆菌),(af148852;拟南芥),(nc_002947,基因座标记pp1597;恶臭假单胞菌kt2440),(al939124,基因座标记sco5694;天蓝色链霉菌a3(2)),(nc_007493,基因座标记rsp_2709;类球红细菌2.4.1),和(nc_007492,基因座标记pfl_1107;荧光假单胞菌pfo-1)。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使2c-甲基-d-赤藓糖醇-4-磷酸转化为4-二磷酸胞苷-2c-甲基-d-赤藓糖醇的酶(如4-二磷酸胞苷-2c-甲基-d-赤藓糖醇合酶)的异源性核苷酸序列。核苷酸序列的示例性实例包括但不限于:(af230736;大肠杆菌),(nc_007493,基因座标记rsp_2835;类球红细菌2.4.1),(nc_003071,基因座标记at2g02500;拟南芥),和(nc_002947,基因座标记pp1614;恶臭假单胞菌kt2440)。

在一些实施方案,所述类异戊二烯生成细胞包含编码酶如4-二磷酸胞苷-2c-甲基-d-赤藓糖醇激酶的异源性核苷酸序列,所述酶可使4-二磷酸胞苷-2c-甲基-d-赤藓糖醇转化为4-二磷酸胞苷-2c-甲基-d-赤藓糖醇-2-磷酸。核苷酸序列的示例性实例包括但不限于:(af216300;大肠杆菌)和(nc_007493,基因座标记rsp_1779;类球红细菌2.4.1)。

在一些实施方案,所述类异戊二烯生成细胞包含编码酶如2c-甲基-d-赤藓糖醇2,4-环二磷酸合酶的异源性核苷酸序列,所述酶可使4-二磷酸胞苷-2c-甲基-d-赤藓糖醇-2-磷酸转化为2c-甲基-d-赤藓糖醇2,4-环二磷酸。核苷酸序列的示例性实例包括但不限于:(af230738;大肠杆菌),(nc_007493,基因座标记rsp_6071;类球红细菌2.4.1),和(nc_002947,基因座标记pp1618;恶臭假单胞菌kt2440)。

在一些实施方案,所述类异戊二烯生成细胞包含编码酶如1-羟基-2-甲基-2-(e)-丁烯基-4-二磷酸合酶的异源性核苷酸序列,所述酶可使2c-甲基-d-赤藓糖醇2,4-环二磷酸转化为1-羟基-2-甲基-2-(e)-丁烯基-4-二磷酸。核苷酸序列的示例性实例包括但不限于:(ay033515;大肠杆菌),(nc_002947,基因座标记pp0853;恶臭假单胞菌kt2440),和(nc_007493,基因座标记rsp_2982;类球红细菌2.4.1)。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使1-羟基-2-甲基-2-(e)-丁烯基-4-二磷酸转化为ipp或其异构体dmapp的酶(如异戊基/二甲基烯丙基二磷酸合酶)的异源性核苷酸序列。核苷酸序列的示例性实例包括但不限于:(ay062212;大肠杆菌)和(nc_002947,基因座标记pp0606;恶臭假单胞菌kt2440)。

在一些实施方案,所述类异戊二烯生成细胞包含编码dxp途径的多于一种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码dxp途径的两种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码dxp途径的三种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码dxp途径的四种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码dxp途径的五种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码dxp途径的六种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码dxp途径的五种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述类异戊二烯生成细胞包含编码dxp途径的七种酶的一种或多种异源性核苷酸序列。

在一些实施方案,所述宿主细胞自身的代谢过程与涉及生成ipp的那些过程之间的“串扰”(或干扰)被最小化或完全消除。譬如,当宿主微生物完全依赖于合成ipp的dxp途径,并且引入mev途径以提供另外的ipp时,串扰被最小化或完全消除。此宿主生物体将不具备改变mev途径酶的表达或处理与mev途径相关的中间体的能力。完全或主要依靠dxp途径的生物体包括例如大肠杆菌(escherichiacoli)。

在一些实施方案,所述宿主细胞经由mev途径唯一地或与dxp途径组合生成ipp。在其他实施方案,宿主的dxp途径被功能性禁用,使得所述宿主细胞仅通过异源引入的mev途径生成ipp。通过使基因表达失活或使一种或多种dxp途径酶的功能失活,dxp途径可被功能性禁用。

在一些实施方案,由所述细胞生成的类异戊二烯是c5类异戊二烯。所述这些化合物衍生自一个异戊二烯单元,也被称为半萜。半萜的示例性实例有异戊二烯。在其他实施方案,所述类异戊二烯是c10类异戊二烯。所述这些化合物衍生自两个异戊二烯单元,也被称为单萜。单萜的示例性实例有柠檬烯、香茅醇(citranellol)、香叶醇、薄荷醇、紫苏醇、芳樟醇、侧柏酮(thujone)和月桂烯。在其他实施方案,所述类异戊二烯是c15类异戊二烯。所述这些化合物衍生自三个异戊二烯单元,也被称为倍半萜。倍半萜烯的示例性实例有蜚蠊酮b、银杏苦内酯b、紫穗槐二烯、青蒿素、青蒿酸、瓦伦烯、诺卡酮、表-雪松醇、表-马兜铃烯、法呢醇、棉酚、sanonin、蜚蠊酮、毛喉素和广藿香醇(也被称为广藿香醇)。在其他实施方案,所述类异戊二烯是c20类异戊二烯。所述这些化合物衍生自四个异戊二烯单元,也被称为二萜。二萜的示例性实例有蓖麻烯、五加素、紫杉醇、prostratin、伪蕨素和紫杉二烯。在其他实施例,所述类异戊二烯是c20+类异戊二烯。所述这些化合物衍生自四个以上的异戊二烯单元,包括:三萜类(由6个异戊二烯单元衍生的c30类异戊二烯化合物),如arbrusidee、鸦胆丁、睾酮、黄体酮、可的松、洋地黄毒甙和角鲨烯;四萜类(衍生自8个类异戊二烯的c40类异戊二烯化合物),如β-胡萝卜素;和多萜类(衍生自多于8个异戊二烯单元的c40+类异戊二烯化合物),如聚异戊二烯。在一些实施方案,所述类异戊二烯选自由以下组成的组:松香二烯(abietadiene)、紫穗槐二烯、蒈烯、α-法呢烯、β-法呢烯、法呢醇、香叶醇、香叶基香叶醇、异戊二烯、里哪醇、柠檬烯、月桂烯、橙花叔醇、罗勒烯、广藿香醇、β-蒎烯、桧烯、γ-萜品烯、萜品油烯和瓦伦烯。类异戊二烯化合物还包括但不限于类胡萝卜素类(如番茄红素、α-和β-胡萝卜素、α-和β-隐黄素、胭脂素、玉米黄质、虾青素和叶黄素),类固醇化合物类,和由其他化学基团如混合萜类生物碱和辅酶q-10修饰的类异戊二烯组成的化合物类。

在一些实施方案,所述类异戊二烯生成细胞还包含编码可使经由mev途径生成的ipp转化成dmapp的酶(如ipp异构酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(nc_000913,3031087.3031635;大肠杆菌),和(af082326;雨生红球藻)。

在一些实施方案,所述类异戊二烯生成细胞还包含编码聚异戊烯合酶的异源性核苷酸序列,所述聚异戊烯合酶可使ipp和/或dmapp分子缩合以形成含有多于五个碳原子的聚异戊二烯基化合物。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使一分子ipp与一分子dmapp缩合以形成一分子牛龙牛儿醇焦磷酸(“gpp”)的酶(如gpp合酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(af513111;巨冷杉),(af513112;巨冷杉),(af513113;巨冷杉),(ay534686;金鱼草),(ay534687;金鱼草),(y17376;拟南芥),(ae016877,基因座ap11092;蜡样芽胞杆菌;atcc14579),(aj243739;甜橙),(ay534745;仙女扇),(ay953508;齿小蠹),(dq286930;番茄),(af182828;胡椒薄荷),(af182827;胡椒薄荷),(mpi249453;胡椒薄荷),(pze431697,基因座cad24425;产玉米素副球菌(paracoccuszeaxanthinifaciens)),(ay866498;胡黄连),(ay351862;葡萄),和(af203881,基因座aaf12843;运动发酵单胞菌)。

在一些实施方案,所述类异戊二烯生成细胞包含编码可使两分子ipp与一分子dmapp缩合,或将ipp分子添加至gpp分子以形成法呢基焦磷酸(“fpp”)分子的酶(如fpp合酶)的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(atu80605;拟南芥),(athfps2r;拟南芥),(aau36376;黄花蒿),(af461050;普通牛),(d00694;大肠杆菌k-12),(ae009951,基因座aal95523;具核梭杆菌具核亚种atcc25586),(gffppsgen;藤仓赤霉菌),(cp000009,基因座aaw60034;氧化葡糖杆菌621h),(af019892;向日葵),(humfaps;智人),(klpfpsqcr;乳酸克鲁维酵母),(lau15777;白羽扇豆),(lau20771;白羽扇豆),(af309508;小家鼠),(ncfppsgen;粗糙脉孢菌),(pafps1;银胶菊),(pafps2;银胶菊),(ratfaps;褐家鼠),(yscfpp;酿酒酵母),(d89104;粟酒裂殖酵母),(cp000003,基因座aat87386;酿脓链球菌),(cp000017,基因座aaz51849;酿脓链球菌),(nc_008022,基因座yp_598856;酿脓链球菌mgas10270),(nc_008023,基因座yp_600845;酿脓链球菌mgas2096),(nc_008024,基因座yp_602832;酿脓链球菌mgas10750),(mzefps;玉米),(ae000657,基因座aac06913;超嗜热菌vf5),(nm_202836;拟南芥),(d84432,基因座baa12575;枯草芽胞杆菌),(u12678,基因座aac28894;慢生型大豆根瘤菌usda110),(bacfdps;嗜热脂肪土芽孢杆菌),(nc_002940,基因座np_873754;杜克雷嗜血杆菌35000hp),(l42023,基因座aac23087;流感嗜血杆菌rdkw20),(j05262;智人),(yp_395294;沙克乳杆菌亚种.沙克23k),(nc_005823,基因座yp_000273;钩端螺旋体血清变型(leptospirainterrogansserovar)copenhagenistr.fiocruzl1-130),(ab003187;藤黄微球菌),(nc_002946,基因座yp_208768;淋病奈瑟氏菌fa1090),(u00090,基因座aab91752;根瘤菌属ngr234),(j05091;酿酒酵母),(cp000031,基因座aav93568;silicibacterpomeroyidss-3),(ae008481,基因座aak99890;肺炎链球菌r6),和(nc_004556,基因座np779706;特曼库拉木质部难养菌(xylellafastidiosatemecula1))。

在一些实施方案,所述类异戊二烯生成细胞进一步包含编码可使ipp与dmapp或ipp与fpp结合以形成香叶基香叶基焦磷酸(“ggpp”)的酶的异源性核苷酸序列。编码此种酶的核苷酸序列的示例性实例包括但不限于:(athgerpyrs;拟南芥),(bt005328;拟南芥),(nm_119845;拟南芥),(nz_aajm01000380,基因座zp_00743052;以色列苏云金芽孢杆菌血清型(bacillusthuringiensisserovarisraelensis),atcc35646sq1563),(crggpps;长春花),(nz_aabf02000074,基因座zp_00144509;具核梭杆菌文氏亚种,atcc49256),(gfggppsgn;藤仓赤霉菌),(ay371321;银杏),(ab055496;巴西橡胶树),(ab017971;智人),(mci276129;卷枝毛霉拉斯坦变种(mucorcircinelloidesf.lusitanicus)),(ab016044;小家鼠),(aabx01000298,基因座ncu01427;粗糙脉孢菌),(ncu20940;粗糙脉孢菌),(nz_aakl01000008,基因座zp_00943566;青枯雷尔氏菌uw551),(ab118238;褐家鼠),(scu31632;酿酒酵母),(ab016095;细长聚球藻),(saggps;白芥子),(ssogds;嗜酸热硫化叶菌),(nc_007759,基因座yp_461832;嗜酸互营菌属(syntrophusaciditrophicus)sb),(nc_006840,基因座yp_204095;费希尔氏弧菌es114),(nm_112315;拟南芥),(erwcrte;成团泛菌),(d90087,基因座baa14124;菠萝泛菌),(x52291,基因座caa36538;荚膜红细菌),(af195122,基因座aaf24294;类球红细菌),和(nc_004350,基因座np_721015;变形链球菌ua159)。

在一些实施方案,所述类异戊二烯生成细胞进一步包含编码可修饰聚异戊二烯以形成半萜、单萜、倍半萜、二萜、三萜、四萜、多萜、类固醇化合物、类胡萝卜素、或修饰的类异戊二烯化合物的酶的异源性核苷酸序列。

在一些实施方案,所述异源性核苷酸编码蒈烯合酶。合适的核苷酸序列的示例性实例包括但不限于:(af461460,region43.1926;挪威云杉)和(af527416,region:78.1871;狭叶鼠尾草)。

在一些实施方案,所述异源性核苷酸编码香叶醇合酶。合适的核苷酸序列的示例性实例包括但不限于:(aj457070;细毛樟),(ay362553;罗勒),(dq234300;白苏子种属1864),(dq234299;紫苏柠檬桉种属1861),(dq234298;紫苏柠檬桉种属4935),和(dq088667;紫苏柠檬桉(perillacitriodora))。

在一些实施方案,所述异源性核苷酸编码芳樟醇合酶。合适的核苷酸序列的示例性实例包括但不限于:(af497485;拟南芥),(ac002294,基因座aab71482;拟南芥),(ay059757;拟南芥),(nm_104793;拟南芥),(af154124;黄花蒿),(af067603;仙女扇),(af067602;山字草属植物黄果厚壳桂(clarkiaconcinna)),(af067601;仙女扇),(u58314;仙女扇),(ay840091;番茄),(dq263741;狭叶薰衣草),(ay083653;薄荷柠檬酸),(ay693647;罗勒),(xm_463918;稻),(ap004078,基因座bad07605;稻),(xm_463918,基因座xp_463918;稻),(ay917193;紫苏柠檬桉),(af271259;白苏子),(ay473623;挪威云杉),(dq195274;北美云杉),和(af444798;紫苏变种皱叶品种编号79)。

在一些实施方案,所述异源性核苷酸编码柠檬烯合酶。合适的核苷酸序列的示例性实例包括但不限于:(+)-柠檬烯合酶(af514287,region:47.1867;柠檬)和(ay055214,region:48.1889;藿香)和(-)-柠檬烯合酶(dq195275,region:1.1905;北美云杉),(af006193,region:73.1986;巨冷杉),和(mhc4slsp,region:29.1828;留兰香)。

在一些实施方案中,所述异源性核苷酸编码月桂烯合酶。合适的核苷酸序列的示例性实例包括但不限于:(u87908;巨冷杉),(ay195609;金鱼草),(ay195608;金鱼草),(nm_127982;拟南芥tps10),(nm_113485;拟南芥attps-cin),(nm_113483;拟南芥attps-cin),(af271259;白苏子),(ay473626;挪威云杉),(af369919;挪威云杉),和(aj304839;冬青栎)。

在一些实施方案,所述异源性核苷酸编码罗勒烯合酶。合适的核苷酸序列的示例性实例包括但不限于:(ay195607;金鱼草),(ay195609;金鱼草),(ay195608;金鱼草),(ak221024;拟南芥),(nm_113485;拟南芥attps-cin),(nm_113483;拟南芥attps-cin),(nm_117775;拟南芥attps03),(nm_001036574;拟南芥attps03),(nm_127982;拟南芥tps10),(ab110642;温州蜜柑citmtsl4),和(ay575970;日本百脉根(lotuscorniculatusvar.japonicus))。

在一些实施方案,所述异源核苷酸编码α-蒎烯合酶。合适的核苷酸序列的示例性实例包括但不限于:(+)α-蒎烯合酶(af543530,region(区域):1.1887;火炬松),(-)α-蒎烯合酶(af543527,region:32.1921;火炬松),和(+)/(-)α-蒎烯合酶(agu87909,region:6111892;巨冷杉)。

在一些实施方案,所述异源性核苷酸编码β-蒎烯合酶。合适的核苷酸序列的示例性实例包括但不限于:(-)β-蒎烯合酶(af276072,region:1.1749;黄花蒿)和(af514288,region:26.1834;柠檬)。

在一些实施方案,所述异源性核苷酸编码桧烯合酶。合适的核苷酸序列的示例性示例包括但不限于源自鼠尾草属的af051901,region:26.1798。

在一些实施方案,所述异源性核苷酸编码γ-萜品烯合酶。合适的核苷酸序列的示例性实例包括但不限于:(源自柠檬的af514286,region:30.1832)和(源自温州蜜柑的ab110640,region1.1803)。

在一些实施方案,所述异源性核苷酸编码萜品油烯合酶。合适的核苷酸序列的示例性示例包括但不限于:(源自罗勒的ay693650)和(源自花旗松的ay906866,region:10.1887)。

在一些实施方案,所述异源性核苷酸编码紫穗槐二烯合酶。合适的核苷酸序列的示例性示例是美国专利公开号2004/0005678中的seqidno.37。

在一些实施方案,所述异源性核苷酸编码α-法呢烯合酶。合适的核苷酸序列的示例性实例包括但不限于源自西洋梨品种茹梨(pyruscommuniscultivard'anjou)(梨;基因名称afs1)的dq309034和源自苹果(苹果;基因afs1)的ay182241,参见pechouusetal.,planta219(1):84-94(2004)。

在一些实施方案,所述异源性核苷酸编码β-法呢烯合酶。合适的核苷酸序列的示例性实例包括但不限于源自胡椒薄荷的基因库(genbank)登录号为af024615(薄荷;基因tspa11),和源自黄花蒿的基因库登录号为ay835398,参见picaudetal.,phytochemistry66(9):961-967(2005)。

在一些实施方案,所述异源性核苷酸编码法呢醇合酶。合适的核苷酸序列的示例性实例包括但不限于源自玉米的基因库登录号为af529266和源自酿酒酵母(基因pho8)的基因库登录号为ydr481c,参见song,l.,appliedbiochemistryandbiotechnology128:149-158(2006)。

在一些实施方案,所述异源性核苷酸编码橙花叔醇合酶。合适的核苷酸序列的示例性实例包括但不限于源自玉米(玉米,基因tps1)的af529266。

在一些实施方案,所述异源性核苷酸编码广藿香醇合酶。合适的核苷酸序列的示例性实例包括但不限于源自广藿香的ay508730region:1.1659。

在一些实施方案,所述异源核苷酸编码诺卡酮合酶。合适的核苷酸序列的示例性实例包括但不限于源自甜橙的af441124region:1.1647和源自白苏子的ay917195region:1.1653。

在一些实施方案,所述异源性核苷酸编码松香二烯(abietadiene)合酶。合适的核苷酸序列的示例性实例包括但不限于:(u50768;巨冷杉)和(ay473621;挪威云杉)。

6.12聚酮类化合物的生成

在一些实施方案,所述非分解代谢化合物是聚酮化合物。聚酮类化合物是通过被称为聚酮化合物合酶(pkss)的酶活性的集合催化的连续反应合成得到,所述聚酮化合物合酶(pkss)是大的多酶蛋白复合物,所述复合物含有协调的活性位点基团。聚酮化合物生物合成是从简单的2-,3-,4-碳结构单元例如乙酰-coa、丙酰coa、丁酰-coa及其活化的衍生物,丙二酰-、甲基丙二酰-、和乙基丙二酰-coa开始逐步进行,主要通过丙二酰-coa衍生的单元通过克莱森缩合反应进行脱羧缩合来制备。所述pks基因通常组织在真核生物的细菌和基因簇中的一个操纵子中。已表征了三种类型的聚酮化合物合酶:i型聚酮化合物合酶是大的高度模块化的蛋白,细分为两类:1)迭代pkss,其以循环方式重复使用结构域;以及2)模块化pkss,其包含一系列独立模块且不重复结构域。ii型聚酮化合物合酶均是单官能蛋白的聚集体,和iii型聚酮化合物合酶不使用酰基载体蛋白结构域。

不同于脂肪酸生物合成,其中每个连续的链延长步骤之后是固定的酮还原、脱水和烯酰基还原,如下所述,聚酮化合物生物合成的各个链延长中间体经历全部、一些或没有官能团修饰,生成了大量化学多样的产品。由于使用不同的起始单元和链延长单元以及生成新的立体异构体,复杂程度也会增加。

聚酮化合物合酶完成聚酮化合物合成的顺序(从n端至c端顺序)如下:将最初的碳结构单元启动或加载至酰基载体蛋白上,催化生长中的大环内酯链延伸的延长模块和催化合成的大环内酯释放的终止模块。在此生物合成中有活性的组分结构域或分开的酶功能包括用于加载起始物、增量物和中间体酰基单元的酰基转移酶;保持生长中的大环内酯为硫羟酸酯的酰基载体蛋白;催化链延伸的β-酮酰基合成酶;负责首先还原成醇官能团的β-酮还原酶;脱水得到不饱和硫羟酸酯的脱水酶;催化最终还原成完全饱和的烯酰还原酶;和催化大环内酯释放和环化的硫羟酸酯酶。

在一些实施方案,用于本发明公开的方法的遗传修饰的微生物包含编码可使乙酰辅酶a和丙二酰辅酶a中的至少一个与酰基载体蛋白缩合的酶(如酰基转移酶)的异源性核苷酸序列。

在一些实施方案,本发明公开的经遗传修饰的微生物包含编码酶的异源性核苷酸序列,所述酶(如β-酮酰基合成酶)可使选自由乙酰-coa和丙二酰-coa组成的组的第一反应物与选自由丙二酰-coa或甲基丙二酰-coa组成的组的第二反应物缩合,以形成聚酮化合物产物。

在一些实施方案,所述聚酮化合物生成细胞包含编码酶的异源性核苷酸序列,所述酶(如β-酮还原酶)可使聚酮化合物上的β-酮化学基团还原成β-羟基基团。

在一些实施方案,本发明公开的经遗传修饰的微生物包含编码酶的异源性核苷酸序列,所述酶(如脱水酶)可使聚酮化合物中的烷烃化学基团脱水以生成α,β-不饱和烯烃。

在一些实施方案,所述聚酮化合物生成细胞包含编码酶的的异源性核苷酸序列,所述酶(如烯酰还原酶)可使聚酮化合物中的α,β-双键还原成饱和烷烃。

在一些实施方案,所述聚酮化合物生成细胞包含编码酶的异源性核苷酸序列,所述酶(如硫酯酶)可从酰基载体蛋白水解聚酮化合物。

在一些实施方案,所述聚酮化合物生成细胞包含编码含有ks催化区域的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞包含编码含有at催化区域的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞包含编码含有at催化区域的酶的多于一种的异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞包含编码含有clf催化区域的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞包含编码含有acp活性的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞包含编码含有acp活性的酶的多于一种的异源性核苷酸序列。

在具体的实施方案中,所述聚酮化合物生成细胞包含最小芳香族pks系统,例如分别编码包含ks催化区域的酶、包含at催化区域的酶、包含clf催化区域的酶和包含acp活性的酶的异源性核苷酸序列。在具体的实施方案中,所述聚酮化合物生成细胞包含最小模块化pks系统,例如分别编码包含ks催化区域的酶、包含at催化区域的酶和包含acp活性的酶的异源性核苷酸序列。在另一具体实施方案中,所述聚酮化合物生成细胞包含用于从头合成聚酮化合物的模块化芳香族pks系统,例如分别编码包含ks催化区域的酶、包含at催化区域的一种或多种酶以及包含acp活性的一种或多种酶的异源性核苷酸序列。

在一些实施方案,所述聚酮化合物生成细胞包含最小pks系统,例如最小芳香族pks系统或最小模块化pks系统,其还包含可有助于生成最终产物聚酮化合物的另外的催化活性。在一些实施方案,所述聚酮化合物生成细胞包含编码包含环化酶(cyc)催化区域的酶的一种或多种异源性核苷酸序列,所述环化酶(cyc)催化区域促进新生聚酮化合物主链的环化。在一些实施方案,所述聚酮化合物生成细胞包含编码含有酮还原酶(kr)催化区域的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞包含编码含有芳香酶(aro)催化区域的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞包含编码含有烯酰基还原酶(er)催化区域的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞包含编码含有硫酯酶(te)催化区域的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞还包含编码含有完整acp合酶活性的酶的一种或多种异源性核苷酸序列,所述完整acp合酶活性可实现acp的泛酰巯基乙胺化(pantetheinylation)。

在一些实施方案,所述聚酮化合物生成细胞进一步包含赋予合成后聚酮化合物修饰活性的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞进一步包含编码含有糖基化酶活性的酶的一种或多种异源性核苷酸序列,所述糖基化酶活性可实现聚酮化合物例如需具有抗生素活性的聚酮化合物的合成后修饰。在一些实施方案,所述聚酮化合物生成细胞还包含编码含有羟化酶活性的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞还包含编码含有环氧酶活性的酶的一种或多种异源性核苷酸序列。在一些实施方案,所述聚酮化合物生成细胞还包含编码含有甲基化酶活性的酶的一种或多种异源性核苷酸序列。

在一些实施方案,所述聚酮化合物生成细胞进一步包含编码生物合成酶的一种或多种异源性核苷酸序列,所述生物合成酶包括但不限于,至少一种聚酮化合物合成途径酶和可修饰乙酰-coa化合物以形成诸如大环内酯类化合物、抗生素类化合物、抗真菌剂、细胞抑制化合物、抗胆甾醇血的化合物、抗寄生物化合物、抗球虫药化合物、动物生长促进剂或杀虫剂的聚酮化合物产物的酶。在一些实施方案,所述非分解代谢化合物是多烯。在一些实施方案,所述非分解代谢化合物是环内酯。在一些实施方案,所述非分解代谢化合物包含14、15或16个原子组成的内酯环。在一些实施方案,所述非分解代谢化合物是选自由聚酮化合物大环内酯、抗生素、抗真菌剂、抑制细胞生长剂、抗胆甾醇血药、抗寄生物药、抗球虫药、动物生长促进剂和杀虫剂组成的组的聚酮化合物。

在一些实施方案,所述聚酮化合物生成细胞包含异源性核苷酸序列,譬如,编码pks酶和聚酮化合物修饰酶的序列,其能够生成选自但不限于以下聚酮化合物的聚酮化合物:阿维菌素(参见如美国专利号5,252,474;美国专利号4,703,009;欧洲专利公开号118,367;macneiletal.,1993,“industrialmicroorganisms:basicandappliedmoleculargenetics”;baltz,hegeman,&skatrud,eds.(asm),pp.245-256,“acomparisonofthegenesencodingthepolyketidesynthasesforavermectin,erythromycin,andnemadectin”;macneiletal.,1992,gene115:119-125;和ikedaandomura,1997,chem.res.97:2599-2609);杀念珠菌素(fr008)(参见如huetal.,1994,mol.microbiol.14:163-172);卡波霉素,耐久霉素(参见如berghetal.,biotechnolapplbiochem.1992feb;15(1):80-9);柔红霉素(参见如jbacteriol.1994oct;176(20):6270-80);埃博霉素(参见如pct公开号99/66028;和pct公开号00/031247);红霉素(参见如pct公开号93/13663;美国专利号6,004,787;美国专利号5,824,513;donadioetal.,1991,science252:675-9;和cortesetal.,nov.8,1990,nature348:176-8);fk-506(参见如motamedietal.,1998;eur.jbiochem.256:528-534;和motamedietal.,1997,eur.jbiochem.244:74-80);fk-520(参见如pct公开号00/020601;和nielsenetal.,1991,biochem.30:5789-96);griseusin(参见如yuetal.,jbacteriol.1994may;176(9):2627-34);洛伐他汀(参见如美国专利号5,744,350);frenolycin(参见如khoslaetal.,bacteriol.1993apr;175(8):2197-204;和bibbetal.,gene1994may3;142(1):31-9);榴菌素(参见如shermanetal.,emboj.1989sep;8(9):2717-25;和bechtoldetal.,molgengenet.1995sep20;248(5):610-20);美达霉素(参见如ichinoseetal.,microbiology2003jul;149(pt7):1633-45);莫能菌素(参见如arrowsmithetal.,molgengenet.1992aug;234(2):254-64);无活菌素(参见如femsmicrobiollett.2000feb1;183(1):171-5);七尾霉素(参见如kitaoetal.,jantibiot(tokyo).1980jul;33(7):711-6);奈马克丁(参见如macneiletal.,1993,supra);尼达霉素(参见如pct公开号98/51695;和kakavasetal.,1997,j.bacteriol.179:7515-7522);竹桃霉素(参见如swanetal.,1994,mol.gen.genet.242:358-362;pct公开号00/026349;olanoetal.,1998,mol.gen.genet.259(3):299-308;和pct专利申请公开号wo99/05283);土霉素(参见如kimetal.,gene.1994apr8;141(1):141-2);苦霉素(参见如pct公开号99/61599;pct公开号00/00620;xueetal.,1998,chemistry&biology5(11):661-667;xueetal.,october1998,proc.natl.acad.sci.usa95:1211112116);platenolide(参见如ep公开号791,656;和美国专利号5,945,320);雷帕霉素(参见如schweckeetal.,august1995,proc.natl.acad.sci.usa92:7839-7843;和aparicioetal.,1996,gene169:9-16);利福霉素(参见如pct公开号wo98/07868;和augustetal.,feb.13,1998,chemistry&biology,5(2):69-79);堆囊粘细菌属(参见如美国专利号6,090,601);soraphen(参见如美国专利号5,716,849;schuppetal.,1995,j.bacteriology177:3673-3679);多杀菌素(参见如pct公开号99/46387);螺旋霉素(参见如美国专利号5,098,837);特曲霉素(参见如summersetal.,jbacteriol.1992mar;174(6):1810-20;和shenetal.,jbacteriol.1992jun;174(11):3818-21);四环素(参见如,jamchemsoc.2009dec9;131(48):17677-89);泰乐菌素(参见如美国专利号5,876,991;美国专利号5,672,497;美国专利号5,149,638;欧洲公开号791,655;欧洲公开号238,323;kuhstossetal.,1996,gene183:231-6;和merson-daviesandcundliffe,1994,mol.microbiol.13:349-355);和6-甲基水杨酸(参见如richardsonetal.,metabeng.1999apr;1(2):180-7;和shaoetal.,biochembiophysrescommun.2006jun23;345(1):133-9)。

6.13脂肪酸的生成

在一些实施方案,所述非分解代谢化合物是脂肪酸。脂肪酸通过由脂肪酸合酶催化的乙酰-coa和丙二酰-coa的一系列脱羧克莱森(claisen)缩合反应合成得到。类似于聚酮化合物合酶,脂肪酸合酶并非单一的酶,而是由272kda多功能多肽组成的酶体系,其中底物从一个功能结构域递送至下一个功能结构域。已表征了脂肪酸合酶的两种主要类型:i型脂肪酸合酶是哺乳动物和真菌(尽管真菌和哺乳动物合成酶的结构排列不同)以及cmn细菌群(棒状杆菌、分枝杆菌和诺卡氏菌)共有的单一多功能多肽。在古细菌和真细菌中发现的ii型合酶是一系列参与脂肪酸合成的离散的单功能酶。脂肪酸延长和还原的机制在所述这两类合酶中是相同的,因为负责这些催化事件的酶结构域在这两类之间基本上是同源的。

在脱羧克莱森(claisen)缩合反应中脂肪酸链每次延长之后,通过酮还原酶、脱水酶和烯醇还原酶的连续作用将β-酮基基团还原成完全饱和的碳链。生长中的脂肪酸链在连接至酰基载体蛋白上的这些活性部位之间移动,并且在达到碳链长度为16(棕榈酸)时通过硫酯酶的作用而最终释放。

在一些实施方案,用于本发明公开的方法的遗传修饰的微生物包含编码生物合成酶的异源性核苷酸序列,所述生物合成酶包括但不限于,至少一种脂肪酸合成途径酶和可修饰乙酰辅酶a化合物以形成脂肪酸产物例如棕榈酸、棕榈酰辅酶a、棕榈油酸、6(z)-十六碳烯酸(sapienicacid)、油酸、亚油酸、α-亚麻酸、花生四烯酸、二十碳五烯酸、芥酸和二十二碳六烯酸的酶。在一些实施方案,所述非分解代谢化合物是选自由棕榈酸、棕榈酰辅酶a、棕榈油酸、6(z)-十六碳烯酸、油酸、亚油酸、α-亚麻酸、花生四烯酸、二十碳五烯酸、芥酸、和二十二碳六烯酸组成的组的脂肪酸。

在一些实施方案,所述脂肪酸生成细胞包含编码可使乙酰-coa和丙二酰-coa中的至少一个共价连接酰基载体蛋白的酶(例如酰基转移酶)的异源性核苷酸序列。

在一些实施方案,本发明公开的经遗传修饰的微生物包含编码酶的异源性核苷酸序列,所述酶(例如β-酮脂酰-acp合酶)可使乙酰化学基团部分与丙二酰化学基团部分(各自与酰基载体蛋白(acp)结合)缩合以形成乙酰乙酰基-acp。

在一些实施方案,所述脂肪酸生成细胞包含编码酶的异源性核苷酸序列,所述酶(例如β-酮脂酰-acp还原酶)可用nadph使乙酰乙酰基-acp中双键还原以在d-3-羟基丁酰羟化酶-acp中形成羟基。

在一些实施方案,所述脂肪酸生成细胞包含编码酶的异源性核苷酸序列,所述酶(例如β-羟酰基-acp脱水酶)可使d-3-羟基丁酰羟化酶-acp脱水以在β-和γ-碳之间生成双键而形成巴豆酰-acp。

在一些实施方案,所述脂肪酸生成细胞包含编码酶的异源性核苷酸序列,所述酶(例如烯酰acp还原酶)可用nadph使巴豆酰基acp还原形成丁酰基-acp。

在一些实施方案,所述脂肪酸生成细胞包含编码酶的异源性核苷酸序列,所述酶(例如硫酯酶)可从酰基载体蛋白水解c16酰基化合物以形成棕榈酸。

在一些实施方案,与未经遗传修饰的亲本细胞相比,所述脂肪酸生成细胞包含编码乙酰辅酶a合酶和/或丙二酰辅酶a合酶的一种或多种异源性核苷酸序列,以实现一种或多种脂肪酸生成量的增加。

为了增加乙酰辅酶a的生成量,可在细胞中表达一种或多种以下基因:pdh、pank、aceef(编码丙酮酸与2-酮戊二酸脱氢酶复合物的eip脱氢酶组分和e2p二氢硫辛酰胺酰基转移酶组分)、fabh、fabd、fabg、acpp、和fabf。编码此类酶的核苷酸序列的示例性实例包括但不限于:pdh(bab34380、aac73227、aac73226),pank(又名coaa、aac76952),aceef(aac73227、aac73226),fabh(aac74175),fabd(aac74176),fabg(aac74177),acpp(aac74178),fabf(aac74179)。

在一些实施方案,可通过减弱或敲除编码参与脂肪酸降解的蛋白的基因从而在细胞中实现增加的脂肪酸水平。譬如,fade、gpsa、idha、pflb、adhe、pta、poxb、acka、和/或ackb的表达水平可使用本领域已知的技术在工程化宿主细胞中进行减弱或敲除。编码此类蛋白的核苷酸序列的示例性实例包括但不限于:fade(aac73325),gspa(aac76632),idha(aac74462),pflb(aac73989),adhe(aac74323),pta(aac75357),poxb(aac73958),acka(aac75356),和ackb(bab81430)。当生长在合适环境中时,所得宿主细胞将具有增加的乙酰辅酶a生成水平。

在一些实施方案,所述脂肪酸生成细胞包含编码酶的异源性核苷酸序列,所述酶(例如多亚基accabcd蛋白)可使乙酰辅酶a转化为丙二酰辅酶a。编码accabcd的合适核苷酸序列的示例性实例包括但不限于登录号aac73296,ec6.4.1.2。

在一些实施方案,所述脂肪酸生成细胞包含编码脂肪酶的异源性核苷酸序列。编码脂肪酶的合适的核苷酸序列的示例性实例包括但不限于登录号caa89087和caa98876。

在一些实施方案,可通过抑制plsb来实现增加的脂肪酸水平,所述plsb可导致长链酰基-acp水平增加,这将抑制脂肪酸生物合成途径(例如,accabcd、fabh、和fabl)中的早期步骤。使用本领域已知的技术,可在工程化宿主细胞中减弱或敲除plsb的表达水平。编码plsb的合适核苷酸序列的示例性实例包括但不限于登录号aac77011。在具体实施方案中,可使用plsbd31e突变来增加细胞中可用的酰基-coa的量。

在一些实施方案,通过过表达sfa基因可在细胞中实现增加的单不饱和脂肪酸的生成量,这将导致faba的抑制。编码sfa的合适核苷酸序列的示例性实例包括但不限于登录号aan79592。

在一些实施方案,通过调节酶的表达可在细胞中实现增加的脂肪酸水平,所述酶(例如硫酯酶)控制脂肪酸底物的链长度。在一些实施方案,所述脂肪酸生成细胞已被修饰以过表达tes或fat基因。合适的tes核苷酸序列的示例性实例包括但不限于登录号:(tesa:aac73596,来自大肠杆菌,能够生成c18:1脂肪酸)和(tesb:aac73555,来自大肠杆菌)。合适的fat核苷酸序列的示例性实例包括但不限于:(fatb:q41635和aaa34215,来自加州伞桂属,能够生成c12:0脂肪酸),(fatb2:q39513和aac49269,来自萼距花,能够生成c8:0–c10:0脂肪酸),(fatb3:aac49269和aac72881,来自萼距花,能够生成c14:0–c16:0脂肪酸),(fatb:q39473和aac49151,来自香樟,能够生成c14:0脂肪酸),(fatb[m141t]:caa85388,来自拟南芥,能够生成c16:1脂肪酸),(fata:np189147和np193041,来自拟南芥,能够生成c18:1脂肪酸),(fata:cac39106,来自bradvrhiizobiumjaponicum,能够优先生成c18:1脂肪酸),(fata:aac72883,来自萼距花,能够生成c18:1脂肪酸),和(fata1,aal79361,来自向日葵)。

在一些实施方案,通过使用本领域已知技术减弱硫酯酶c18的表达或活性,可在细胞中实现增加的c10脂肪酸水平。编码硫酯酶c18的合适核苷酸序列的示例性实例包括但不限于登录号aac73596和p0ada1。在其他实施方案,通过使用本领域已知的技术增加硫酯酶c10的表达或活性,可在细胞中实现增加的c10脂肪酸水平。编码硫酯酶c10的合适核苷酸序列的示例性实例包括但不限于登录号q39513。

在一些实施方案,可以通过使用本领域已知的技术减弱生成非c14脂肪酸的内源性硫酯酶的表达或活性,在细胞中实现增加的c14脂肪酸水平。在其他实施方案,使用本领域已知的技术,通过增加使用底物c14-acp的硫酯酶的表达或活性,可在细胞中实现增加的c14脂肪酸水平。编码此种硫酯酶的合适核苷酸序列的示例性实例包括但不限于登录号q39473。

在一些实施方案,可通过使用本领域已知的技术减弱生成非c12脂肪酸的内源性硫酯酶的表达或活性,在细胞中实现增加的c12脂肪酸水平。在其他实施方案,使用本领域已知的技术,通过增加使用底物c12-acp的硫酯酶的表达或活性,可在细胞中实现增加的c12脂肪酸水平。编码此种硫酯酶的合适核苷酸序列的示例性实例包括但不限于登录号q41635。

7.实施例

7.1实施例:细胞密度测定

本实施例描述了用于确定酵母细胞培养物的细胞密度(od600)的示例性方法。

将8μl细胞培养物的样品与92μltritonod稀释剂(20g/ltritonx-114,200ml/lpeg200,200ml/l100%乙醇,其余部分为水)组合在澄清的96孔板中,将溶液在1,000rpm下搅拌6分钟后,使用m5分光光度计(moleculardevices,sunnyvale(森尼韦尔),ca(加拿大))测定600nm处的吸光度来确定od600值。

7.2实施例:测定法呢烯效价的uv法

本实施例描述了使用uv测定法测定法呢烯生成量的示例性方法。在所述uv测定法中,使用全培养液,然后直接uv吸光度或气相色谱来测定法呢烯效价。

对于预培养条件,将培养的菌株在含有360μl鸟种培养基(birdseedmedia)(bsm,最初由vanhoek等描述(2000))的无菌96孔板(1.1ml有效体积;axygen)中生长。对于预培养条件,除非另有说明,通常碳源是1.4%蔗糖和0.7%麦芽糖的混合物。将单菌落挑取到每个孔中并在33.5℃,80%湿度和1000rpm下孵育约72小时(inforsmultitron;atrbiotec)。

对于法呢烯生成实验,将上述饱和培养物以1/25稀释到含有145μlbsm和5μl矿物油的无菌1.1ml板中。除非另有说明,通常碳源是4%蔗糖、或者2.3%蔗糖与1.7%麦芽糖的混合物。培养72小时后,向各孔中加入600μl异丙醇(ipa)进行法呢烯提取。孵育30分钟后,将8μl转移至含有192μlipa的澄清底部的酶联板。通过spectramax读板机上222nm处的uv吸光度测定法呢烯浓度。

7.3实施例:基于尼罗红法测定法呢烯效价

本实施例描述了用于确定酵母细胞培养物的法呢烯效价的示例性尼罗红法。

将98μl细胞培养物的样品转移至96孔黑色聚苯乙烯平底酶联板中,向各孔中加入2μl溶于dmso中的100μg/ml的尼罗红(nilered)(invitrogen(英杰公司),carlsbad(卡尔斯巴德),ca(加拿大))。在m5分光光度计上通过激发波长500nm、并发射波长550nm立即测定荧光水平。

7.4实施例:基于气相色谱法测定法呢烯效价

本实施例描述了用于确定酵母细胞培养物的法呢烯效价的示例性气相色谱法(gc)。

用甲醇-庚烷(1:1v/v)提取样品,并离心混合物以除去细胞物质。将甲醇-庚烷萃取物的等分试样用含0.001%t-石竹烯(在特定的gc烘箱概要中用作保留时间标记以监测成功注射和洗脱)的正庚烷稀释,然后使用脉冲分流注射法注射到聚甲基硅酮固定相。使用具有火焰离子检测器(fid)的gc依据沸点分离法呢烯。

7.5实施例:背景菌株工程化

“不可切换”的法呢烯生成菌株(如y9213和y9709)源自野生型酿酒酵母菌株(cen.pk2),并还包括以下通过gal启动子控制染色体整合的来自酿酒酵母(s.cerevisiae)的甲羟戊酸途径基因(图.15所示):乙酰辅酶a硫解酶,羟甲基戊二酸单酰辅酶a(hmg-coa)合酶,羟甲基戊二酸单酰辅酶a(hmg-coa)还原酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶,甲羟戊酸焦磷酸脱羧酶;和来自黄花蒿的法呢烯合酶突变体的六种拷贝。此种不可切换的菌株具有gal80基因缺失和gal4oc启动子下gal4的另外拷贝,其中酿酒酵母的gal4基因的编码序列处于其天然启动子(pgal4oc;参见:griggs&johnston(1991)美国国家科学院院刊88(19):8597-8601))的“有效组成型”形式的调控下。

然后在“不可切换”菌株中生成的法呢烯变成“可切换”,即在麦芽糖存在下可抑制。通过染色体整合麦芽糖响应型启动子pmal32(seqidno:34)控制下的gal80(seqidno:71)的拷贝,在组成型菌株上构建麦芽糖可切换菌株(例如菌株h)。

菌株e也是麦芽糖可切换菌株,其通过染色体整合麦芽糖响应型启动子pmal32(seqidno:34)控制下的gal80(seqidno:71)的拷贝而构建在组成型亲本菌株之上。此菌株具有ura3标记。

7.6实施例:第i层诱变和筛选麦芽糖结合蛋白(“mbp”)突变体

本实施例描述了编码野生型mbp的核酸的初始i层诱变。筛选诱变产生的mbp突变体以获得那些与目的蛋白融合的突变体,其会导致目的蛋白在其遗传修饰的宿主细胞中的表达和稳定性方面变成麦芽糖依赖性。譬如,作为麦芽糖依赖性降解决定子的mbp突变体从麦芽糖存在下的功能(例如稳定)状态转换为麦芽糖不存在时的非功能(例如不稳定)状态。在此实例中,使用gal80p作为mbp突变体的融合配偶体来测试与gal80p融合的mbp突变体是否导致对gal80p的麦芽糖依赖性稳定性。

7.6.1.物料与方法

使用高、中或低诱变率的条件,通过易错聚合酶链式反应(pcr)使用来自安捷伦技术的genemorphii随机诱变试剂盒来诱变编码野生型mbp(seqidno:27,其含有在具有seqidno:1的野生型mbp的c端处的连接体序列)的核酸序列。以下引物pc542和pc543用于从dna构建体(seqidno:68)诱变野生型mbp核酸,所述dna构建体包含与野生型mbp基因框内融合的gal80基因,侧接由酿酒酵母gas2基因座的上游核苷酸序列和编码ura3标记基因的核苷酸序列的一部分组成的同源序列:

pc542:cgttagcaatatctcgcattatag(seqidno:66;用于从dna构建体(seqidno:68)诱变野生型mbp核酸的正向引物);和

pc543:ccaagcacagggcaagatgc(seqidno:67;用于从dna构建体(seqidno:68)诱变野生型mbp核酸的反向引物)。

使用来自纽英伦生物技术(newenglandbiolabs)的gibson克隆试剂盒将诱变的pcrmbp片段组装到转化载体中。设计以下引物(pc540和pc541)以扩增缺少大部分mbp序列但使诱变片段序列重叠的部分dna构建体(seqidno:68),并将诱变的mbp片段组装到扩增的载体中:

pc540:tgactaacttaccttcttcg(seqidno:69;用于吉布森组装(gibsonassembly)的dna构建体(seqidno:68)的载体骨架的反向引物);和

pc541:caacaacttgggtatcgaagg(seqidno:70;用于吉布森组装(gibsonassembly)的dna构建体(seqidno:68)的载体骨架的正向引物)。

对来自各个诱变反应的10个随机克隆进行测序以确认文库含有适当的多样性和突变的频率。扩增经验证的文库,用pme1切割,并转化到y9213基报告菌株中。所述y-9213基报告菌株pcy757是通过将dna构建体ms71316(seqidno:72)转化到菌株y9709中,随后选择已丧失ura3标记的foa抗性菌落进行构建。报高菌株pcy757包含可操作连接至pgal10启动子的lys2基因,如图.4所示。将转化体铺在csm-尿嘧啶-赖氨酸(csm–ura–lysine)+2%葡萄糖琼脂板上以选择不能表达功能性gal80p的转化体。将生长的菌落转移到含有1%麦芽糖的标准固体α-氨基己二酸板上。例如,α-氨基己二酸板含有0.167%不含酸和不含硫酸铵的细菌酵母氮源,2%右旋糖,1%麦芽糖,0.2%d,l-α-氨基己二酸,30m/l赖氨酸,2%细菌琼脂和其他营养缺陷型菌株所需的标准补体。制备α-氨基己二酸板的一般方法报道在keeney&reed,j.microbiology&biologyeducation,vol.1(2000)和chattoo&sherman,genetics.93:51-65(1979)中,其通过引用其全文并入本文。

将来自反选择的阳性菌落在平板上通过划线法得到单菌落,测定在麦芽糖存在下培养的细胞中的法呢烯效价测定值,然后测定不存在麦芽糖情况下法呢烯效价测定值。除了碳源以外,将赖氨酸添加至生成培养基中,因为包含mbp突变体的宿主细胞选择用于功能性gal80赋予的lys2-表型。因此,对于此实例,“关闭”状态的生成培养基含有2.3%的蔗糖,1.7%的麦芽糖和0.1%的赖氨酸。“开启”状态的生成培养基含有4%蔗糖和0.1%赖氨酸。如实施例7.2所述,使用uv测定法来测定法呢烯效价。

7.6.2.结果与讨论

设计筛选mbp突变体的遗传策略,其在与组成型转录的gal80融合时将引起gal80p从在麦芽糖存在下的功能(例如稳定)状态切换为在无麦芽糖的情况下的非功能(例如不稳定)状态。gal80p功能是由归因于来自gal80p调节启动子(pgal10)的lys2的表达或抑制的表型进行报告,如图.4所示。当gal80p不稳定且处于非功能性时,lys2进行表达,这将赋予宿主细胞在缺乏赖氨酸的培养基上生长的能力。缺乏赖氨酸的培养基也将排除不表达lys2的细胞。当gal80p稳定且处于功能性时,lys2不表达,这将赋予宿主细胞在含有α-氨基己二酸作为唯一氮源的培养基上生长的能力。所述α-氨基己二酸培养基也阻止表达lys2的细胞生长。期望的表型通过将pgal80>gal80(编码总是稳定的gal80p)和pgal80>d_gal80(例如seqidno:71,编码组成型不稳定的gal80p,由于其与组成型降解决定子在其n端融合以增加蛋白转化)引入到报告菌株并使所述菌株在两种培养基上生长从而进行验证。图.4示出了遗传策略以及在两种选择培养基上生长的有效控制。

将含有与天然pgal80启动子表达的gal80融合的pcr诱变的mbp的文库整合到含有pgal10>lys2的y9213背景报告菌株的gas2基因座中。首先将转化体铺在不含赖氨酸和麦芽糖的培养基上以选择使gal80失活的mbp突变。生长的细胞可含有通常去稳定的gal80p的mbp突变,即使麦芽糖不存在。为了排除通常不稳定的突变,首先在不含赖氨酸和麦芽糖的培养基上生长的菌落在含有麦芽糖和α-氨基己二酸作为唯一氮源的培养基上进行反选择。仅含有可在麦芽糖存在下稳定的gal80p的细胞能够在反选择培养基上生长。

从上述选择/反选择方法得到66个推定的mbp突变体。对它们进行分析以评估它们在存在或不存在麦芽糖情况下对法呢烯生成的可切换性。报告菌株(y9213背景)在gal调节子启动子的控制下生成具有途径基因的法呢烯。以麦芽糖依赖方式赋予条件性gal80p稳定性的任何真正突变也应引起法呢烯生成以麦芽糖依赖性方式转换。

结果显示在图.5中。每个mbp突变体由方形标记表示,并且在麦芽糖不存在下的法呢烯效价与麦芽糖存在下的法呢烯效价的比值由标记的大小表示。图中示出了对组成型生成者和非生成者的控制,以及完美切换菌株的理论位置。如图.5所示,尽管没有任何mbp突变体作为完美开关(即,在麦芽糖存在下没有生成法呢烯和在不存在麦芽糖情况下以高生成量生成法呢烯),但筛选鉴定了许多mbp突变体,其能够在麦芽糖不存在情况下比在麦芽糖存在下生成更多的法呢烯。在这些突变体中,将来自mbp突变体l8、h8、h9、h10、m1、m5和m13的mbp结构域进行克隆和测序。

7.7实施例:第ⅱ层优化:组合文库的构建

7.7.1.物料与方法

设计引物以包含在从第一层诱变得到的mbp突变体中识别的单核苷酸多态性(snps)(以编码野生型序列和突变序列两者)的位置处的简并碱基。通过使用quickchange多位点诱变试剂盒(agilenttechnologies),将引物序列随机并入具有seqidno:73(含有mbpl8突变体)或具有seqidno:74(含有mbpm5突变体)的dna构建体中来构建组合文库。dna构建体s69250包含可操作连接至融合核酸的pgal80启动子,所述融合核酸包含与mbp突变体l8核酸融合的gal80基因,侧接酿酒酵母gas2基因座的上游序列和ura3标记基因的一部分。dna构建体包含可操作连接至融合核酸的pgal80启动子,所述融合核酸包含与mbp突变体m5核酸融合的gal80基因,侧接酿酒酵母gas2基因座的上游序列和ura3标记基因的一部分。已报道了quickchange多位点诱变试剂盒能够在一次单一反应中随机地组合多达49个不同的snps。从所述文库中随机克隆的测序确认了突变体snps的良好并入率。

将所述文库转化到报告菌株中。将代表大约20,000个转化体的转化混合物直接接种到缺乏赖氨酸和尿嘧啶的不含麦芽糖的液体培养基(即,除了不含琼脂外与实施例7.6中所述的培养基相同)中。具有更好的“开启”状态的构建体的转化体在不含赖氨酸的情况下将生长得更快并且变得富集。然后将所得培养物重新接种到含有α-氨基己二酸的麦芽糖培养基(即,除了不含琼脂外与实施例7.6中所述的培养基相同)中,所述培养基选择可在麦芽糖存在下施加紧密“关闭”状态的细胞。图.6示出了竞争性选择/反选择生长方案的轮次。在不含麦芽糖的基本培养基和含麦芽糖的α-氨基己二酸培养基交替几次培养后,将来自最后一轮反选择的阳性菌落在平板上通过划线法得到单菌落。在预培养条件下培养单菌落,并如上述实施例7.2中所述测定细胞在麦芽糖存在或不存在下的生成培养基中产生的法呢烯的量。本实施例中使用的法呢烯生成培养基与实施例7.6中所述的那些相同。

7.7.2.结果与讨论

对来自实施例7.6的十六种最好的mbp突变体进行测序。所述这些mpb突变体在“开启”状态下生成法呢烯和/或“关闭”状态下停止生成法呢烯的方面是最佳的。从这些十六个mbp突变体中鉴定出六十八个独特的突变。这些突变中的一些发生多次,并且衍生自独立的诱变pcr反应,表明它们是显著的因果突变。在一种情况下,相同的密码子会发生突变以在两种不同的mbp突变体中编码两种不同的氨基酸。这些确定的突变被映射到mbp的晶体结构。使用稳定性预测算法(例如http://mordred.bioc.cam.ac.uk/~sdm/sdm.php)来分析这些突变。根据最初的理论即去稳定突变可使蛋白依赖于与其配体结合而稳定,来预测大量所述确定的突变使mbp结构不稳定。在本实施例中,测试了由分离的mbp突变体鉴定的组合去稳定突变是否可增加稳定性对麦芽糖结合的依赖性,从而增加了mbp突变体稳定和不稳定状态之间的差异。

为了得到具有潜在增加稳定和不稳定状态之间差异的另外的mbp突变体,产生了鉴定突变的组合文库。为了鉴定具有导致最佳切换(在“开启”和“关闭”状态之间)的突变组合的细胞,转化体文库均受到生长竞争机制的影响,如图.6所示,其中它们在液体培养基中交替生长,即gal80p在麦芽糖不存在时不稳定情况下在有利于生长的液体培养基中生长,然后gal80p在麦芽糖存在时稳定情况下在有利于生长的液体培养基中生长。经过多轮选择和反选择后,将细胞铺在平板上以生长成单菌落。这些菌落表示由第ⅱ层优化过程得到的另外的mbp突变体。

通过第ⅱ层优化过程得到的另外的mbp突变体分别在包含或不包含麦芽糖的培养基中培养,以评估旨在用作“关闭”和“开启”状态的发酵条件下的法呢烯生成。图.7a和图.7b示出了当另外的突变与初始mbp突变体l8组合时的结果,并且所述组合文库在经过1轮选择/反选择(图.7a)或3轮选择/反选择(图.7b)之后经历生长竞争机制。初始mbp突变体l8具有相对较好的“开启”状态(即在不存在麦芽糖情况下高水平的法呢烯生成),但不太理想的“关闭”状态。在3轮选择/反选择之后,得到来源于初始mbp突变体l8并具有改善的“关闭”状态的菌株。如图.7b所示,许多新的mbp突变体(由图中的方形标记表示)转移到初始l8mbp突变体的左侧,表明在“关闭”状态期间它们的法呢烯生成量低于初始l8mbp突变体并且接近于非法呢烯生成对照菌株。在此第ⅱ层优化期间得到的最佳mbp突变体之一是l8_v4d(参见例如图.10b)。另一个具有良好“关闭”状态,但不太理想的“开启”状态的初始mbp突变体m5,与已识别的突变相结合。图.6示出了经过3轮选择/反选择过程之后,鉴定了具有改善的“开启”状态的菌株(数据未示出)。这些结果表明生长竞争分析测定可用作选择与生长表型偶联的所需突变的有力策略。

7.8实施例:第ⅲ层优化在不存在麦芽糖情况下处理不稳定的mbp

7.8.1.物料与方法

通过将dna构建体ms85927(seqidno:75)转化到y9709(产生pcy816)中来构建不同的宿主菌株。dna构建体ms85927包括编码与pthd3启动子可操作地连接的gfp的基因和侧接于gas2上游和下游序列之间以整合到gas2基因座处的宿主基因组中的ura3标记。使用来自安捷伦技术(agilenttechnologies)的genemorphⅱ随机诱变试剂盒来诱变来自dna构建体s73873(seqidno:76)的含有mbpl8_v4d的片段。将诱变的dna与编码cph1核酸酶的pam2947质粒(seqidno:77;与ptdh3启动子可操作地连接的f-cphi基因,kanmx4标记的,cen-ars)一同直接转化到pcy816中。参见图.8a的遗传策略。将转化混合物直接接种到不含麦芽糖的5-foa(5-氟-乳清酸)的液体培养基中并使其生长成培养物。使用流式细胞仪(facsaria,bdsciences)将所得培养物的细胞在gfp通道(530/11带)上分选暗淡荧光细胞。

将分选的细胞接种到含有尿嘧啶和麦芽糖的bsm培养基中,并使分选的细胞在bsm培养基中生长。然后使用流式细胞仪(facsaria)将来自所述培养物的细胞分选出明亮发荧光的细胞。将明亮发荧光的细胞铺在板上,挑取单菌落并在96孔板中培养以形成预培养物。然后将所述预培养物接种到不含麦芽糖或含有麦芽糖的尿嘧啶补充的生成培养基板中。在所述生成培养基中生长24小时后(关于生成培养基的描述参见实施例7.2),使用guava流式细胞仪测定每种生成条件下的gfp强度。

7.8.2.结果与讨论

对来自第ⅱ层优化过程的组合文库生长竞争选择的与各种mbp突变体融合的gfp的荧光强度的测定,鉴定了l8_v4d为具有最佳麦芽糖依赖性稳定性差异的mbp突变体(参见例如图.8b)。然而,在不含麦芽糖情况下,l8_v4d仍然可检测到残余的gfp表达。进行mbp突变体l8_v4d的直接诱变以得到另外的mbp突变体,其可在不存在麦芽糖情况下潜在减少残余的gfp表达。在不存在麦芽糖情况下具有减少的残余gfp表达的mbp突变体在控制具有天然启动子的基因表达或已经以非常低的水平进行表达的基因表达中特别有用。

如上文在物料和方法部分中所述采用细胞分选进行mbp突变体筛选。使用此策略,可获得另外的麦芽糖依赖性mbp突变体。所述这些包括mbp突变体3a6、4d3、5a2和5f3。从第三层诱变中还鉴定了mbp突变体4-h10、1-b9、4-g10、4-f11、2-f10、2-e8、2-g8、1-f7、4-h4和2-a4。如图.8b所示,所述这些mbp突变体的稳定性也依赖于培养基中的麦芽糖含量。

图.8c还示出了与野生型mbp融合的gfp的荧光强度。与野生型mpb融合的gfp在不存在麦芽糖情况下与麦芽糖存在下相比并非不稳定。这一结果同与各种mbp突变体融合的gfp形成对比,即与存在麦芽糖的情况相比,其在不存在麦芽糖情况下不稳定且以降低的水平表达。

7.9实施例:使用麦芽糖依赖性降解决定子来控制组成型表达的gal80蛋白的稳定性及其对法呢烯生成的影响

本实施例阐明了从第一层至第三层诱变得到的mbp突变体可用作麦芽糖依赖性降解决定子以控制组成型表达的gal80蛋白(例如,使用天然pgal80启动子)的稳定性。将来自突变体菌株的每个mbp结构域克隆、测序并重新融合至含有gal80基因的载体上,所述gal80基因与其天然启动子pgal80可操作地连接。测试mbp突变体菌株以确认其麦芽糖依赖性法呢烯生成。

7.9.1.物料与方法

如实施例7.2中所述,在预培养条件下将包含mbp突变体的菌株培养72小时。对于法呢烯生成实验,将上述培养物稀释并在实施例7.2中描述的生成培养基中培养。在所述生成培养基中,碳源是4%蔗糖(“开启”状态)、或者2.3%蔗糖与1.7%麦芽糖的混合物(“关闭”状态)。培养72小时后,进行法呢烯提取,如实施例7.2所述,通过在spectramax读板机上222nm处的uv吸光度来测定法呢烯浓度。

7.9.2.结果与讨论

结果如图.9a至9c所示。顶面图表示在生成培养基中不含任何麦芽糖情况下,对于表达各种融合蛋白的菌株生成的法呢烯的量,所述融合蛋白包含与野生型mbp或与pgal80启动子可操作连接的mbp突变体融合的gal80p。底面图表示在生成培养基中含麦芽糖情况下,对于与顶面图示出的同一组菌株生成的法呢烯的量。

如图.9a所示,对于表达与gal80p(右起第二个)框内融合的野生型mbp的菌株,实际上在存在或不存在麦芽糖的情况下均不生成法呢烯(仅有背景测定)。相比之下,对于包含mbp突变体h8、h9、h10、m1、m5和m13的菌株,在麦芽糖不存在下(“开启”状态)法呢烯的生成量比麦芽糖存在下(“关闭”状态)高至少约10%,典型高至少约50%。在此组中,mbp突变体m5具有最佳的“开启”状态响应。然而,包含mbp突变体m5的宿主细胞的“开启”状态响应与组成型法呢烯生成对照y9213相比降低了约46%。

类似地,图.9b示出了由表达与各种mbp突变体框内融合的gal80的菌株生成法呢烯的量。如图.9b所示,对于包含mbp突变体3a6、4d3、5a2和5f3的菌株,在不存在麦芽糖的情况下(“开启”状态)由所述菌株生成的法呢烯的量比麦芽糖存在时(“关闭”状态)高至少约50%。

图.9c标示出了由表达与mbp突变体l8框内融合的gal80p的菌株生成法呢烯的量。如图.9c所示,在麦芽糖不存在的情况下(“开启”状态)由所述菌株生成的法呢烯的量比麦芽糖不存在时(“关闭”状态)高至少约280%。所述突变体菌株在“开启”状态下的法呢烯生成量与不可切换的法呢烯生成对照菌株y9213的法呢烯生成量相当(约90%)。不包含异源性甲羟戊酸途径酶和含有不含mbp突变体的pgal80>gal80基因的酿酒酵母菌株y17025(cen.pk)的法呢烯生成几乎不生成法呢烯(仅有背景测定)。

所述这些结果表明这些mbp突变体在麦芽糖存在下是稳定的,因此包含与mbp突变体框内融合的gal80p的融合蛋白将抑制gal4p,从而减少生成法呢烯所必需的生物合成途径基因的表达。然而,在麦芽糖不存在情况下,与mbp突变体框内融合的gal80p是不稳定的,从而使gal4p免受融合蛋白抑制,因而导致生成法呢烯所必需的生物合成途径基因的更高表达。

7.10实施例:将麦芽糖依赖性降解决定子的mbp突变体与麦芽糖响应型性启动子组合

本实施例阐明了mbp突变体作为麦芽糖依赖性降解决定子可以与麦芽糖响应型启动子组合以在转录和翻译后水平上控制法呢烯的生成。

7.10.1.物料与方法

如图.10所示,通过改变特定开关构建体产生两个同基因菌株。亲本菌株d与菌株y9213和y9709相似,并包含实施例7.5中所述的编码甲羟戊酸途径酶以及具有gal80基因缺失的法呢烯合酶的异源性核酸。菌株b和c是菌株d的同基因菌株,除了这些菌株包含编码gal80p的核酸,所述gal80p与可操作地连接至麦芽糖响应型启动子的mbp突变体融合。譬如,菌株b是在引入包含启动子pmal_32_v1(seqidno:78)的dna构建体ms85487之后产生的转化体,所述启动子pmal_32_v1可操作地连接至编码与mbp突变体l8v4d框内融合的gal80p的核酸;菌株c是在引入包含启动子pmal32(seqidno:34)的dna构建体ms85488之后产生的转化体,所述启动子pmal32可操作地连接至编码与mbp突变体l8_v4d框内融合的gal80p的核酸;用于菌株c的启动子pmal32比启动子pmal_32_v1(seqidno:78)更强。

如实施例7.2中所述,在预培养条件下将所述菌株培养72小时。对于法呢烯生成实验,如实施例7.2中所述将上述培养物稀释并在生成培养基中培养。在所述生成培养基中,碳源是4%蔗糖(“开启”状态)、或者2.3%蔗糖与1.7%麦芽糖的混合物(“关闭”状态)。培养72小时后,进行法呢烯提取,如实施例7.2所述,通过spectramax读板机上222nm处的uv吸光度来测定法呢烯浓度。

7.10.2.结果与讨论

在实施例7.9中,mbp突变体本身用于控制宿主细胞中由其天然启动子转录的组成型表达的gal80的稳定性。在本实施例中,通过整合并可操作地连接与麦芽糖诱导型启动子gal80p融合的各种mbp突变体,使麦芽糖控制gal80稳定性与麦芽糖控制gal80转录相结合。图.10所示结果说明麦芽糖响应型启动子与mbp突变体的各种组合导致这些新菌株b和c的良好可切换性。另外,在麦芽糖不存在情况下的“开启”状态期间,由菌株b和c生成的法呢烯的量与不可切换的法呢烯生成对照生成的量相当。

7.11实施例:包含mbp降解决定子的融合蛋白的半衰期

本实施例阐明了从第i层至第ⅲ层诱变获得的mbp突变体可用作麦芽糖依赖性降解决定子以增加其融合配偶体gfp的降解速率。

7.11.1.物料与方法

使用ura3作为选择标记,将所有gfpdna构建体(例如,与可操作地连接至ptdh3启动子的mbp突变体基因融合的gfp基因)转化到y9709中并整合在gas2基因座处。将菌株接种并在bsm1.4%蔗糖和0.7%麦芽糖培养基中在30℃下生长2天以诱导gfp表达。两天后,将培养物在bsm2%蔗糖中稀释25倍。在对数生长阶段期间(例如,紧接在稀释后1.75、3、4.25、6、7.25和8.5小时),通过guava流式细胞仪测定gfp荧光。在背景扣除后以对数标度报告gfp荧光的减少,如图.11a所示。由于图.11a所示的gfp荧光减少反映了在对数期间细胞分裂对gfp蛋白降解和gfp稀释的影响。为了得到真实的gfp降解速率,由gfp荧光降低率减去增长率。减去蔗糖中的y9213的生长速率(μ=0.15hr-1)以校正半衰期。然后将真实的gfp降解速率转换成gfp半衰期,如图.11b所示。gfp的半衰期如图.11b所示,未考虑蔗糖培养基中的gfp转录变化。

7.11.2.结果与讨论

当其不与mbp融合时,gfp蛋白中的一半在8.7小时内衰变。与野生型mbp框内融合的gfp蛋白中的一半在11.6小时内衰变。当gfp与mbp突变体融合时,降解速度显著增加,且融合蛋白的半衰期缩短至1.4-5.0小时(参见图.11b)。其中,在麦芽糖不存在时两种mbp突变体(5a2,5f3)通过gfp强度测定的半衰期最短(参见图.11a)。所述这些结果表明mbp突变体促进了麦芽糖不存在下的蛋白降解。

7.12实施例:基于mbp的麦芽糖开关防止由于gal80重新激活造成的破坏

本实施例提供的结果表明,与在整个构建阶段生成法呢烯的组成型生成菌株的生成相比,在麦芽糖存在下进行发酵的构建阶段(从而实现“关闭”状态)的长时间发酵过程中,能够产生类异戊二烯法呢烯且在由麦芽糖开关和麦芽糖依赖性降解决定子负调控的情况下包含mev途径的宿主细胞,表现出改善的法呢烯生成稳定性。

7.12.1.物料与方法

首先在含有2%葡萄糖、1%麦芽糖的固体琼脂培养基上剔除不可切换的生成法呢烯对照菌株和麦芽糖可切换菌株(融合至mbp_l8的pmal32>gal80),并在30℃下生长直至菌落可见。通过将单菌落接种到含有3ml的bsm2%蔗糖、1%麦芽糖的15ml试管中来制备种子小瓶。大约48小时后,将全部3ml转移到含有125ml的2%蔗糖和1%麦芽糖bsm(种子小瓶培养基)的500ml一次性摇瓶中。细胞在30℃下、200rpm的振荡器中生长,直至od600达到4和7之间。一旦达到所需od,将36ml无菌50%甘油储备液加至84ml培养物中,将悬浮液等分到种子小瓶中,并将种子小瓶以约1℃/min的速率缓慢冷冻至-80℃。通过将一个或多个种子小瓶解冻至含有50ml的1.6%蔗糖、0.4%葡萄糖和1%麦芽糖bsm(生物量构建培养基)的250ml摇瓶中,并通过使培养物在34℃和200rpm下生长24小时,使得在发酵之前完成生物量构建。然后将一部分此培养物转移到含有100ml相同培养基的500ml烧瓶中使达到0.1的起始od600值,并再生长24小时。然后将25ml此培养物用于接种含有225mlbsm培养基的0.5l发酵罐,所述培养基不含任何糖。根据需要补充甘蔗糖浆(不含任何麦芽糖),然后在最大化法呢烯产率的饲养方案下于34℃下发酵13天。

每天监测生成的法呢烯的总量和细胞消耗的总糖量,并测定累积的法呢烯产率并对时间作图,如图.12a所示。图.12a中所示的累积法呢烯产率相对于在168小时时测定的麦芽糖可切换菌株的累积法呢烯产率值进行归一化。

每天更新生成的法呢烯总量和细胞消耗的总糖量,并且每间隔24小时测定这两个值的比值,通过在任何区间中观察到的最高产率进行归一化处理,并对发酵罐区间产率归一化作图,如图.12b所示。图.12b中所示的归一化法呢烯区间产率是相对于在168小时时测定的麦芽糖可切换菌株的区间法呢烯产率值进行归一化。

7.12.2.结果与讨论

如图.12a所示,不可切换的亲本菌株的归一化累积产率从约120小时时的峰值连续下降至可切换的子株(childstrains)在168小时时的峰值产率的约20%以下。相比之下,麦芽糖可切换菌株将归一化的累积产率维持在约216小时处。同理,如图.12b所示,不可切换亲本菌株的归一化区间法呢烯产率从约100小时时的峰值连续降低至麦芽糖可切换菌株在168小时时的峰值产率的40%以下。相比之下,麦芽糖可切换菌株可维持归一化产率达到其216小时时高峰值的约80%。因此,这些结果表明,在两阶段发酵过程的构建阶段期间,在麦芽糖存在下关闭法呢烯生成的麦芽糖可切换菌株(与mbp_l8融合的pmal32>gal80)使得在生成阶段期间法呢烯生成的生成稳定性得以改善提高。

7.13实施例:pgmal启动子的构建

本实施例阐明了合成的pgmal启动子的构建。在此实施例中,使用其gal4p结合位点被去除且在背景启动子的不同位置添加不同拷贝数的mal激活因子结合序列(例如malx3p)的pgal1、pgal2和/或pgal7启动子作为背景启动子来构建示例性pgmal启动子。

7.13.1.物料与方法

在pgal1和pgal2中有四个gal4p结合位点,在pgal7中有两个gal4p结合位点。所有gal4p结合位点均从这些启动子去除。产生的“空”启动子被称为pgal1_0、pgal2_0和pgal7_0。在这些空的gal启动子中插入1至8个下列mal激活因子结合序列拷贝:agaaatattatctaaaagcgagagtttaagcgagttgcaaga(seqidno:80);和gtccgcgaaaatttccggataaatcg(seqidno:81)。创建了三十四个新的合成启动子,它们命名为pgmal、pg2mal和pg7mal(参见图.14a和14b)。还通过使pgal1_0、pgal2_0和pgal7_0的部分序列与一些mal结合位点连接来构建四种杂合启动子。所述这些启动子命名为pg721_mal_v11,pg271_mal_v12,pg172_mal_v13和pg712_mal_v14。其中一些和其他新的合成启动子可用于驱动法呢烯生成菌株y9213中的gas2基因座处的gfp表达。

7.13.2.结果与讨论

对于遗传开关系统,具有不需诱导剂也不表达与其可操作连接的任何基因的诱导型启动子是所期望的。具有不同程度强度的诱导型启动子以控制基因表达,从而可将基因产物的生成调整到合适水平也是所期望的。

产生合成的pgmal启动子是因为包含与目的基因可操作连接的天然pmal启动子的宿主细胞倾向于在不含任何麦芽糖的培养基中以低水平表达基因产物。此外,发现当宿主细胞以低生长速率生长时,天然pmal启动子的活性在不含麦芽糖的培养基中正调控。如图.14a和14b所示,发现合成的pgmal启动子是麦芽糖可诱导的,并且当宿主细胞在不含麦芽糖的培养基中生长时其不受细胞生长速率的影响。如图.14a和14b所示的结果将在实例7.14中进一步详细描述。

7.14实施例:pgmal启动子是麦芽糖可诱导的

本实施例阐明了从实施例7.13得到的合成pgmal启动子是麦芽糖可诱导的。在不存在麦芽糖情况下,所述启动子也不受宿主细胞生长速率的影响。

7.14.1.物料与方法

使用ura3作为选择标记,使用实施例7.13生成的合成pgmal启动子来驱动y9213中gas2基因座处的gfp表达。将菌株接种并在bsm1.45%蔗糖和0.7%麦芽糖培养基中在30℃下生长2天,然后在相同培养基中稀释25倍。48小时后,使用guava流式细胞仪测定gfp荧光。在此实验中使用pgal1、ptdh3、pmal11、pmal12、pmal31和pmal32作为对照。将gfp荧光数据归一化为由y9213产生的无gfp表达的背景信号。以略高于背景(pg7mal_v2,108%)至ptdh3的两倍(pgmal_v16,9000%的背景)的启动子强度产生麦芽糖诱导型启动子的梯状数据(ladder)。还测定了具有驱动gfp的空启动子pgal1_0、pgal2_0和pgal7_0的菌株,它们不显示任何gfp荧光(数据未示出)。也检测了所述这些启动子在bsm2%蔗糖中的高生长速率(0.15h-1)和在bsm2%棉子糖+0.1%葡萄糖中的低生长速率(0.03hr-1)下的渗漏性。

7.14.2.结果与讨论

图.14a和14b中示出了来自各种合成pgmal启动子的gfp荧光数据。如图.14a和14b所示,得到由麦芽糖诱导的具有不同启动子强度的合成pgmal启动子的梯状数据。此外,合成pgmal启动子的启动子强度相对不受细胞生长速率的影响。相比之下,当细胞在2%蔗糖(提供高细胞生长速率)和2%棉子糖(提供低细胞生长速率)中培养时,pmal启动子在启动子强度方面表现出相对较大的差异。如图.14a和14b所示,一些启动子(例如,pgmal_v5和pg2mal_v8)在未诱导条件下,在高生长速率和低生长速率下均表现出极低的渗漏性。

7.15实施例:第一轮筛选必需氨基酸生物合成基因以测试其在稳定化构建物中的适宜性

本实施例描述了筛选与四种天然gal调节子启动子(即pgal3、pgal2、pgal7和pgal10)可操作连接的必需氨基酸生物合成基因的各种组合,以确定它们作为稳定构建体在遗传修饰的宿主细胞中的适宜性。

表1.在第一轮筛选期间筛选的gal调节子启动子和氨基酸生物合成基因列表

使用ura3作为选择标记将gal调节子启动子和氨基酸生物合成基因的四十八种组合转化到酵母宿主细胞中。对于每种组合,通过同源重组,将pgal启动子直接插入在其内源性基因座处的选择的氨基酸生物合成基因起始密码子的上游。使用两种不同的菌株进行转化:含有天然gal80的y9213和y9213,所述gal80抑制用于生成法呢烯的生物合成途径中的酶的表达,并因此关闭法呢烯的生成。当必需氨基酸(蛋氨酸或赖氨酸)未添加至培养基中时,用作稳定化构建体的构建体将在两种菌株中表现出不同的细胞生长。如果构建体表现为合适的稳定化构建体,那么用此种构建体转化的菌株y9213可在不添加必需氨基酸(蛋氨酸或赖氨酸)的培养基中生长,因为在y9213中的组成型表达的转录激活因子gal4p将激活可操作连接至pgal启动子的氨基酸生物合成基因的表达。另一方面,含有用相同构建体转化的天然gal80的菌株y9213不会生长的很好,因为含有天然gal80的y9213将抑制gal调节子。

将包含可操作连接至pgal启动子的赖氨酸生物合成基因的转化体铺于含有0.2%赖氨酸的csm+2%葡萄糖琼脂板上或铺于不含赖氨酸的板上。将包含与pgal启动子可操作连接的蛋氨酸生物合成基因的转化体铺于含有20mg/l蛋氨酸的csm+2%葡萄糖琼脂板上,或铺于不含蛋氨酸的琼脂板上。所述板在30℃下培养4-5天。目视比较在所述板上生长的菌落。

将包含与pgal启动子可操作连接的赖氨酸生物合成基因的转化体在含有2%蔗糖和0.1%赖氨酸的bsm液体培养基或不含赖氨酸的bsm液体培养基的96孔板中培养。将包含与pgal启动子可操作连接的蛋氨酸生物合成基因的转化体在包含2%蔗糖和20mg/l蛋氨酸的bsm液体培养基或不含蛋氨酸的bsm液体培养基的96孔板中培养。所述板在30℃下培养约1至2天。目视比较在含有和不含其各自必需氨基酸的情况下生长的转化体的细胞密度。

基于目视比较,发现当与gal调节子偶联时,氨基酸生物合成基因的几种组合能够阻止含有天然gal80的菌株y9213中而非y9213菌株中的细胞生长。譬如,当在不含赖氨酸的培养基(或met2构建体的蛋氨酸)中培养时,与所有4种pgal启动子偶联的met2、lys2、lys1和lys4基因阻止了含有天然gal80的菌株y9213中而非y9213菌株中的细胞生长。lys9,当与pgal2或pgal3偶联时,能够阻止含有天然gal80的菌株y9213中而非y9213菌株中的细胞生长。所述这些结果表明与pgal启动子可操作连接的氨基酸生物合成基因的各种组适于在酵母细胞中基于营养缺陷型的条件下产生gal调节子。

7.16实施例:第二轮筛选必需氨基酸生物合成基因

本实施例描述了来自实施例7.15的必需氨基酸生物合成基因的第二轮筛选,所述必需氨基酸生物合成基因与另外的pgal启动子可操作地连接以确定它们作为稳定构建体在遗传修饰的宿主细胞中的适宜性。

如下表2所示,为所选的八种氨基酸合成基因产生更全面的启动子交换文库。pgalx_v#启动子是工程化pgal启动子,其通过改变gal4p结合位点的数量和位置而具有增加或降低的启动子强度;所述这些衍生自天然pgal启动子(在名称中用x表示),并且启动子的工程化版本(工程型)在它们的名称中具有版本号(型号),其名称是从原始天然启动子的名称衍生而来。酿酒酵母的赖氨酸或蛋氨酸生物合成基因中的每一种均是可公开获得的,并可从例如酵母基因组数据库(www.yeastgenome.org)或从基因库(genbank)获得。实施例章节中使用的赖氨酸和蛋氨酸生物合成基因的核苷酸序列也提供在序列表中。

表2.第二轮筛选的启动子和基因列表

在第二轮筛选期间,将含有表2中所示的13种pgal启动子(6种天然启动子和7种工程合成启动子)和7种不同生物合成基因的各种组合的启动子交换文库转化到麦芽糖开关菌株h中。菌株h含有上述非可切换菌株y9213的相同核酸元件,并被制成“可切换的”菌株,即在麦芽糖存在下通过染色体整合在麦芽糖响应型启动子pmal32(seqidno:34)控制下的gal80拷贝来抑制。对于每种组合,通过同源重组将pgal启动子直接插入其内源性基因座处的所选氨基酸生物合成基因的起始密码子的上游。

包含与pgal启动子可操作连接的赖氨酸生物合成基因的转化体在csm+2%葡萄糖琼脂板上在四种不同条件下进行第二轮筛选:1)含有2%葡萄糖和1%麦芽糖但不含赖氨酸的csm琼脂板;2)含有2%葡萄糖、1%麦芽糖和0.1%赖氨酸的csm琼脂板;3)含有2%葡萄糖但不含赖氨酸的csm琼脂板;4)含有2%葡萄糖和0.1%赖氨酸的csm琼脂板。对于包含可操作连接至pgal启动子的蛋氨酸生物合成基因的转化体,在条件2)和4)中,所述csm琼脂板含有20mg/l蛋氨酸而非赖氨酸。所述板在约30℃下培养4-5天。目视比较在四种不同条件下培养的转化体在板上生长的菌落大小和/或密度。

在含有2%蔗糖的bsm液体培养基中进行类似的一组实验。包含与pgal启动子可操作连接的赖氨酸生物合成基因的转化体在以下四种条件下培养:1)含有2%蔗糖和1%麦芽糖但不含赖氨酸的bsm培养基;2)含有2%蔗糖、1%麦芽糖和0.1%赖氨酸的bsm培养基;3)含有2%蔗糖但不含赖氨酸的bsm培养基;和4)含有2%蔗糖和0.1%赖氨酸的bsm培养基。所述转化体在约30℃下培养1-2天。目视比较在四种不同条件下生长的转化体的细胞密度。

启动子和基因的最佳组合将使转化的细胞在不含赖氨酸(或蛋氨酸)的“开启”状态(生成阶段)期间生长,但将阻止细胞在不含赖氨酸(或蛋氨酸)的“关闭”状态(构建阶段)期间生长。不含赖氨酸(或蛋氨酸)条件的“关闭”状态模拟gal80的再激活,其可能由于在遗传修饰的酵母的长期发酵过程中自发突变而发生。当表达gal80时,含有启动子和基因的最佳组合的细胞应不能生长。

图.18阐明了可操作连接至lys2(pgal_v3>lys2)的pgal10_v3转化的菌株h的筛选策略和生长表型。如图.18的左上象限所示,在含有麦芽糖但不含赖氨酸(gal80表达)的培养基中培养的转化细胞不在琼脂板上或不在液体培养基中生长。如图.18的左下象限所示,在含有右旋糖但不含赖氨酸(无gal80表达)的培养基中培养的转化细胞在琼脂板上和液体培养基中生长。如图.18的右上象限所示,在含有麦芽糖和赖氨酸(gal80表达)的培养基中培养的转化细胞生长。如图.18的右下象限所示,在含有右旋糖和赖氨酸(无gal80表达)的培养基中培养的转化细胞生长。

采用图.18中所示的筛选策略,将包含与pgal启动子可操作连接的氨基酸生物合成基因的各种组合的转化体进行测试。在所述组合中,以下构建体表现出可辨别的生长表型差异:pgal10_v3>lys9,pgal2_v2>lys1,pgal2_v3>lys1,pgal7_v2>lys1,pgal80>lys1,pgcy1>lys1。总体而言,发现具有低启动子强度的合成pgal启动子就在gal调节子的“开启”与“关闭”状态期间提供差异细胞生长方面表现最佳。

7.17实施例:由两种稳定化构建体所表现出的差异生长表型的附加测试

本实施例描述了在y9213菌株背景中由两种稳定化构建体所表现出的差异生长表型的附加测试。

在第二轮筛选期间,当在含有麦芽糖但不添加赖氨酸的培养基中培养时,一些构建体显示出非常低的生长,而在含有蔗糖但不添加麦芽糖的培养基中培养时,保持良好生长。选择pgal2_v3>lys1作为本组的代表性构建体进行进一步测试。选择在发酵罐中进一步测试的构建体有pgal10_v3>lys9和pgal2_v3>lys1。

将每个稳定化构建体转化到菌株中,所述菌株已转化到菌株y9213中。对于预培养条件,将培养的菌株在含有360μl鸟种培养基(birdseedmedia,bsm,最初由vanhoek等人描述(2000年))的无菌96孔板(1.1ml有效体积;axygen)中生长。对于预培养条件,碳源通常为1.4%蔗糖和0.7%麦芽糖的混合物,并向培养基中加入0.1%赖氨酸。将单菌落挑入每个孔中,并在33.5℃、80%湿度和1000rpm下孵育约72小时(inforsmultitron(振荡培养箱);atrbiotec)。

对于生成阶段实验,将上述饱和培养物以1/25稀释到含有145μlbsm和5μl矿物油的1.1ml无菌板中。碳源是2.3%蔗糖和1.7%麦芽糖的混合物。培养基中麦芽糖的存在将激活gal80的表达,因此预期可抑制可操作连接至gal启动子的lys1或lys9的表达。在生成阶段期间,将菌株在存在0.1%赖氨酸或者不存在赖氨酸的培养基中进行培养,以确定添加的赖氨酸是否可减轻这些菌株中的条件性营养缺陷。培养72小时后,根据实施例7.1中描述的技术来测定生成阶段培养物中的细胞密度。

如图.19所示,含有稳定构建体的两种菌株在没有添加赖氨酸的培养基中显示出非常低的生长,而在添加有赖氨酸的培养基中显示出良好生长。图.19所示结果表明构建体pgal10_v3>lys9和pgal2_v3>lys1均是用于在遗传修饰的宿主细胞中稳定异源性非分解代谢化合物生成的稳定化构建体的良好候选。

7.18实施例:法呢烯生成菌株中的稳定化构建体在长时间发酵过程中稳定法呢烯的生成

本实施例提供的结果证明,当宿主细胞用稳定化构建体转化(例如,条件性必需lys1或lys9基因与pgal启动子可操作地连接)时,能够产生类异戊二烯法呢烯并且在麦芽糖开关的负调控下包含mev途径的宿主细胞在长时间发酵过程中表现出提高的法呢烯生成稳定性。

将对照麦芽糖可切换菌株e和用稳定化构建体(pgal10_v3>lys9和pgal2_v3>lys1)转化的这些菌株最初均在含有2%右旋糖、1%麦芽糖和2g/l赖氨酸的固体琼脂培养基上剔除,并在30℃下生长直至菌落可见。通过将单菌落接种到含有3ml的bsm2%蔗糖、1%麦芽糖和1g/l赖氨酸的15ml试管中来制备种子小瓶。大约48小时后,将全部3ml转移至含有125ml的2%蔗糖、1%麦芽糖和1g/l赖氨酸bsm(种子小瓶培养基)的500ml一次性摇瓶中。细胞在30℃下、转速为200rpm的振荡器中生长,直至od600达到4和7之间。一旦达到所需od,将36ml无菌50%甘油储备液加入到84ml培养物中,将悬浮液等分到种子小瓶中,并将种子小瓶以约1℃/min的速率缓慢冷冻至-80℃。通过将一个或多个种子小瓶解冻到含有50ml的1.6%蔗糖、0.4%葡萄糖、1%麦芽糖、1g/l赖氨酸bsm(生物量构建培养基)的250ml摇瓶中,和通过在34℃和200rpm下生长24小时来完成发酵之前的生物量构建。然后将此培养物的一部分转移至含有100ml相同培养基的500ml烧瓶中以达到0.1的起始od600值,并再培养24小时。然后将25ml此培养物用于接种含有225mlbsm培养基的0.5l发酵罐,所述培养基不含任何糖。根据需要补充甘蔗糖浆(不含任何麦芽糖或赖氨酸),然后在最大化法呢烯产率的饲养方案下于34℃下发酵13天。

每天更新生成的法呢烯的总量和细胞消耗的总糖量,并且每间隔24小时测定这两个值的比值,通过在任何区间中观察到的最高产率进行归一化处理,并对法呢烯发酵罐区间产率归一化作图,如图.20所示。将图.20所示的归一化法呢烯区间产率相对于在生成阶段在96小时时测定的菌株f的区间法呢烯产率进行归一化。

如图.20所示,麦芽糖可切换亲本菌株e的归一化区间法呢烯产率在约120小时时达到峰值,并且所述归一化区间法呢烯产率从其峰值下降至远低于具有稳定化构建体的可切换子株在200小时时的峰值产率的约40%。相比之下,包含稳定化构建体(包含pgal10_v3>lys9的菌株f;包含pgal2_v3>lys1的菌株g)的子株可维持在120小时至约300小时范围内其峰值的至少约70%的所述归一化区间产率。因此,所述这些结果表明,遗传修饰的宿主细胞中的稳定化构建体在长期发酵过程中对异源性化合物法呢烯的生成具有稳定作用。

由任何本发明实施方案或附图中所描述的一个或多个特征可与任何本发明所述的其他实施方案或附图中所描述的一个或多个特征组合,而不背离本发明的范围。

本说明书中引用的所有出版物、专利和专利申请通过引用并入本文,如同每个单独的出版物或专利申请被具体地和单独地指出通过引用并入。尽管为了清楚理解的目的,已通过举例说明和实施例的方式详细描述了上述发明,但鉴于本发明的教导,对于本领域普通技术人员而言显而易见是,可在不脱离所附权利要求的精神或范围的情况下进行某些改变和修改/修饰。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1