Pufa聚酮化合物合酶系统及其用途的制作方法

文档序号:408367阅读:704来源:国知局
专利名称:Pufa聚酮化合物合酶系统及其用途的制作方法
技术领域
本发明涉及来自微生物,包括诸如Thraustochytrid微生物的真核生物的多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统。更具体地说,本发明涉及编码非细菌PUFAPKS系统的核酸,涉及非细菌PUFAPKS系统,涉及含有非细菌PUFAPKS系统的遗传修饰的生物体,且涉及制备和使用本文公开的非细菌PUFAPKS系统的方法。本发明还涉及鉴定含有PUFAPKS系统的细菌和非细菌微生物的方法。
背景技术
聚酮化合物合酶(PKS)系统是本领域普遍已知的脂肪酸合酶(FAS)系统衍生的酶复合物,但它通常被高度修饰以产生一般与脂肪酸有很小相似性的特异性产物。研究人员尝试了开发在文献中描述过的聚酮化合物合酶(PKS)系统,它们属于一般称为II型,I型和模块的三种基本类型之一。II型系统的特征是可分离的蛋白质,各蛋白质完成不同的酶促反应。酶协调作用以产生最终产物且该系统中的每个酶在最终产物的生产中一般参与几次。这类系统以类似于在植物和细菌中发现的脂肪酸合酶(FAS)系统的方式操作。I型PKS系统与II型系统的相似之处在于酶以反复的方式用于生产最终产物。I型与II型的区别在于酶活性发生在更大的蛋白质结构域中,而不是与可分离的蛋白质相关。该系统类似于在动物和真菌中发现的I型FAS系统。
与I型和II型系统相反,在模块PKS系统中,各酶结构域在最终产物的生产中只使用一次。该结构域在极大型蛋白质中发现且各反应的产物传递到PKS蛋白质的另一结构域上。另外,在上述所有PKS系统中,如果在最终产物中引入碳-碳双键,通常为反式构型。
在上述I型和II型PKS系统中,每次循环进行同一组反应直到获得最终产物。在生物合成过程期间不允许导入特有反应。模块PKS系统需要的巨大蛋白质在反复的反应中不能节约利用(即,每次反应需要不同的结构域)。另外,如上所述,在所有以前所述PKS系统中以反式构型导入碳-碳双键。
多不饱和脂肪酸(PUFA)是大多数真核生物中膜脂类的关键成份(Lauritzen等,Prog.Lipid Res.40 1(2001);McConn等,Plant J.15,521(1998))且是某些激素和信号分子的前体(Heller等,Drugs 55,487(1998);Creelman等,Annu.Rev.PlantPhysiol.PlantMol Biol.48,355(1997))。已知的PUFA合成途径包含通过延长和需氧去饱和反应加工脂肪酸合酶(FAS)产生的饱和16:0或18:0脂肪酸(缩写X:Y表示含有X个碳原子和Y个顺式双键的酰基基团;PUFA的双键位置相对于脂肪酸链的甲基碳(ω3或ω6)用双键的系统亚甲基中断表示)(Sprecher,Curr.Opin.Clin.Nutr.Metab.Care 2,135(1999);Parker-Barnes等,Proc.Natl.Acad.Sci.USA 97,8284(2000);Shanklin等,Annu.Rev.Plant Physiol.Plant Nol.Biol.49,611(1998))。从乙酰-CoA开始,DHA的合成需要约30个不同的酶活性和几乎70个反应,包括4个脂肪酸合成循环的重复步骤。聚酮化合物合酶(PKSs)完成一些与FAS相同的反应(Hopwood等,Annu.Rev.Genet.24,37(1990);Bentley等,Annu.Rev.Microbiol.53,411(1999))且使用相同的小蛋白(或结构域),即酰基载体蛋白(ACP),作为生长碳链的共价连接位点。然而,在这些酶系统中,通常省去了FAS中所见的还原,脱水和还原的整个循环,从而产生高度衍生化的碳链,一般含有许多酮基和羟基以及反式构型的碳-碳双键。PKSs的线型产物通常环化以形成复杂的生化试剂,包括抗生素和许多其它次级产物(Hopwood等,(1990)出处同上;Bentley等,(1999),出处同上;Keating等,Curr.Opin.Chem.Biol.3,598(1999))。
从包括希瓦氏菌属(Shewanella)种类的海洋细菌的一些物种中已经报导了诸如二十二碳六烯酸(DHA;22:6ω3)和二十碳五烯酸(EPA;20:5ω3)的极长链PUFA(Nichols等,Curr.Op.Biotechnol.10,240(1999);Yazawa,Lipids 31,S(1996);DeLong等,Appl.Environ.Microbiol.51,730(1986))。对来自希瓦氏菌属种类菌株SCRC2738的基因组片段(克隆为质粒pEPA)的分析导致鉴定了5个可读框(Orfs),总计20Kb,它们是大肠杆菌中生产EPA的必要和充分条件(Yazawa,(1996),出处同上)。一些预测的蛋白结构域是FAS酶的同源物,而其它区域与已知功能的蛋白质无同源性。根据这些观察和生化研究,表明希瓦氏菌属中的PUFA合成包含FAS产生的16-或18-碳脂肪酸的延长和通过不明确的需氧去饱和酶插入双键(Watanabe等,J.Biochem.122,467(1997))。对5个希瓦氏菌属Orfs编码的蛋白质序列的再检查得出了该假设并不正确的认识。5个Orfs内的至少11个区域可鉴定为推定的酶结构域(参见Metz等,Science 293290-293(2001))。与基因数据库中的序列比较时,其中7个与PKS蛋白比与FAS蛋白相关性更强。该组中包含的结构域推定为编码丙二酰-CoA:ACP酰基转移酶(MAT),3-酮脂酰-ACP合酶(KS),3-酮脂酰-ACP还原酶(KR),酰基转移酶(AT),磷酸泛酰巯基乙胺转移酶,链长(或链起始)因子(CLF)和非常罕见的6个ACP结构域簇(即,存在两个以上聚集的ACP结构域在PKS或FAS序列中以前未见报导)。然而,三个区域与细菌FAS蛋白同源性更高。其中一个类似于最近描述的来自肺炎链球菌(Streptococcus pneumoniae)的三氯苯氧氯酚抗性烯酰还原酶(ER)(Heath等,Nature 406,145(2000);使用LALIGN程序(模型,BLOSUM50;间隔缺口罚分,-10;延长罚分,-1)比较ORF8肽与肺炎链球菌烯酰还原酶在386aa的重叠区内显示出49%的相似性)。两个区域是fabA编码的大肠杆菌FAS蛋白的同源物,它催化反式-2-癸烯酰-ACP的合成和该产物向顺式-3-癸烯酰-ACP的可逆异构化(Heath等,J.Biol Chem.,271,27795(1996))。因此,很可能希瓦氏菌属的EPA中的至少一些双键由Orf7中的FabA-样结构域催化的脱水酶-异构酶机制引入。
厌氧生长的含有pEPA质粒的大肠杆菌细胞与需氧培养物积累相同水平的EPA(Metz等,2001,出处同上),表明在EPA合成中不涉及氧依赖型去饱和酶。当pEPA导入不能合成单不饱和脂肪酸且生长需要不饱和脂肪酸的大肠杆菌fabB-突变体时,所得的细胞丧失其脂肪酸辅源营养。它们也比其它含有pEPA的菌株积累更高水平的EPA,表明EPA与内源性产生的单不饱和脂肪酸竞争转移到甘油脂上。当含有pEPA的大肠杆菌细胞在[13C]-乙酸盐存在下生长时,对从细胞纯化的EPA进行13C-NMR分析的数据证实了EPA的身份且提供了该脂肪酸从乙酰-CoA和丙二酰-CoA合成的证据(参见Metz等,2001,出处同上)。来自含有pEPA的fabB-细胞的无细胞匀浆从[14C]-丙二酰-CoA合成EPA和饱和脂肪酸。当匀浆分离成200,000xg高速沉淀和无膜的上清部分时,饱和脂肪酸合成局限于上清,与II型FAS酶的可溶性质一致(Magnuson等,Microbiol.Rev.57,522(1993))。仅在高速沉淀部分中发现EPA的合成,表明EPA合成的发生可不依赖于大肠杆菌FAS酶或细胞质成份的可溶性中间物(例如160-ACP)。由于希瓦氏菌属EPA基因编码的蛋白质不特别疏水,因此EPA合成活性局限于该成分中反映了膜相联性酰基受体分子的要求。另外,与大肠杆菌FAS相反,EPA合成是特异性的NADPH-依赖型且不需要NADH。所有这些结果与编码多功能PKS的pEPA基因一致,该多功能PKS独立于FAS,延长酶,和去饱和酶活性起作用以直接合成EPA。很可能在希瓦氏菌属中鉴定的PUFA合成的PKS途径在海洋细菌中是普遍的。在Photobacterium profundum(Allen等,Appli.Environ.Microbiol.651710(1999))和Moritella marina(Vibrio marinus)(Tanaka等,Biotechnol.Lett.21939(1999))中已经鉴定了与希瓦氏菌属基因簇高度同源的基因。
对希瓦氏菌属进行的生化和分子遗传分析提供了聚酮化合物合酶能够从丙二酰-CoA合成PUFA的确凿证据。由希瓦氏菌属PKS合成EPA的完整方案已经提出。与大肠杆菌FabA蛋白同源的蛋白质结构域的鉴定,和细菌EPA合成在厌氧条件下发生的观察结果提供了顺式双键的插入通过双功能脱水酶/2-反式,3-顺式异构酶(DH/2,3I)的作用发生这一机制的证据。在大肠杆菌中,3-顺式酰基中间物与丙二酰-ACP的缩合需要特定的酮脂酰-ACP合酶且这支持在希瓦氏菌属基因簇中存在两个KS(在Orf5和Orf7中)的理论。然而,PKS循环以两个碳的增量延长碳链,而在EPA产物中双键在每第三个碳处出现。如果通过2-反式,2-顺式异构化(DH/2,2I)接着在延长的脂肪酸链中掺入顺式双键在EPA的C-14和C-8处产生双键就可解决这一差异。在例如,视黄素类(retinoid)循环的11-顺式-视黄醛合成中已知会发生反式双键酶促转化成顺式构型而不发生键迁移(Jang等,J.Biol.Chem.275,28128(2000))。尽管在希瓦氏菌属PKS中尚未鉴定这样的酶功能,但是它可能属于一个未鉴定的蛋白质结构域。
希瓦氏菌属和另一海洋细菌Vibrio marinus中PUFA合成的PKS途径在美国专利号6,140,486(从1998年6月4日申请的,发明名称为“通过在植物中表达聚酮化合物类合成基因生产多不饱和脂肪酸”的美国申请系列号09/090,793出版,在此引用以其整体作为参考)中进行了详细描述。
多不饱和脂肪酸(PUFA)据认为可用于营养,制药,工业,和其它目的。来自天然来源和化学合成的PUFA的昂贵供应不足以满足商业需要。由于许多分离的去饱和酶和延长酶是从大多数植物物种中共有的亚油酸(LA,18:2Δ9,12)到更饱和且更长链PUFA的脂肪酸合成中所必需的,因此改造植物宿主细胞以表达诸如EPA和DHA的PUFA可能需要表达5种或6种分离的酶活性以实现至少EPA和DHA的表达。另外,为了生产可用量的该PUFA,可能需要其它的改造努力,例如,下调竞争底物的酶,通过例如诱变改造成具有更高的酶活性或者将酶定向到质体细胞器上。因此有利的是从天然产生这些脂肪酸的物种获得包含PUFA生物合成的遗传材料并单独或与异源系统结合表达可改造成允许生产商品量的PUFA的该分离材料。
在诸如希瓦氏菌属和Vibrio marinus的海洋细菌中发现的PUFA PKS系统(参见美国专利号6,140,486,出处同上)为商品PUFA生产的新方法提供了资源。然而,这些海洋细菌具有的缺陷最终将限制其在商业水平上的利用。首先,尽管美国专利号6,140,486公开了海洋细菌PUFA PKS系统可用于遗传修饰植物,但是海洋细菌在寒冷的海洋环境中自然生活和生长且这些细菌的酶系统在30℃以上不能很好地发挥功能。相反,许多农作物植物作为使用PUFA PKS系统进行遗传改造的有吸引力的目标在30℃以上和变动到高于40℃的温度下为正常的生长条件。因此,海洋细菌PUFA PKS系统预期不容易适应正常生长条件下的植物表达。而且海洋细菌PUFA PKS基因由于是细菌来源,可能与真核宿主细胞的基因组不相容,或者至少需要大量的修改以便在真核宿主中起作用。另外,已知的海洋细菌PUFA PKS系统不能直接产生甘油三酯,而直接产生甘油三酯是所期望的,因为甘油三酯是微生物中的脂类储存产物且因此可在微生物/植物细胞中以极高的水平(例如,高达80-85%的细胞重量)积累(与一般仅以低水平(例如最大值不超过细胞重量的10-15%)积累的“结构”脂产物(例如磷脂)相反)。
因此,本领域需要具有更大适应性的其它PUFA PKS系统用于商业用途。
发明简述本发明的一个实施方案涉及含有选自如下的核酸序列的分离核酸分子(a)编码选自SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,或其生物学活性片段的氨基酸序列的核酸序列;(b)编码选自SEQ ID NO8,SEQ IDNO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ I8,SEQ ID NO30,SEQ ID NO32,或其生物学活性片段的氨基酸序列的核酸序列;(c)编码与(a)的氨基酸序列中至少500个连续氨基酸有至少约60%相同的氨基酸序列的核酸序列,其中该氨基酸序列具有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的生物学活性;(d)编码与(b)的氨基酸序列至少约60%相同的氨基酸序列的核酸序列,其中该氨基酸序列具有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的生物学活性;和(e)与(a),(b),(c),或(d)的核酸序列完全互补的核酸序列。在另一方面,该核酸序列编码与(1)选自由SEQ ID NO2,SEQ IDNO4,和SEQ ID NO6组成的组中的氨基酸序列的至少500个连续氨基酸至少约70%相同,或至少约80%相同,或至少约90%相同,或相同的氨基酸序列;和/或(2)编码与选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQ ID NO32的氨基酸序列至少约70%相同的氨基酸序列的核酸序列。在一个优选的实施方案中,该核酸序列编码选自SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ IDNO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ ID NO32和/或其生物学活性片段的氨基酸序列。在一个方面,该核酸序列选自SEQID NO1,SEQ ID NO3,SEQ ID NO5,SEQ ID NO7,SEQ ID NO9,SEQ ID NO12,SEQ ID NO17,SEQID NO19,SEQ ID NO21,SEQ ID NO23,SEQ ID NO25,SEQ ID NO27,SEQ ID NO29,和SEQ ID NO31。
本发明的另一实施方案涉及含有与至少一个转录调控序列可操作地相连的上述核酸分子的重组核酸分子。在另一实施方案中,本发明涉及直接用上述重组核酸分子转染的重组细胞。
本发明的另一实施方案还涉及遗传修饰的微生物,其中该微生物表达含有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个生物学活性结构域的PKS系统。PUFAPKS系统的至少一个结构域由选自如下的核酸序列编码(a)编码来自Thraustochytrid微生物的多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的核酸序列;(b)编码来自本发明的筛选方法鉴定的微生物的PUFA PKS系统的至少一个结构域的核酸序列;(c)编码选自由SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,和其生物学活性片段组成的组中的氨基酸序列的核酸序列;(d)编码选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ ID NO32,或其生物学活性片段的氨基酸序列的核酸序列;(e)编码与选自SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的至少500个连续氨基酸有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFAPKS系统的至少一个结构域的生物学活性;和,(f)编码与选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQ ID NO32的氨基酸序列具有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFAPKS系统的至少一个结构域的生物学活性。在该实施方案中,遗传修饰该微生物以影响PKS系统的活性。在上文(b)中提到的本发明的筛选方法包括(i)选择产生至少一种PUFA的微生物;和,(ii)从(i)中鉴定与发酵培养基中在大于5%饱和度,且更优选10%的饱和度,且更优选大于15%的饱和度,且更优选大于20%的饱和度的溶氧条件下微生物产生的PUFA相比,在发酵培养基中不足约5%饱和度的溶氧条件下具有产生增加的PUFA的能力的微生物。
在一个方面,该微生物内源性表达含有PUFA PKS系统的至少一个结构域的PKS系统,且其中在编码PUFA PKS系统的至少一个结构域的核酸序列中存在遗传修饰。例如,在编码具有至少一种下列蛋白质的生物学活性的结构域的核酸序列中存在遗传修饰丙二酰-CoA:ACP酰基转移酶(MAT),β-酮脂酰-ACP合酶(KS),酮还原酶(KR),酰基转移酶(AT),FabA-样β-羟酰-ACP脱水酶(DH),磷酸泛酰巯基乙胺转移酶,链长因子(CLF),酰基载体蛋白(ACP),烯酰ACP-还原酶(ER),催化反式-2-癸烯酰-ACP合成的酶,催化反式-2-癸烯酰-ACP向顺式-3-癸烯酰-ACP可逆异构化的酶,和催化顺式-3-癸烯酰-ACP延长成顺式-11-十八碳烯酸的酶。在一个方面,在编码选自下组的氨基酸序列的核酸序列中存在遗传修饰(a)与选自SEQ ID NO2,SEQ IDNO4,或SEQ ID NO6的氨基酸序列的至少500个连续氨基酸具有至少约70%的相同性,且优选至少约80%的相同性,且更优选至少约90%的相同性且更优选相同的氨基酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性;和,(b)与选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQID NO32的氨基酸序列具有至少约70%相同性,且优选至少约80%相同性,且更优选至少约90%相同性且更优选相同的氨基酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。
在一个方面,该遗传修饰的微生物是Thraustochytrid,它包括,但不限于,选自Schizochytrium和破囊壶菌属(Thraustochytrium)中的Thraustochytrid。在另一方面,该微生物进一步被遗传修饰成重组表达编码来自细菌PUFAPKS系统,I型PKS系统,II型PKS系统,和/或模块PKS系统的至少一个生物学活性结构域的至少一个核酸分子。
在该实施方案的另一方面,该微生物内源性表达含有PUFA PKS系统的至少一个生物学活性结构域的PUFA PKS系统,且其中该遗传修饰包含表达选自由编码来自第二种PKS系统的至少一个生物学活性结构域的重组核酸分子和编码影响PUFA PKS系统活性的蛋白质的重组核酸分子组成的组中的重组核酸分子。优选的是,该重组核酸分子包含任一上述核酸序列。
在该实施方案的一个方面中,该重组核酸分子编码磷酸泛酰巯基乙胺转移酶。在另一方面,该重组核酸分子包含编码来自细菌PUFA PKS系统,I型PKS系统,II型PKS系统,和/或模块PKS系统的至少一个生物学活性结构域的核酸序列。
在该实施方案的另一方面,通过用编码多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的重组核酸分子转染遗传修饰该微生物。该重组核酸分子可包括含有任一上述核酸序列的任意重组核酸分子。在一个方面,该微生物进一步被遗传修饰成重组表达编码来自细菌PUFA PKS系统,I型PKS系统,II型PKS系统,或模块PKS系统的至少一个生物学活性结构域的至少一个核酸分子。
本发明的另一实施方案还涉及遗传修饰的植物,其中该植物被遗传修饰成重组表达含有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个生物学活性结构域的PKS系统。该结构域可由任一上述核酸序列编码。在一个方面,该植物进一步被遗传修饰成重组表达编码来自细菌PUFA PKS系统,I型PKS系统,II型PKS系统,和/或模块PKS系统的至少一个生物学活性结构域的至少一个核酸分子。
本发明的另一实施方案涉及鉴定具有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的微生物的方法。该方法包括如下步骤(a)选择产生至少一种PUFA的微生物;和,(b)从(a)中鉴定与发酵培养基中在大于5%饱和度的溶氧条件下,更优选10%的饱和度,更优选大于15%的饱和度,且更优选大于20%的饱和度时微生物产生的PUFA相比,在发酵培养基中不超过约5%饱和度的溶氧条件下具有产生增加的PUFA的能力的微生物。产生至少一种PUFA且在不超过约5%饱和度的溶氧条件下具有产生增加的PUFA的能力的微生物鉴定为含有PUFA PKS系统的候选微生物。
在该实施方案的一个方面,步骤(b)包含从(a)中鉴定在不超过约2%饱和度的溶氧条件下,且更优选在不超过约1%饱和度的溶氧条件下,甚至更优选在约0%饱和度的溶氧条件下具有产生增加的PUFA的能力的微生物。
在该实施方案的另一方面,在(a)中选择的微生物具有通过吞噬作用消费细菌的能力。在另一方面,在(a)中选择的微生物具有简单的脂肪酸分布特征(profile)。在另一方面,在(a)中选择的微生物是非细菌微生物。在另一方面,在(a)中选择的微生物是真核生物。在另一方面,在(a)中选择的微生物是Thraustochytriales目的一个成员。在另一方面,在(a)中选择的微生物在高于约15℃,且优选高于约20℃,且更优选高于约25℃,且甚至更优选高于约30℃的温度下具有生产PUFA的能力。在另一方面,在(a)中选择的微生物具有以高于5%的生物体干重,且更优选高于10%的生物体干重生产所需生物活性化合物(例如,脂类)的能力。在还有另一方面,在(a)中选择的微生物其总脂肪酸高于30%是C14:0,C16:0和C16:1,同时也产生至少一种具有3个或更多个不饱和键的长链脂肪酸,且优选的是,在(a)中选择的微生物其总脂肪酸高于40%是C14:0,C16:0和C16:1,同时也产生至少一种具有3个或更多个不饱和键的长链脂肪酸。在另一方面,在(a)中选择的微生物其总脂肪酸高于30%是C14:0,C16:0和C16:1,同时也产生至少一种具有4个或更多个不饱和键的长链脂肪酸,且更优选同时也产生至少一种具有5个或更多个不饱和键的长链脂肪酸。
在该实施方案的另一方面,该方法还包含检测生物体是否含有PUFAPKS系统的步骤(c)。在该方面,该检测步骤可包括检测该微生物中与编码来自Thraustochytrid PUFA PKS系统的氨基酸序列的核酸序列在严格条件下杂交的核酸序列。另外,该检测步骤可包括检测生物体中用来自ThaustochytridPUFA PKS系统的核酸序列的寡核苷酸引物扩增的核酸序列。
本发明的另一实施方案涉及由上述筛选方法鉴定的微生物,其中该微生物被遗传修饰成通过PUFAPKS系统调节分子的生产。
本发明还有另一实施方案涉及生产生物活性分子的方法,该生物活性分子由聚酮化合物合酶系统产生。该方法包括在有效生产生物活性分子的条件下培养遗传修饰的生物体的步骤,该生物体表达含有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个生物活性结构域的PKS系统。PUFA PKS系统的结构域由任一上述核酸序列编码。
在该实施方案的一个方面,该生物体内源性表达含有PUFAPKS系统的至少一个结构域的PKS系统,且该遗传修饰在编码PUFA PKS系统的至少一个结构域的核酸序列上。例如,该遗传修饰与野生型生物体相比可改变至少一种由内源性PKS系统产生的产物。
在该实施方案的另一方面,该生物体内源性表达含有PUF APKS系统的至少一个生物活性结构域的PKS系统,且该遗传修饰包括用选自由编码来自第二种PKS系统的至少一个生物学活性结构域的重组核酸分子和编码影响PUFA PKS系统活性的蛋白质的重组核酸分子组成的组中的重组核酸分子转染该生物体。例如,该遗传修饰与野生型生物体相比可改变由内源性PKS系统产生的至少一种产物。
在该实施方案的还有另一方面中,通过用编码多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的重组核酸分子转染遗传修饰该生物体。在另一方面,该生物体产生的多不饱和脂肪酸(PUFA)分布特征不同于没有遗传修饰的天然生物体。在另一方面,该生物体内源性表达非细菌PUFA PKS系统,且其中该遗传修饰包括来自不同PKS系统的结构域取代编码非细菌PUFA PKS系统的至少一个结构域的核酸序列。
在还有另一方面,该生物体内源性表达非细菌PUFA PKS系统,该系统通过用重组核酸分子转染该生物体而被修饰,该重组核酸分子编码的蛋白质调节PUFA PKS系统产生的脂肪酸的链长。例如,编码调节脂肪酸链长的蛋白质的该重组核酸分子可取代非细菌PUFA PKS系统中编码链长因子的核酸序列。在另一方面,调节PUFA PKS系统产生的脂肪酸链长的蛋白质是链长因子。在另一方面,调节PUFA PKS系统产生的脂肪酸链长的蛋白质是指导合成C20单位的链长因子。
在一个方面,该生物体表达在选自编码FabA-样β-羟酰-ACP脱水酶(DH)结构域的区域和编码β-酮脂酰-ACP合酶(KS)的区域中含有遗传修饰的非细菌PUFA PKS系统,其中该修饰与没有该修饰相比改变了PUFA PKS系统产生的长链脂肪酸的比率。在一个方面,该修饰包含用不具有异构化活性的DH结构域取代非细菌PUFA PKS系统中的FabA-样β-羟酰-ACP脱水酶(DH)。在另一方面,该修饰选自由缺失全部或部分该区域,用来自不同生物的同源区域取代该区域,和突变该区域组成的组中。
在另一方面,该生物体表达PKS系统且该遗传修饰包含用来自PUFAPKS系统的FabA-样β-羟酰-ACP脱水酶(DH)区域取代不具有异构化活性的DH区域。
在另一方面,该生物体表达在烯酰-ACP还原酶(ER)区域中含有修饰的非细菌PUFA PKS系统,其中该修饰导致与没有修饰相比产生不同的化合物。例如,该修饰可选自由缺失全部或部分ER区域,用来自不同生物的ER区域取代该ER区域,和突变该ER区域组成的组中。
在一个方面,由本方法产生的生物活性分子可包括,但不限于抗炎症配制品,化疗剂,有效赋形剂,骨质疏松症药物,抗抑郁剂,抗惊厥剂,抗幽门螺杆菌(Heliobactor pylori)药物,治疗神经变性疾病的药物,治疗变性肝脏疾病的药物,抗生素,和降胆固醇配制品。在一个方面,该生物活性分子是多不饱和脂肪酸(PUFA)。在另一方面,该生物活性分子是包含顺式构型的碳-碳双键的分子。在另一方面,该生物活性分子是在每第三个碳包含一个双键的分子。
在该实施方案的一个方面,该生物体是微生物,在另一方面,该生物体是植物。
本发明的另一实施方案涉及产生一种植物的方法,该植物的多不饱和脂肪酸(PUFA)分布特征不同于天然植物,该方法包括遗传修饰该植物的细胞以表达含有至少一种重组核酸分子的PKS系统,该重组核酸分子含有编码PUFA PKS系统的至少一个生物活性结构域的核酸序列。该PUFA PKS系统的结构域由任一上述核酸序列编码。
本发明还有另一实施方案涉及修饰含有至少一种脂肪酸的终产物的方法,包括向终产物中加入由重组宿主细胞产生的油脂,该重组宿主细胞表达至少一种重组核酸分子,该重组核酸分子含有编码PUFA PKS系统的至少一个生物活性结构域的核酸序列。PUFA PKS系统的结构域由任一上述核酸序列编码。在一个方面,该终产物选自由饮食添加剂,食品,药物配制品,人源化动物乳汁,和婴儿配制品组成的组中。药物配制品可包括,但不限于抗炎症配制品,化疗剂,有效赋形剂,骨质疏松症药物,抗抑郁剂,抗惊厥剂,抗幽门螺杆菌药物,治疗神经变性疾病的药物,治疗变性肝脏疾病的药物,抗生素,和降胆固醇配制品。在一个方面,该终产物可用于治疗选自由慢性炎症,急性炎症,胃肠疾病,癌症,恶病质,心脏再狭窄,神经变性疾病,肝脏变性疾病,血脂疾病,骨质疏松症,骨关节炎,自身免疫疾病,先兆子痫,早产(preterm birth),年老相关性黄斑病,肺病,和过氧化物酶体疾病组成的组中的一种症状。
本发明还有另一实施方案涉及生产人源化动物乳汁的方法,包括用含有编码PUFA PKS系统的至少一个生物活性结构域的核酸序列的至少一个重组核酸分子遗传修饰产奶动物的产奶细胞。该PUFA PKS系统的结构域由任一上述核酸序列编码。
本发明还有另一实施方案涉及产生重组微生物的方法,包括遗传修饰微生物细胞以表达含有编码PUFA PKS系统的至少一个生物活性结构域的核酸序列的至少一种重组核酸分子。该PUFA PKS系统的结构域由任一上述核酸序列编码。
本发明还有另一实施方案涉及被修饰成表达多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的重组宿主细胞,其中该PKS催化重复的和非重复的酶反应。PUFA PKS系统包含(a)至少两个烯酰ACP-还原酶(ER)结构域;(b)至少6个酰基载体蛋白(ACP)结构域;(c)至少两个β-酮脂酰-ACP合酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;(g)至少一个链长因子(CLF)结构域;和(h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域。在一个实施方案中,PUFA PKS系统是真核PUFA PKS系统。在另一方面,PUFA PKS系统是藻类PUFA PKS系统,且优选Thraustochytriales PUFAPKS系统,它包括,但不限于Schizochytrium PUFA PKS系统或破囊壶菌属PUFA PKS系统。
在该实施方案中,PUFA PKS系统可在原核宿主细胞或在真核宿主细胞中表达。在一个方面,该宿主细胞是植物细胞。因此,本发明的一个实施方案是生产含有至少一种PUFA的产物的方法,包括在有效产生该产物的条件下生长含有该植物细胞的植物。宿主细胞可以是微生物且在这种情况下,本发明的一个实施方案是生产含有至少一种PUFA的产物的方法,包括在有效产生该产物的条件下培养含有该微生物细胞的培养物。在一个方面,PKS系统催化甘油三酯的直接生产。
本发明还有另一实施方案涉及遗传修饰的微生物,它含有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统,其中该PKS催化重复的和非重复的酶反应。PUFA PKS系统包含(a)至少两个烯酰ACP-还原酶(ER)结构域;(b)至少6个酰基载体蛋白(ACP)结构域;(c)至少两个β-酮脂酰-ACP合酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;(g)至少一个链长因子(CLF)结构域;和(h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域。该遗传修饰影响PUFA PKS系统的活性。在该实施方案的一个方面,该微生物是真核微生物。
本发明还有另一实施方案涉及被修饰成表达非细菌多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的重组宿主细胞,其中该非细菌PUFA PKS催化重复的和非重复的酶反应。该非细菌PUFA PKS系统包含(a)至少一个烯酰ACP-还原酶(ER)结构域;(b)多个酰基载体蛋白(ACP)结构域;(c)至少两个β-酮脂酰-ACP合酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;(g)至少一个链长因子(CLF)结构域;和(h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域。


图1是Schizochytrium PUFA PKS系统的结构域结构示意图。
图2显示了来自Schizochytrium和希瓦氏菌属的PKS结构域的比较。
图3显示了来自Schizochytrium的PKS结构域和来自念珠藻属(Nostoc)的其产物是不含任何双键的长链脂肪酸的相关PKS系统的比较。
发明详述本发明一般涉及非细菌衍生的多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统,一般涉及含有非细菌PUFA PKS系统的遗传修饰的生物体,涉及制备和使用该系统用于生产包括生物活性分子的目的产物的方法,涉及鉴定具有该PUFA PKS系统的新真核微生物的新方法。本文所用的PUFA PKS系统一般具有下列鉴定特征(1)作为该系统的天然产物产生PUFA;和(2)它含有组装进复合物的几个多功能蛋白质,该复合物同时进行脂肪酸链的反复加工和非反复加工,包括在选定循环中的反式-顺式异构化和烯酰还原反应(例如,参见图1)。
更具体地说,首先,构成本发明基础的PUFA PKS系统产生多不饱和脂肪酸(PUFA)作为产物(即,内源性(天然)含有该PKS系统的生物体使用该系统制备PUFA)。本文提及的PUFA优选是具有至少16碳的碳链长度的多不饱和脂肪酸,且更优选至少18碳,且更优选至少20碳,且更优选22或更多个碳,且具有至少3个或更多个双键,优选4个或更多个,且更优选5个或更多个,且甚至更优选6个或更多个双键,其中所有双键是顺式构型。本发明的一个目的是通过遗传操作或终产物的改造发现或创造产生具有所需链长和所需数目双键的多不饱和脂肪酸的PKS系统。PUFA的例子包括,但不限于,DHA(二十二碳六烯酸(22:6,ω-3)),DPA(鲱油酸(C22:5,ω-6)),和EPA(二十碳五烯酸(C20:5,ω-3))。
其次,本文所述PUFA PKS系统同时参与反复和非反复的反应,使得该系统不同于以前所述PKS系统(例如,I型,II型或模块型系统)。更具体地说,本文所述PUFA PKS系统含有在每次循环期间显示功能的结构域以及仅在某些循环中显示功能的结构域。该系统的一个关键方面涉及与细菌Fab A酶表现出同源性的结构域。例如,大肠杆菌的FabA酶表现出具有两种酶活性。它具有从含有羟基的碳链减去一个水分子(H2O),在该碳链中留下一个反式双键的脱水活性。另外,它具有将反式双键转变成顺式构型的异构酶活性。该异构化与双键位置迁移到相邻碳结合完成。在PKS(和FAS)系统中,主碳链以2个碳的增量延长。因此可预知这些PKS系统产生PUFA产物所需的延长反应的次数。例如,产生DHA(C22:6,均为顺式)需要10次延长反应。由于在终产物中仅有6个双键,这意味着在某些反应循环期间,双键被保留(作为顺式异构体),而在其它循环期间,双键在下一步延长前被还原。
在发现海洋细菌的PUFA PKS系统(参见美国专利号6,140,486)前,还不了解PKS系统具有这种反复性和选择性酶反应的组合,且认为它们不能以顺式构型产生碳-碳双键。然而,本发明所述PUFA PKS系统具有导入顺式双键的能力和改变循环中反应顺序的能力。
因此,本发明人提出使用PUFA PKS系统的这些特征生产以前所述(II型,I型和模块型)PKS系统不能产生的各种生物活性分子。这些生物活性分子包括,但不限于,多不饱和脂肪酸(PUFA),抗生素或其它生物活性化合物,其中许多分子将在下文讨论。例如,使用本文所述PUFA PKS基因结构的知识,可使用许多方法中的任一种改变PUFA PKS基因,或者将这些基因的部分与包括其它PKS系统的其它合成系统结合以便产生新产物。该系统的特定类型同时进行反复性和选择性反应的内在能力使得该系统能够产生对PKS系统的其它类型采用相似方法不能发现的产物。
在一个方面,根据本发明的PUFA PKS系统包含至少下列生物活性结构域(a)至少两个烯酰ACP-还原酶(ER)结构域;(b)至少6个酰基载体蛋白(ACP)结构域;(c)至少两个β-酮脂酰-ACP合酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;(g)至少一个链长因子(CLF)结构域;和(h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域。这些结构域的功能分别是本领域公知的且在下文关于本发明的PUFAPKS系统中将进行详细描述。
在另一实施方案中,PUFA PKS系统包含至少下列生物活性结构域(a)至少一个烯酰ACP-还原酶(ER)结构域;(b)多个酰基载体蛋白(ACP)结构域(至少4个,且优选至少5个,且更优选至少6个,甚至更优选7,8,9,或9个以上);(c)至少两个β-酮脂酰-ACP合酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;(g)至少一个链长因子(CLF)结构域;和(h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域。优选的是,该PUFA PKS系统是非细菌PUFA-PKS系统。
在一个实施方案中,本发明的PUFA PKS系统是非细菌PUFA PKS系统。换句话说,在一个实施方案中,本发明的PUFA PKS系统从不是细菌的生物体中分离,或者是来自不是细菌的诸如真核生物或古细菌的生物体的PUFAPKS系统的同源物或衍生物。真核生物根据细胞的分化程度与原核生物区分开来。具有更多分化的高等群体称为真核生物。具有较少分化的细胞的低等其它称为原核生物。一般来说,原核生物不具有核膜,细胞分裂期间不表现为有丝分裂,仅有一个染色体,其细胞质含有70S核糖体,它们不具有任何线粒体,内质网,叶绿体,溶酶体,或高尔基体,其鞭毛(如果存在)由单一原纤维组成。相反真核生物具有核膜,它们在细胞分裂期间表现为有丝分裂,它们具有许多染色体,其细胞质含有80S核糖体,它们具有线粒体,内质网,叶绿体(在藻类中),溶酶体和高尔基体,且其鞭毛(如果存在)由许多原纤维组成。一般来说,细菌是原核生物,而藻类,真菌,原生生物,原生动物和高等植物是真核生物。海洋细菌(例如,希瓦氏菌属和Vibrio marinus)的PUFAPKS系统不是本发明的基础,尽管本发明确实包含使用来自这些细菌PUFAPKS系统的结构域与本发明的非细菌PUFA PKS系统的结构域相结合。例如,根据本发明,可产生遗传修饰的生物体,它掺入了非细菌PUFA PKS功能域与细菌PUFA PKS功能域,以及来自其它PKS系统(I型,II型,模块型)或FAS系统的PKS功能域或蛋白质。
Schizochytrium是以DHA和鲱油酸(DPA;22:5ω-6)积累大量三酰甘油,例如,占干重30%的DHA+DPA的Thraustochytrid海洋微生物(Barclay等,J.Appl.Phycol.6,123(1994))。在通过延长/去饱和途径合成20-和22-碳PUFA的真核生物中,18-,20-和22-碳中间体的分子库相当大,因此使用[14C]-乙酸盐的体内标记实验揭示了预期中间体的清楚前体-产物动力学(Gellerman等,Biochim.Biophys.Acta 57323(1979))。另外,给该生物体提供的外源性放射标记的中间体转变成最终的PUFA产物。本发明人显示了[1-14C]-乙酸盐迅速被Schizochytrium细胞吸收且掺入脂肪酸,但在最短标记时间(1分钟)时,在脂肪酸中回收到含有31%标记的DHA,且该百分数在10-15分钟的[14C]-乙酸盐掺入和随后24小时的培养物生长期间基本上保持不变(参见实施例3)。同样,DPA通过实验表现出10%的标记。没有证据表明在16-或18-碳脂肪酸与22-碳多不饱和脂肪酸之间存在前体-产物关系。这些结果与从包含极小(很可能与酶结合的)中间体库的[14C]-乙酸盐迅速合成DHA一致。来自Schizochytrium培养物的无细胞匀浆将[1-14C]-丙二酰-CoA掺入DHA,DPA,和饱和脂肪酸中。相同的生物合成活性在100,000xg的上清成分中保留但在膜沉淀中不存在。因此,Schizochytrium中的DHA和DPA合成不涉及类似于其它真核生物所述膜结合的去饱和酶或脂肪酸延长酶(Parker-Barnes等,2000,出处同上;Shanklin等,1998,出处同上)。这些分级分离数据与从希瓦氏菌属酶获得的数据相反(参见Metz等,2001,出处同上)且表明Schizochytrium酶使用不同的(可溶性)酰基受体分子,例如CoA。
在共同未决的美国申请系列号09/231,899中,从Schizochytrium构建了cDNA文库且测序了约8,000个随机克隆(ESTs)。在这些资料组中,仅鉴定了一个中度表达的基因(全部序列的0.3%)是脂肪酸去饱和酶,尽管一个单一克隆(0.01%)代表第二个推定的去饱和酶。相反,图2中所示的与希瓦氏菌属PKS基因的11个结构域中的8个表现出同源性的序列均以0.2-0.5%的频率被鉴定。在美国申请系列号09/231,899中,测序了与希瓦氏菌属PKS基因表现出同源性的几个cDNA克隆,且各种克隆装配成代表两个部分可读框和一个完整可读框的核酸序列。含有美国申请系列号09/231,899所述第一个部分可读框的cDNA序列的核苷酸390-4443(其中称为SEQ ID NO69)与本文称为OrfA的序列(SEQ ID NO1)的核苷酸4677-8730(加上终止密码子)匹配。含有美国申请系列号09/231,899所述第二个部分可读框的cDNA序列的核苷酸1-4876(其中称为SEQ ID NO71)与本文称为OrfB的序列(SEQ IDNO3)的核苷酸1311-6177(加上终止密码子)匹配。含有美国申请系列号09/231,899所述完全可读框的cDNA序列的核苷酸145-4653(其中称为SEQID NO76且错误地称为部分可读框)与本文称为OrfC的序列(SEQ ID NO5)的整个序列(加上终止密码子)匹配。
本发明人对cDNA和基因组克隆的进一步测序得以鉴定OrfA,OrfB和OrfC各自的全长基因组序列并完全鉴定了与希瓦氏菌属中的那些结构域同源的结构域(参见图2)。应注意在Schizochytrium中,基因组DNA与cDNA相同,因为根据本发明人的了解,在该生物体基因组中没有内含子。因此,提及来自Schizochytrium的核苷酸序列时可以是指基因组DNA或cDNA。根据Schizochytrium PKS结构域与希瓦氏菌属的比较,很明显Schizochytrium基因组编码与希瓦氏菌属中能够催化EPA合成的蛋白质高度相似的蛋白质。Schizochytrium中的该蛋白质构成催化DHA和DPA合成的PUFAPKS系统。正如本文进行的详细讨论,对希瓦氏菌属鉴定的反应程序的简单修饰将允许在Schizochytrium中合成DHA。原核希瓦氏菌属和真核Schizochytrium基因之间的同源性表明PUFAPKS进行横向(1ateral)基因转移。
图1是来自Schizochytrium PUFA PKS系统的三个可读框的示意图,且包括该PUFA PKS系统的结构域结构。正如下面实施例1所述,各可读框的结构域结构如下可读框A(OrfA)OrfA的完整核苷酸序列在本文中表示为SEQ ID NO1。SEQ ID NO1的核苷酸4677-8730相应于美国申请系列号09/231,899中称为SEQ ID NO69的序列的核苷酸390-4443。因此,SEQ ID NO1的核苷酸1-4676代表在美国申请系列号09/231,899中未公开的另一序列。SEQ ID NO1的这一新区域编码OrfA中的下列结构域(1)ORFA-KS结构域;(2)ORFA-MAT结构域;和(3)至少部分ACP结构域的区域(例如,至少ACP结构域1-4)。应注意美国申请系列号09/231,899中的SEQ ID NO69的核苷酸1-389与本文公开的SEQ ID NO1中位置4677上游的389个核苷酸不匹配。因此,美国申请系列号09/231,899中SEQ ID NO69的位置1-389似乎错误地放在该序列的核苷酸390-4443之后。这些前389个核苷酸中大多数(约位置60-389)与本发明的OrfA(SEQ ID NO1)上游部分匹配,因此据信在美国申请系列号09/231,899中在制备连续的cDNA构建体的工作中出现了错误。在美国申请系列号09/231,899中出现排序错误的区域在高度重复序列的区域内(即,下面讨论的ACP区域),很可能在从各种cDNA克隆装配该序列时产生了某种混淆。
OrfA是一个8730个核苷酸的序列(不包括终止密码子),它编码本文表示为SEQ ID NO2的2910个氨基酸的序列。OrfA内有12个结构域(a)一个β-酮脂酰-ACP合酶(KS)结构域;(b)一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域;(c)9个酰基载体蛋白(ACP)结构域;和(d)一个酮还原酶(KR)结构域。
OrfA的核苷酸序列以登录号AF378327(氨基酸序列登录号AAK728879)保存在GenBank中。在标准BLAST检索(在所有6个可读框中用标准默认参数进行BLAST 2.0 Basic BLAST同源性检索,使用blastp进行氨基酸检索,blastn用于核酸检索,且blastX用于核酸检索和翻译的氨基酸序列检索,其中,通过默认筛选查询序列的低复杂性区域(在Altschul,S.F.,Madden,T.L.,Schaaffer,A.A.,Zhang,J.,Zhang,Z.,Miller,W.& Lipman,D.J.(1997),“间隔的BLAST和PSI-BLAST新产生的蛋白质数据库检索程序”。Nucleic AcidsRes.253389-3402中描述,本文引用以其整体作为参考))中比较了OrfA与已知的序列。在核酸水平上,OrfA与任何已知的核苷酸序列没有明显的同源性。在氨基酸水平上,与ORFA同源性程度最高的序列是念珠藻属种类7120异型囊胞糖脂合酶(登录号NC_003272),它与ORFA在1001个氨基酸残基上有42%相同;和Moritella marinus(Vibrio marinus)ORF8(登录号AB025342),它与ORFA在993个氨基酸残基上有40%相同。
OrfA的第一个结构域是KS结构域,本文也称为ORFA-KS。该结构域包含在覆盖从SEQ ID NO1(OrfA)的约位置1和40之间的起始位点到SEQID NO1的约位置1428和1500之间的终止位点的核苷酸序列内。含有编码ORFA-KS结构域的序列的核苷酸序列在本文中表示为SEQ ID NO7(SEQID NO1的位置1-1500)。含有KS结构域的氨基酸序列覆盖从SEQ ID NO2(ORFA)的约位置1和14之间的起始位点到SEQ ID NO2的约位置476和500之间的终止位点。含有ORFA-KS结构域的氨基酸序列本文表示为SEQID NO8(SEQ ID NO2的位置1-500)。应注意ORFA-KS结构域含有一个活性位点基序DXAC*(*酰基结合位点C215)。
根据本发明,具有3-酮脂酰-ACP合酶(KS)生物学活性(功能)的结构域或蛋白质鉴定为完成FAS(和PKS)延长反应循环起始步骤的酶。用于延长的酰基基团通过硫酯键连接到酶活性位点的半胱氨酸残基上。在多步反应中,酰基酶进行与丙二酰-ACP的缩合形成酮脂酰-ACP,CO2和游离酶。KS在延长循环中起关键作用且在许多系统中表现出比该反应循环中的其它酶具有更大的底物特异性。例如,大肠杆菌具有三个不同的KS酶,它们在该生物体的生理学中分别具有各自特定的作用(Magnuson等,Microbiol.Rev.57,522(1993))。PUFA-PKS系统的这两个KS结构域在PUFA生物合成反应程序中具有不同的作用。
作为一类酶,KS已被充分鉴定。许多证实的KS基因的序列是已知的,已经鉴定了活性位点基序且测定了一些的晶体结构。由于属于KS酶家族,通过与已知KS序列的同源性可容易地鉴定该蛋白质。
OrfA的第二个结构域是MAT结构域,本文也称为ORFA MAT。该结构域包含在覆盖从SEQ ID NO1(OrfA)的约位置1723和1798之间的起始位点到SEQ ID NO1的约位置2805和3000之间的终止位点的核苷酸序列内。含有编码ORFA-MAT结构域的序列的核苷酸序列本文表示为SEQ ID NO9(SEQ ID NO1的位置1723-3000)。含有MAT结构域的氨基酸序列覆盖从SEQ ID NO2(ORFA)的约位置575和600之间的起始位点到SEQ ID NO2的约位置935和1000之间的终止位点。含有ORFA-MAT结构域的氨基酸序列本文表示为SEQ ID NO10(SEQ ID NO2的位置575-1000)。应注意该ORFA-MAT结构域含有一个活性位点基序GHS*XG(*酰基结合位点S706),本文表示为SEQ ID NO11。
根据本发明,具有丙二酰-CoA:ACP酰基转移酶(MAT)生物学活性(功能)的结构域或蛋白质鉴定为从丙二酰-CoA转移丙二酰半分子到ACP的结构域或蛋白质。除了该活性位点基序(GxSxG)外,这些酶具有一个延长的基序和关键位置的Q氨基酸,因此将它们鉴定为MAT酶(与Schizochytrium Orf B的AT结构域相反)。在一些PKS系统(但不是PUFA PKS结构域)中,MAT结构域优先将甲基-或乙基-丙二酰装载到ACP基团上(从相应的CoA酯),从而在线型碳链中导入分支。MAT结构域可通过其与已知MAT序列的同源性和其延长的基序结构被识别。
OrfA的结构域3-11是9个串连的ACP结构域,本文也称为ORFA-ACP(该序列的第一个结构域是ORFA-ACP1,第二个结构域是ORFA-ACP2,第三个结构域是ORFA-ACP3,等)。第一个ACP结构域,即ORFA-ACP1包含在覆盖从SEQ ID NO1(OrfA)的约位置3343到约位置3600的核苷酸序列内。含有编码ORFA-ACP1结构域的序列的核苷酸序列本文表示为SEQ ID NO12(SEQ ID NO1的位置3343-3600)。含有第一个ACP结构域的氨基酸序列覆盖从SEQ ID NO2的约位置1115到约位置1200。含有ORFA-ACP1结构域的氨基酸序列在本文中表示为SEQ ID NO13(SEQ ID NO2的位置1115-1200)。应注意该ORFA-ACP1结构域含有一个活性位点基序LGIDS*(*泛酰巯基乙胺结合基序S1157),本文以SEQ IDNO14表示。
所有9个ACP结构域的核苷酸和氨基酸序列高度保守且,因此各结构域的序列在本文中没有用单独的序列标识符表示。然而,根据本文公开的信息,本领域的技术人员可容易地测定含有其它8个ACP结构域中每一个的序列(参见下面的讨论)。
所有9个ACP结构域一起覆盖从SEQ ID NO1的约位置3283到约位置6288的OrfA区域,它相应于SEQ ID NO2从约1095到约2096的氨基酸位置。含有所有9个结构域的全部ACP区域的核苷酸序列在本文中表示为SEQ ID NO16。以SEQ ID NO16表示的区域包括各个ACP结构域之间的接头片段。9个结构域的重复间隔为SEQ ID NO16中约每隔330个核苷酸(相邻活性位点丝氨酸之间测定的实际氨基酸数目范围从104到116个氨基酸)。9个ACP结构域中每个含有一个泛酰巯基乙胺结合基序LGIDS*(本文中以SEQ ID NO14表示),其中S*是泛酰巯基乙胺结合位点丝氨酸(S)。泛酰巯基乙胺结合位点丝氨酸(S)位于各ACP结构域序列的中心。ACP结构域区域的每个末端和各ACP结构域之间是高度富含脯氨酸(P)和丙氨酸(A)的区域,据信它是接头区域。例如,ACP结构域1和2之间是序列APAPVKAAAPAAPVASAPAPA,本文表示为SEQ ID NO15。9个ACP结构域中每一个的活性位点丝氨酸残基(即,泛酰巯基乙胺结合位点)的位置,相对于SEQ ID NO2的氨基酸序列如下ACP1=S1157;ACP2=S1266;ACP3=S1377;ACP4=S1488;ACP5=S1604;ACP6=S1715;ACP7=S1819;ACP8=S1930;和ACP9=S2034。由于ACP结构域的平均大小是约85个氨基酸,不包括接头,且包括接头为约110个氨基酸,且活性位点丝氨酸约位于该结构域的中心,因此本领域的技术人员可容易地测定OrfA中9个ACP结构域中每一个的位置。
根据本发明,具有酰基载体蛋白(ACP)生物学活性(功能)的结构域或蛋白质鉴定为小多肽(一般80到100个氨基酸长),它通过与该蛋白质的共价结合的辅因子的硫酯键连接用作延长脂肪酸链的载体。它们作为分离的单位或者作为更大蛋白质内的结构域存在。ACPs通过将CoA的磷酸泛酰巯基乙胺基(phosphopantetheinyl)半分子转移到ACP高度保守的丝氨酸残基上从失活的无活性形式转变成有功能的有活性形式。酰基基团通过在磷酸泛酰巯基乙胺基半分子游离末端的硫酯键附着到ACP上。通过用放射性泛酰巯基乙胺标记和通过与已知ACPs的序列同源性可鉴定ACPs。存在上述基序(LGIDS*)的变异体也是ACP的一个标记。
OrfA中的结构域12是KR结构域,本文也称为ORFA-KR。该结构域包含在覆盖从SEQ ID NO1的约位置6598的起始位点到SEQ ID NO1的约位置8730的终止位点的核苷酸序列内。含有编码ORFA-KR结构域的序列的核苷酸序列本文表示为SEQ ID NO17(SEQ ID NO1的位置6598-8730)。含有KR结构域的氨基酸序列覆盖从SEQ ID NO2(ORFA)的约位置2200的起始位点到SEQ ID NO2的约位置2910的终止位点。含有ORFA-KR结构域的氨基酸序列本文表示为SEQ ID NO18(SEQ ID NO2的位置2200-2910)。KR结构域内具有与短链乙醛脱氢酶(KR是该家族的一个成员)同源的核心区。该核心区跨越从SEQ ID NO1的约位置7198至约位置7500,它相应于SEQ ID NO2的氨基酸位置2400-2500。
根据本发明,具有酮还原酶活性,也称为3-酮脂酰-ACP还原酶(KR)生物学活性(功能)的结构域或蛋白质鉴定为催化ACP的3-酮脂酰形式的吡啶-核苷-依赖型还原的结构域或蛋白质。它是脂肪酸从头生物合成延长循环中的第一个还原步骤和通常在聚酮化合物生物合成中进行的反应。观察到与烯酰ACP还原酶(ER)的一个家族,FAS的另一还原酶(但不是在PUFA PKS系统中存在的ER家族),和短链乙醇脱氢酶家族有明显的序列相似性。对上述PUFA PKS区域的Pfam分析揭示了在核心区与短链乙醇脱氢酶家族的同源性。对相同区域的Blast分析揭示了核心区与已知的KR酶匹配且延长区与其它已鉴定的PUFA PKS系统的结构域同源。
可读框B(OrfB)OrfB的完整核苷酸序列在本文中表示为SEQ ID NO3。SEQ ID NO3的核苷酸1311-6177相应于美国申请系列号09/231,899中称为SEQ ID NO71的序列的核苷酸1-4867(在美国申请系列号09/231,899中该cDNA序列在终止密码子之外含有约345个另外的核苷酸,包括polyA尾)。因此,SEQ IDNO1的核苷酸1-1310代表在美国申请系列号09/231,899中未公开的另一序列。SEQ ID NO3的这一新区域含有由OrfB编码的KS结构域的大部分。
OrfB是一个6177个核苷酸的序列(不包括终止密码子),它编码一个2059个氨基酸的序列,本文表示为SEQ ID NO4。OrfB内有4个结构域(a)一个β-酮脂酰-ACP合酶(KS)结构域;(b)一个链长因子(CLF)结构域;(c)一个酰基转移酶(AT)结构域;和,(d)一个烯酰ACP-还原酶(ER)结构域。
OrfB的核苷酸序列以登录号AF378328(氨基酸序列登录号AAK728880)保存在GenBank中。按上述标准BLAST检索比较了OrfB与已知序列。在核酸水平上,OrfB与任何已知的核苷酸序列没有明显的同源性。在氨基酸水平上,与ORFB同源性程度最大的序列是与ORFB在458个氨基酸残基上有53%相同性的希瓦氏菌属种类假定蛋白(登录号U73935);与ORFB在460个氨基酸残基上有53%相同性的Moritella marinus(Vibrio marinus)ORF11(登录号AB025342);与ORFB在457个氨基酸残基上有52%相同性的Photobacterium profundumω-3多不饱和脂肪酸合酶PfaD(登录号AF409100);和与ORFB在430个氨基酸残基上有53%相同性的念珠藻属种类7120假定蛋白(登录号NC_003272)。
OrfB中的第一个结构域是KS结构域,本文也称为ORFB-KS。该结构域包含在覆盖从SEQ ID NO3(OrfB)的约位置1和43之间的起始位点到SEQ ID NO3的约位置1332和1350之间的终止位点的核苷酸序列内。含有编码ORFB-KS结构域的序列的核苷酸序列本文表示为SEQ ID NO19(SEQ ID NO3的位置1-1350)。含有KS结构域的氨基酸序列覆盖从SEQID NO4(ORFB)的约位置1和15之间的起始位点到SEQ ID NO4的约位置444和450之间的终止位点。含有ORFB-KS结构域的氨基酸序列本文表示为SEQ ID NO20(SEQ ID NO4的位置1-450)。应注意ORFB-KS结构域含有一个活性位点基序DXAC*(*酰基结合位点C196)。KS的生物学活性和鉴定具有该活性的蛋白质或结构域的方法在上文中描述。
OrfB中的第二个结构域是CLF结构域,本文也称为ORFB-CLF。该结构域包含在覆盖从SEQ ID NO3(OrfB)的约位置1378和1402之间的起始位点到SEQ ID NO3的约位置2682和2700之间的终止位点的核苷酸序列内。含有编码ORFB-CLF结构域的序列的核苷酸序列本文表示为SEQ ID NO21(SEQ ID NO3的位置1378-2700)。含有CLF结构域的氨基酸序列覆盖从SEQ ID NO4(ORFB)的约位置460和468之间的起始位点到SEQ ID NO4的约位置894和900之间的终止位点。含有ORFB-CLF结构域的氨基酸序列本文表示为SEQ ID NO22(SEQ ID NO4的位置460-900)。应注意ORFB-CLF结构域含有KS活性位点基序但没有结合酰基的半胱氨酸。
根据本发明,一个结构域或蛋白质根据下面的理论称为链长因子(CLF)。CLF最初描述为具有II型(分离的酶)PKS系统的特征且假定在确定延长循环的次数,从而确定终产物的链长中起作用。CLF的氨基酸序列与KS结构域具有同源性(且认为与KS蛋白质形成异二聚体),但是它们没有活性位点半胱氨酸。CLF在PKS系统中的作用目前尚有争议。新证据(C.Bisang等,Nature401,502(1999))表明在PKS系统的引发中起作用(提供需要延长的起始酰基基团)。在该作用中,据认为CLF结构域使丙二酸盐(以丙二酰-ACP)去羧基,从而形成可转移到KS活性位点的乙酸基团。因此该乙酸盐充当可进行起始延长(缩合)反应的“引发”分子。已经鉴定了II型CLF的同源物在一些模块型PKS系统中是“装载”结构域。具有CLF序列特征的结构域在所有目前鉴定的PUFA PKS系统中均被发现且在各种情况下均发现它是多结构域蛋白的一部分。
在OrfB中的第三个结构域是AT结构域,本文也称为ORFB-AT。该结构域包含在覆盖从SEQ ID NO3(OrfB)的约位置2701和3598之间的起始位点到SEQ ID NO3的约位置3975和4200之间的终止位点的核苷酸序列内。含有编码ORFB-AT结构域的序列的核苷酸序列本文表示为SEQ ID NO23(SEQ ID NO3的位置2701-4200)。含有AT结构域的氨基酸序列覆盖从SEQ ID NO4(ORFB)的约位置901和1200之间的起始位点到SEQ ID NO4的约位置1325和1400之间的终止位点。含有ORFB-AT结构域的氨基酸序列本文表示为SEQ IDNO24(SEQ IDNO4的位置901-1400)。应注意该ORFB-AT结构域含有活性位点基序GxS*xG(*酰基结合位S1140),它是酰基转移酶(AT)蛋白的特征。
“酰基转移酶”或“AT”是指能进行许多不同酰基转移反应的一大类酶。Schizochytrium结构域与目前检查的所有其它PUFA PKS系统中存在的结构域具有较好的同源性且与鉴定为具有特异性功能的一些酰基转移酶(例如,与丙二酰-CoA:ACP酰基转移酶,MAT)具有极弱的同源性。尽管与MAT的同源性弱,据信该AT结构域不起MAT的作用,因为它不具有该酶的延长基序结构特征(参见上文的MAT结构域描述)。为了本说明书的目的,PUFAPKS系统中的AT结构域的功能包括,但不限于将脂肪酰基从ORFA ACP结构域转移到水上(即,硫酯酶-以游离脂肪酸释放脂肪酰基),将脂肪酰基基团转移到诸如CoA的受体上,在各种ACP结构域之间转移酰基,或者将脂肪酰基转移到亲脂受体分子(例如,溶血磷脂酸)上。
OrfB中的第四个结构域是ER结构域,本文也称为ORFB-ER。该结构域包含在覆盖从SEQ ID NO3(OrfB)的约位置4648的起始位点到SEQ IDNO3的约位置6177的终止位点的核苷酸序列内。含有编码ORFB-ER结构域的序列的核苷酸序列本文表示为SEQ ID NO25(SEQ ID NO3的位置4648-6177)。含有ER结构域的氨基酸序列覆盖从SEQ ID NO4(ORFB)的约位置1550的起始位点到SEQ ID NO4的约位置2059的终止位点。含有ORFB-ER结构域的氨基酸序列本文表示为SEQ ID NO26(SEQ ID NO4的位置1550-2059)。
根据本发明,该结构域具有烯酰还原酶(ER)的生物学活性。ER酶还原脂酰-ACP中的反式双键(由DH活性导入),导致这些碳完全饱和。PUFA PKS中的ER结构域与新鉴定的ER酶家族(Heath等,Nature 406,145(2000))具有同源性。Heath和Rock通过从肺炎链球菌克隆目的基因,纯化从该基因表达的蛋白质,并表明它在体外试验中具有ER活性鉴定了ER酶的这一新类型。OrfB的Schizochytrium ER结构域的序列与肺炎链球菌ER蛋白质具有同源性。目前检查的所有PUFA PKS系统均含有至少一个具有与SchizochytriumER结构域同源性极高的序列的结构域。Schizochytrium PUFA PKS系统含有两个ER结构域(一个在OrfB上,一个在OrfC上)。
可读框C(OrfC)OrfC的完整核苷酸序列在本文中表示为SEQ ID NO5。SEQ ID NO5的核苷酸1-4509(即,完整可读框序列,不包括终止密码子)相应于美国申请系列号09/231,899中称为SEQ ID NO76的序列的核苷酸145-4653(美国申请系列号09/231,899中的cDNA序列在OrfC起始密码子的上游含有约144个核苷酸且在终止密码子之后含有约110个核苷酸,包括polyA尾)。OrfC是一个4509个核苷酸的序列(不包括终止密码子),它编码1503个氨基酸的序列,本文表示为SEQ ID NO6。OrfC内含有3个结构域(a)两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;和(b)一个烯酰ACP还原酶(ER)结构域。
OrfC的核苷酸序列以登录号AF378329(氨基酸序列登录号AAK728881)保存在GenBank中。按上述标准BLAST检索比较了OrfC与已知序列。在核酸水平上,OrfC与任何已知的核苷酸序列没有明显的同源性。在氨基酸水平(Blastp)上,与ORFC同源性程度最大的序列是与ORFC在514个氨基酸残基上有45%相同性的Moritella marinus(Vibrio marinus)ORF11(登录号AB025342);与ORFC在447个氨基酸残基上有49%相同性的希瓦氏菌属种类假定蛋白8(登录号U73935);与ORFC在430个氨基酸残基上有49%相同性的念珠藻属种类假定蛋白(登录号NC_003272);和与ORFC在930个氨基酸残基上有37%相同性的希瓦氏菌属种类假定蛋白7(登录号U73935)。
OrfC中的第一个结构域是DH结构域,本文也称为ORFC-DH1。它是OrfC中的两个DH结构域之一,因此命名为DH1。该结构域包含在覆盖从SEQ ID NO5(OrfC)的约位置1和778之间的起始位点到SEQ ID NO5的约位置1233和1350之间的终止位点的核苷酸序列内。含有编码ORFC-DH1结构域的序列的核苷酸序列本文表示为SEQ ID NO27(SEQ ID NO5的位置1-1350)。含有DH1结构域的氨基酸序列覆盖从SEQ ID NO6(ORFC)的约位置1和260之间的起始位点到SEQ ID NO6的约位置411和450之间的终止位点。含有ORFC-DH1结构域的氨基酸序列本文表示为SEQ ID NO28(SEQ ID NO6的位置1-450)。
PUFA PKS系统中两个DH结构域(见下文DH2)的特征已经在前面部分中描述。这类酶从β-酮脂酰-ACP去掉HOH并在碳链中留下反式双键。PUFAPKS系统的DH结构域与细菌的FAS系统相关性DH酶(而不是其它PKS系统的DH结构域)具有同源性。细菌DH的一个亚型,即FabA-样DH,具有顺反异构酶活性(Heath等,J.Biol.Chem.,271,27795(1996))。它与FabA-样DH具有同源性表明DH结构域之一或者两个同时负责在PUFA PKS产物中插入顺式双键。
OrfC中的第二个结构域是DH结构域,本文也称为ORFC-DH2。它是OrfC中两个DH结构域的第二个,因此命名为DH2。该结构域包含在覆盖从SEQ ID NO5(OrfC)的约位置1351和2437之间的起始位点到SEQ ID NO5的约位置2607和2850之间的终止位点的核苷酸序列内。含有编码ORFC-DH2结构域的序列的核苷酸序列本文表示为SEQ ID NO29(SEQ IDNO5的位置1351-2850)。含有DH2结构域的氨基酸序列覆盖从SEQ ID NO6(ORFC)的约位置451和813之间的起始位点到SEQ ID NO6的约位置869和950之间的终止位点。含有ORFC-DH2结构域的氨基酸序列本文表示为SEQ ID NO30(SEQ ID NO6的位置451-950)。DH的生物学活性已在上文中描述。
OrfC中的第三个结构域是ER结构域,本文也称为ORFC-ER。该结构域包含在覆盖从SEQ ID NO5(OrfC)的约位置2998的起始位点到SEQ IDNO5的约位置4509的终止位点的核苷酸序列内。含有编码ORFC-ER结构域的序列的核苷酸序列本文表示为SEQ ID NO31(SEQ ID NO5的位置2998-4509)。含有ER结构域的氨基酸序列覆盖从SEQ ID NO6(ORFC)的约位置1000的起始位点到SEQ ID NO6的约位置1502的终止位点。含有ORFC-ER结构域的氨基酸序列本文表示为SEQ ID NO32(SEQ ID NO6的位置1000-1502)。ER的生物学活性已在上文中描述。
本发明的一个实施方案涉及含有来自非细菌PUFA PKS系统的核酸序列,其同源物,其片段,和/或与任一该核酸序列互补的核酸序列的分离的核酸分子。在一个方面,本发明涉及含有选自下组的核酸序列的分离核酸分子(a)编码选自由SEQ ID NO2,SEQ ID NO4,SEQ ID NO6及其生物学活性片段组成的组中的氨基酸序列的核酸序列;(b)编码选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ IDNO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ I8,SEQ ID NO30,SEQ ID NO32,或其生物学活性片段的氨基酸序列的核酸序列;(c)编码与(a)所述氨基酸序列的至少500个连续氨基酸有至少约60%相同性的氨基酸序列的核酸序列,其中所述氨基酸序列具有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的生物学活性;(d)编码与(b)所述氨基酸序列有至少约60%相同性的氨基酸序列的核酸序列,其中所述氨基酸序列具有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的生物学活性;或(e)与(a),(b),(c),或(d)的核酸序列完全互补的核酸序列。在另一实施方案中,本发明涉及包含编码几个PUFA PKS结构域的活性位点结构域或上述其它功能基序的序列的核酸序列。
根据本发明,具有PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列是具有以Schizochytrium PUFA PKS系统例证的,本文详细描述的PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列。Schizochytrium PUFA PKS系统内的各结构域的生物学活性已在上文中详细描述。因此,本发明的分离的核酸分子可编码任一PUFA PKS可读框的翻译产物,PUFA PKS结构域,其生物学活性片段,或天然PUFA PKS可读框或具有生物学活性的结构域的任一同源物。给定蛋白质或结构域的同源物是具有与天然对照氨基酸序列(即,对照蛋白质或结构域)区别在于有一个或几个,但不限于一个或几个的氨基酸缺失(例如,蛋白质的截短形式,如肽或片段),插入,颠倒,取代和/或衍生化(例如,通过糖基化,磷酸化,乙酰化,豆蔻酰化,异戊二烯化,棕榈酸化,酰胺化和/或添加糖基磷脂酰肌醇)的氨基酸序列的蛋白质或多肽。PUFA PKS蛋白质或结构域的优选同源物在下文详细描述。应注意同源物可包括合成产生的同源物,给定蛋白质或结构域的天然等位变异体,或来自不同于产生对照序列的生物的生物体的同源序列。
一般来说,蛋白质或结构域的生物学活性或生物学作用是指体内(即,在该蛋白质的天然生理学环境中)或体外(即,在实验室条件下)测量或观察时由该蛋白质或结构域表现或完成的归因于该蛋白质或结构域的天然存在形式的任何功能。PUFA PKS系统和组成PUFA PKS系统的单个蛋白质/结构域的生物学活性本文在别处有详细描述。蛋白质或结构域的修饰,例如在同源物或模拟物(在下面讨论)中的修饰可产生与天然蛋白质或结构域具有相同生物学活性的蛋白质或结构域,或者产生与天然蛋白质或结构域相比具有降低或增加的生物学活性的蛋白质或结构域。导致蛋白质或结构域表达降低或活性降低的修饰可称为蛋白质或结构域的失活(完全或部分),下调,或作用减小。同样,导致蛋白质或结构域的表达增加或活性增加的修饰可称为蛋白质或结构域的放大,超产,活化,增强,上调或作用增加。PUFA PKS系统的功能域是能够完成生物学功能(即,具有生物学活性)的结构域(即,结构域可以是蛋白质的一部分)。
根据本发明,分离的核酸分子是从其天然环境中取出(即,对其进行了人工操作)的核酸分子,其天然环境是天然状态下发现该核酸分子的基因组或染色体。因此,“分离的”不必反映该核酸分子被纯化的程度,但是表明该核酸分子不包括天然状况下发现该核酸分子的完整基因组或完整染色体。分离的核酸分子可包括基因。包括基因的分离的核酸分子不是包括该基因的染色体的一个片段,而是包括编码区和与该基因相关的调控区,但是没有在同一染色体中天然发现的其它基因。分离的核酸分子也可包括一种特定的核酸序列,其侧翼(即,在该序列的5’和/或3’端)为天然状况下一般不是该特定核酸序列侧翼的其它核酸(即,异源序列)。分离的核酸分子可包括DNA,RNA(即,mRNA),或DNA或RNA之一的衍生物(例如,cDNA)。尽管短语“核酸分子”主要是指物理学核酸分子且短语“核酸序列”主要是指核酸分子上的核苷酸序列,但是两个短语可交换使用,特别是对于能编码蛋白质或蛋白质的结构域的核酸分子或核酸序列。
优选的是,使用重组DNA技术(即,聚合酶链式反应(PCR)扩增,克隆)或化学合成产生本发明的分离的核酸分子。分离的核酸分子包括天然的核酸分子及其同源物,包括,但不限于,天然等位基因变异体和修饰的核酸分子,其中的核苷酸以这样的方式插入,缺失,取代,和/或颠倒,即该修饰对本文所述PUFA PKS系统的生物学活性产生了所需的影响。蛋白质同源物(例如,由核酸同源物编码的蛋白质)在上文中已有详细讨论。
可使用本领域的技术人员已知的许多方法来产生核酸分子同源物(参见,例如,Sambrook等,Molecular CloningA Laboratory Manual,Cold SpringHarbor Labs Press,1989)。例如,可使用各种技术修饰核酸分子,该技术包括,但不限于,传统诱变技术和重组DNA技术,例如定点诱变,化学处理核酸分子以诱导突变,限制性酶裂解核酸片段,连接核酸片段,核酸序列选定区域的PCR扩增和/或诱变,合成寡核苷酸混合物并连接混合物组以“构建”核酸分子的混合体及其组合。通过筛选核酸编码的蛋白质的功能和/或通过与野生型基因杂交可从修饰的核酸混合物中选择核酸分子同源物。
本发明的核酸分子大小的最小值是足以形成探针或寡核苷酸引物的大小,该探针或寡核苷酸引物与本发明中有用的核酸分子的互补序列能够形成稳定的杂交体(例如,在中等,高度或极高严格条件下),或者其大小足以编码具有根据本发明的PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列。因此,编码这一蛋白质的核酸分子的大小取决于核酸组成和核酸分子与互补序列之间的同源性或相同性百分数以及杂交条件本身(例如,温度,盐浓度,和甲酰胺浓度)。用作寡核苷酸引物或探针的核酸分子大小的最小值一般是如果该核酸分子富含GC则为至少约12个到约15个核苷酸的长度且如果它们富含AT则为至少约15到约18个碱基的长度。对本发明的核酸分子大小的最大值没有限制,实际的限制是该核酸分子可包含足以编码PUPA PKS系统的结构域的生物活性片段,PUFA PKS系统的完整结构域,PUFA PKS系统的可读框(Orf)内的几个结构域,PUFA PKS系统的一个完整的Orf,或PUFA PKS系统的一个以上的Orf。
在本发明的一个实施方案中,分离的核酸分子含有选自SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQID NO26,SEQ ID NO28,SEQ ID NO30,SEQ ID NO32,或其生物活性片段的组中的核酸序列或基本上由其组成。在一个方面,该核酸序列选自SEQ ID NO1,SEQ ID NO3,SEQ ID NO5,SEQ ID NO7,SEQ ID NO9,SEQ ID NO12,SEQ ID NO17,SEQ ID NO19,SEQ ID NO21,SEQ IDNO23,SEQ ID NO25,SEQ ID NO27,SEQ ID NO29,和SEQ ID NO31的组中。在本发明的一个实施方案中,可产生在给定氨基酸序列的C-和/或N-末端各侧带有从至少一个,到多达约20个添加的异源氨基酸的任一上述PUFA PKS的氨基酸序列,以及该序列的同源物。所得的蛋白质或多肽可称为“基本上由给定的氨基酸序列组成”。根据本发明,异源性氨基酸是天然状况下不是在给定氨基酸序列侧翼发现(即,体内天然状况下未发现)的或在该基因中存在时如果使用产生该给定氨基酸序列的生物的标准密码子用法翻译天然序列中的该核苷酸时,不由编码给定氨基酸序列的天然核酸序列侧翼的核苷酸编码的氨基酸序列。同样,短语“基本上由其组成”在本文中当用于指核酸序列时,是指编码给定氨基酸序列的核酸序列在编码给定氨基酸序列的核酸序列5’和/或3’末端各侧带有从至少一个到多达约60个添加的异源核苷酸。异源性核苷酸是在天然基因中存在时不是在编码给定氨基酸序列的核酸序列侧翼天然发现(即,体内天然状况下未发现)的。
本发明还包括分离的核酸分子,它含有编码具有PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列的核酸序列。在一个方面,该核酸序列编码包括SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ IDNO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQ ID NO32的任一Schizochytrium PUFA PKS ORFs或结构域的同源物,其中该同源物具有本文前面所述PUFA PKS系统的至少一个结构域的生物学活性。
在本发明的一个方面,本发明包含的Schizochytrium PUFA PKS蛋白质或结构域的同源物含有与选自SEQ ID NO2,SEQ ID NO4,和SEQ IDNO6的氨基酸序列的至少500个连续氨基酸有至少约60%相同性的氨基酸序列;其中所述氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。在另一方面,该同源物的氨基酸序列与SEQ ID NO2,SEQ ID NO4和SEQ ID NO6中任一个的至少约600个连续氨基酸,且更优选至少约700个连续氨基酸,且更优选至少约800个连续氨基酸,且更优选至少约900个连续氨基酸,且更优选至少约1000个连续氨基酸,且更优选至少约1100个连续氨基酸,且更优选至少约1200个连续氨基酸,且更优选至少约1300个连续氨基酸,且更优选至少约1400个连续氨基酸,且更优选至少约1500个连续氨基酸,或与SEQ ID NO6的全长有至少约60%的相同性。在另一方面,该同源物的氨基酸序列与SEQ ID NO2或SEQ ID NO4中任一个的至少约1600个连续氨基酸,且更优选至少约1700个连续氨基酸,且更优选至少约1800个连续氨基酸,且更优选至少约1900个连续氨基酸,且更优选至少约2000个连续氨基酸,或与SEQ ID NO4的全长有至少约60%的相同性。在另一方面,该同源物的氨基酸序列与SEQ ID NO2的至少约2100个连续氨基酸,且更优选至少约2200个连续氨基酸,且更优选至少约2300个连续氨基酸,且更优选至少约2400个连续氨基酸,且更优选至少约2500个连续氨基酸,且更优选至少约2600个连续氨基酸,且更优选至少约2700个连续氨基酸,且更优选至少约2800个连续氨基酸,且甚至更优选与SEQ IDNO2的全长有至少约60%的相同性。
在另一方面,本发明包含的Schizochytrium PUFA PKS蛋白质或结构域的同源物含有与选自SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列在上段所述任一连续氨基酸长度上有至少约65%的相同性,且更优选至少约70%的相同性,且更优选至少约75%的相同性,且更优选至少约80%的相同性,且更优选至少约85%的相同性,且更优选至少约90%的相同性,且更优选至少约95%的相同性,且更优选至少约96%的相同性,且更优选至少约97%的相同性,且更优选至少约98%的相同性,且更优选至少约99%的相同性的氨基酸序列,其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。
在本发明的一个方面,本发明包含的Schizochytrium PUFA PKS蛋白质或结构域的同源物含有与选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQ ID NO32的氨基酸序列有至少约60%的相同性的氨基酸序列,其中所述氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。在另一方面,该同源物的氨基酸序列与选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQ ID NO32的氨基酸序列有至少约65%的相同性,且更优选至少约70%的相同性,且更优选至少约75%的相同性,且更优选至少约80%的相同性,且更优选至少约85%的相同性,且更优选至少约90%的相同性,且更优选至少约95%的相同性,且更优选至少约96%的相同性,且更优选至少约97%的相同性,且更优选至少约98%的相同性,且更优选至少约99%的相同性,其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。
根据本发明,术语“邻近的”或“连续的”对于本文所述核酸或氨基酸序列是指以不中断的序列相连。例如,对于第一个序列含有第二个序列的30个相邻(或连续)的氨基酸,是指第一个序列包含与第二个序列中30个氨基酸残基的不中断的序列具有100%相同性的30个氨基酸残基的不中断的序列。同样,对于第一个序列与第二个序列具有“100%相同性”是指第一个序列与第二个序列完全匹配,在核苷酸或氨基酸之间没有间隔。
如本文所用,除非另有说明,对于相同性百分数(%)是指使用(1)在所有6个可读框中用标准默认参数进行BLAST 2.0 Basic BLAST同源性检索,使用blastp进行氨基酸检索,blastn用于核酸检索,且blastX用于核酸检索和翻译的氨基酸检索,其中,通过默认筛选查询序列的低复杂性区域(在Altschul,S.F.,Madden,T.L.,Schaaffer,A.A.,Zhang,J.,Zhang,Z.,Miller,W.&Lipman,D.J.(1997),“间隔的BLAST和PSI-BLAST新产生的蛋白质数据库检索程序”。Nucleic Acids Res.253389-3402中描述,本文引用以其整体作为参考);(2)BLAST 2序列对比(使用下述参数);(3)和/或使用标准默认参数的PSI-BLAST(位置特异性重复BLAST)进行的同源性评估。应注意由于BLAST 2.0 Basic BLAST和BLAST 2之间在标准参数上的一些区别,两个特定序列使用BLAST 2程序可能认为具有明显的同源性,而使用一个序列作为查询序列以BLAST 2.0 Basic BLAST进行检索时在最匹配的序列中可能没有鉴定出第二个序列。另外,PSI-BLAST提供了一个“提问档(profile)”检索的自动的,容易使用的版本,它是寻找序列同源性的一个敏感途径。该程序首先进行有间隔的BLAST数据库检索。PSI-BLAST程序使用来自任何有效序列对比的信息返回构建位置特异性记分矩阵,它代替查询序列用于下一轮数据库检索。因此,应明白可使用这些程序中的任一种测定相同性百分数。
使用Tatusova和Madden,(1999),“Blast 2序列-用于比较蛋白质和核苷酸序列的一种新工具”,FEMS Microbiol Lett.174247-250所述BLAST 2序列可互相对比两个具体序列,本文引用该文献以其整体作为参考。使用BLAST 2.0算法以blastp或blastn进行BLAST 2序列对比,在两个序列之间进行有间隔的BLAST检索(BLAST 2.0)允许在所得的序列对比中引入间隔(缺失和插入)。为了本文清楚的目的,使用如下标准默认参数进行BLAST 2序列对比。
对于blasrn,使用0 BLOSUM62矩阵匹配得分=1错配罚分=-2空出间隔(5)和延伸间隔(2)罚分间隔_x下降(dropoff)(50)期望(expect)(10)序列大小(word size)(11)筛选(上)对于blastp,使用0 BLOSUM62矩阵
空出间隔(11)和延伸间隔(1)罚分间隔_x下降(50)期望(10)序列大小(3)筛选(上)。
在本发明的另一实施方案中,具有本发明的PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列包括与天然PUFA PKS蛋白质或多肽足够相似以致于编码该氨基酸序列的核酸序列在中等,高度,或极高严格条件(下文描述)下能够杂交到(即,与其杂交)编码天然PUFA PKS蛋白质或多肽的核酸分子(即,编码天然PUFA PKS蛋白质或多肽的核酸链的互补链)上的氨基酸序列。优选的是,具有本发明的PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列由这样一种核酸序列编码,即该核酸序列在中等,高度或极高严格条件下杂交到编码含有由SEQ ID NO2,SEQ ID NO4,SEQ IDNO6,SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ IDNO28,SEQ ID NO30,或SEQ ID NO32中任一个代表的氨基酸序列的蛋白质的核酸序列的互补链上。推定互补序列的方法对于本领域的技术人员是已知的。应注意由于氨基酸测序和核酸测序技术不是完全无误差的,因此本文提供的序列最多代表本发明的PUFA PKS结构域和蛋白质的表观序列。
本文使用的杂交条件是指标准杂交条件,在该条件下使用核酸分子鉴定相似的核酸分子。该标准条件在例如,Sambrook等,Molecular CloningALaboratory Manual,Cold Spring Harbor Labs Press,1989中公开。Sambrook等,出处同上,在本文中引用以其整体作为参考(具体参见,第9.31-9.62页)。另外,计算合适的杂交和洗涤条件以完成允许各种程度的核苷酸错配的杂交的公式在例如,Meinkoth等,1984,Ahal.Biochem.138,267-284中公开;Meinkoth等,出处同上,在本文中引用以其整体作为参考。
更具体地说,本文提及的中等严格的杂交和洗涤条件是指在杂交反应中允许分离与用于探测的核酸分子具有至少约70%的核酸序列相同性的核酸分子的条件(即,允许约30%或更少的核苷酸错配的条件)。本文提及的高度严格的杂交和洗涤条件是指在杂交反应中允许分离与用于探测的核酸分子具有至少约80%的核酸序列相同性的核酸分子的条件(即,允许约20%或更少的核苷酸错配的条件)。本文提及的极高严格的杂交和洗涤条件是指在杂交反应中允许分离与用于探测的核酸分子具有至少约90%的核酸序列相同性的核酸分子的条件(即,允许约10%或更少的核苷酸错配的条件)。如上所述,本领域技术人员可使用Meinkoth等,出处同上中的公式计算合适的杂交和洗涤条件以达到这些特定的核苷酸错配水平。该条件可依赖于形成的是DNA∶RNA还是DNA∶DNA杂交体而变化。计算的DNA∶DNA杂交体的解链温度比DNA∶RNA杂交体低10℃。在具体实施方案中,DNA∶DNA杂交体的严格杂交条件包括在6X SSC(0.9M Na+)的离子强度下在约20℃和约35℃之间(低度严格),更优选的是,在约28℃和约40℃之间(更严格),且甚至更优选的是,在约35℃和约45℃之间(甚至更严格)的温度下,在合适的洗涤条件下的杂交。在具体实施方案中,DNA∶RNA杂交体的严格杂交条件包括在6X SSC(0.9M Na+)的离子强度下在约30℃和约45℃之间,更优选的是,在约38℃和约50℃之间,且甚至更优选的是,在约45℃和约55℃之间的温度下,以同样严格的洗涤条件的杂交。这些值根据大于约100个核苷酸,0%甲酰胺和约40%的G+C含量的分子的解链温度计算。另外,可按Sambrook等,出处同上,第9.31至9.62页提供的经验计算Tm值。一般来说,洗涤条件应当尽可能严格,且对于选定的杂交条件应是合适的。例如,杂交条件可包括盐和温度条件的组合,该温度比计算的特定杂交体的Tm低约20-25℃,且洗涤条件一般包括盐和温度条件的组合,该温度比计算的特定杂交体的Tm低约12-20℃。适用于DNA∶DNA杂交体的杂交条件的一个例子包括在6X SSC(50%甲酰胺)中在约42℃下杂交2-24小时,接着进行洗涤步骤,包括在室温下在约2X SSC中的一次或多次洗涤,接着在更高温度和更低离子强度下进一步洗涤(例如,在约37℃下在约0.1X-0.5X SSC中洗涤至少一次,接着在约68℃下在约0.1X-0.5X SSC中洗涤至少一次)。
本发明的另一实施方案包括含有重组载体和核酸分子的重组核酸分子,其中的核酸分子含有的核酸序列编码具有本文所述PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列。该核酸序列在上文中有详细描述。根据本发明,重组载体是一种改造的(即,人工产生的)核酸分子,它用作处理选定核酸序列并将该核酸序列导入宿主细胞的工具。因此重组载体适用于克隆,测序,和/或处理选定的核酸序列,例如通过表达和/或传递选定的核酸序列到宿主细胞中以形成重组细胞。该载体一般含有异源核酸序列,异源核酸序列是天然状况下未发现与需要克隆或传递的核酸序列相连的核酸序列,尽管该载体也可含有天然状况下发现与本发明的核酸分子相连的或者用于表达本发明的核酸分子的调控核酸序列(例如,启动子,非翻译区)(下面详细讨论)。该载体可以是RNA或者是DNA,是原核的或者真核的,且一般是一种质粒。该载体可作为染色体外因子(例如,质粒)维持或者可整合进重组生物(例如,微生物或植物)的染色体中。该完整载体可在宿主细胞内适当保留,或者在某些情况下,可删除质粒DNA,留下本发明的核酸分子。整合的核酸分子可在染色体启动子控制下,在自身的或质粒的启动子控制下,或者在一些启动子的结合控制下。可整合单个或多个拷贝的核酸分子进入染色体中。本发明的重组载体可含有至少一个选择标记。
在一个实施方案中,用于本发明的重组核酸分子的重组载体是一种表达载体。本文所用的短语“表达载体”用于指适合于产生编码产物(例如,目的蛋白)的载体。在该实施方案中,将编码需要产生的产物(例如,PUFA PKS结构域)的核酸序列插入重组载体中以产生重组核酸分子。编码需要产生的蛋白质的核酸序列以这样的方式插入载体中,即将该核酸序列与载体中的调控序列可操作地连接使得能够在重组宿主细胞内转录和翻译该核酸序列。
在另一实施方案中,用于本发明的重组核酸分子的重组载体是一种定向载体。本文所用的短语“定向载体”用于指这样一种载体,即它用于将特定核酸分子传递进重组宿主细胞,其中该核酸分子用于删除或灭活宿主细胞或微生物内的内源性基因(即,用于定向基因破坏或敲除技术)。该载体本领域也称为“敲除”载体。在该实施方案的一个方面,该载体的一部分,但更典型的是插入载体中的核酸分子(即,插入片段)具有与宿主细胞中靶基因(即,删除或失活针对的基因)的核酸序列同源的核酸序列。载体插入片段的核酸序列设计成与靶基因结合以便靶基因与插入片段进行同源重组,从而删除,灭活或减弱该内源性靶基因(即,通过突变或删除至少一部分内源性靶基因)。
一般来说,重组核酸分子包括与一个或多个转录调控序列可操作地相连的至少一个本发明的核酸分子。本文所用的短语“重组分子”或“重组核酸分子”主要是指与转录调控序列可操作地相连的核酸分子或核酸序列,但是当核酸分子是本文讨论的重组分子时,上述短语可与短语“核酸分子”交换使用。根据本发明,短语“可操作地相连”是指核酸分子与转录调控序列以这样的方式相连,即该连接使得该分子转染(即,转化,转导,转染,接合或导入)进宿主细胞时能够表达。转录调控序列是控制转录开始,延长,或终止的序列。特别重要的转录调控序列是那些控制转录开始的序列,例如启动子,增强子,操纵子和阻抑序列。合适的转录调控序列包括在该重组核酸分子导入的宿主细胞或生物体中能起作用的任何转录调控序列。
本发明的重组核酸分子也可含有其它调控序列,例如翻译调控序列,复制起点,和与该重组细胞相适应的其它调控序列。在一个实施方案中,包括整合进宿主细胞染色体中的那些分子的本发明的重组分子还含有分泌信号(即,信号片段核酸序列)以便使得表达的蛋白质从产生该蛋白质的细胞中分泌出来。合适的信号片段包括天然状况下与表达该蛋白质相关的信号片段或者能够指导根据本发明的蛋白质分泌的任何异源性信号片段。在另一实施方案中,本发明的重组分子包含使得表达蛋白能够传递到宿主细胞膜上并插入膜中的前导序列。合适的前导序列包括天然状况下与该蛋白质相关的前导序列,或者能够指导该蛋白质传递并插入细胞膜中的任何异源性前导序列。
本发明人发现Schizochytrium PUFA PKS Orfs A和B在基因组中紧密相连并测序了Orfs之间的区域。Orfs以相反的方向排列且有4244个碱基对分开起始(ATG)密码子(即,它们排列如下3’OrfA5’-4244bp-5’OrfB3’)。检查4244bp的基因间区域没有揭示出任何明显的Orfs(在BlastX检索中没有发现明显的匹配)。OrfsA和B两者在Schizochytrium中至少在产油期间都高度表达,意味着在该基因间区域包含有效启动子元件。据信这些遗传因子在转基因应用中作为双向启动子序列具有实用性。例如,在优选的实施方案中,可克隆该区域,在其各端放置任意目的基因并将该构建体导入Schizochytrium(或者表明该启动子可发挥功能的一些其它宿主)中。预期该调控元件在合适条件下可为两个导入的基因提供同等的高水平表达。含有Schizochytrium PUFA PKS调控元件(例如,启动子)的该调控区的完整核苷酸序列本文表示为SEQ ID NO36。
同样,OrfC在产油期间在Schizochytrium中高度表达且预期在其起始密码子的上游区域存在调控元件。已克隆并测序了OrfC的基因组DNA的上游区域并在本文中表示为(SEQ ID NO37)。该序列含有3886nt,紧靠OrfC起始密码子的上游。检查该区域没有发现任何明显的Orfs(即,在BlastX检索中没有发现明显的匹配)。据信在该区域包含的调控元件在合适的条件下可为放在其后的基因提供高水平的表达。另外,在合适条件下,该表达水平与在A-B基因间区域(SEQ ID NO36)控制下的基因等同。
因此,在一个实施方案中,按本文所述用于本发明的重组核酸分子可包括SEQ ID NO36和/或SEQ ID NO37内包含的PUFA PKS调控区。该调控区可包括至少具有基本PUFA PKS转录活性的SEQ ID NO36和/或SEQID NO37的任一部分(片段)。
可使用本发明的一种或多种重组分子产生本发明的编码产物(例如,PUFA PKS结构域,蛋白质,或系统)。在一个实施方案中,通过在有效产生蛋白质的条件下表达本文所述核酸分子来生产编码产物。产生编码蛋白的优选方法是通过用一种或多种重组分子转染宿主细胞以形成重组细胞。用于转染的合适宿主细胞包括,但不限于,可被转染的任何细菌,真菌(例如,酵母),昆虫,植物或动物细胞。宿主细胞可以是未转染的细胞或者是已被至少一个其它重组核酸分子转染的细胞。
根据本发明,术语“转染”用于指可将外源性核酸分子(即,重组核酸分子)插入细胞中的任一方法。术语“转化”当用于指将核酸分子导入微生物细胞,例如藻类,细菌和酵母时,可与术语“转染”交换使用。在微生物系统中,术语“转化”用于描述由于该微生物获得外源性核酸的遗传改变且与术语“转染”基本上同义。然而,在动物细胞中,转化被赋予了第二种含义,例如,它可指细胞变成癌细胞后在培养中生长特性的改变。因此,为了避免混淆,术语“转染”优选用于将外源核酸导入动物细胞的情况,且本文使用的术语“转染”一般包含动物细胞,植物细胞的转染和微生物细胞的转化,该术语适用的范围是将外源性核酸导入细胞。因此,转染技术包括,但不限于,转化,粒子轰击,电穿孔,显微注射,脂转染,吸附,感染和原生质体融合。
本领域的技术人员将预料到使用重组DNA技术通过操纵例如,宿主细胞内核酸分子的拷贝数,转录这些核酸分子的效率,翻译所得转录子的效率,和翻译后修饰的效率可改进转染的核酸分子的表达调控。另外,可遗传改造启动子序列以便与天然启动子相比表达水平提高。用于控制核酸分子表达的重组技术包括,但不限于,将该核酸分子整合进一个或多个宿主细胞染色体中,给质粒添加载体稳定性序列,取代或修饰转录控制信号(例如,启动子,操纵子,增强子),取代或修饰翻译控制信号(例如,核糖体结合位点,Shine-Dalgarno序列),修饰核酸分子以符合该宿主细胞的密码子用法,和缺失使转录子不稳定的序列。
上文对于重组核酸分子和宿主细胞的转染方面的一般性讨论试图应用于本文讨论的任一重组核酸分子,包括编码具有PUFA PKS的至少一个结构域的生物学活性的任一氨基酸序列的那些核酸分子,编码其它PKS系统的氨基酸序列的那些核酸分子,和编码其它蛋白质或结构域的那些核酸分子。
本发明还涉及使用一种新方法鉴定具有在结构,结构域组成和/或功能上与Schizochytrium PUFA PKS系统同源的PUFA PKS系统的微生物。在一个实施方案中,该微生物是非细菌微生物,且优选的是,以该方法鉴定的微生物是真核微生物。另外,本发明涉及以该方法鉴定的微生物和这些微生物及来自这些微生物的PUFA PKS系统在用于根据本发明的PUFA PKS系统的各种应用(例如,遗传修饰的生物体和产生生物活性分子的方法)中的用途。本文所述并证实的独特筛选方法使得能够迅速鉴定含有与本发明的Schizochytrium PUFA PKS系统同源的PUFA PKS系统的新微生物菌株。申请人使用该方法发现并在本文中公开了破囊壶菌属微生物含有与Schizochytrium中的发现同源的PUFA PKS系统。该发现在下面实施例2中详细描述。
通过单独使用下列方法或者以这些方法的任意组合可容易地鉴定/分离/筛选具有与Schizochytrium中的发现相似的PUFA PKS系统的微生物,例如本发明人发现并在实施例2中描述的破囊壶菌属微生物。
一般来说,鉴定具有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的非细菌微生物的方法包括第一步(a)选择产生至少一种PUFA的微生物;和第二步(b)从(a)鉴定与发酵培养基中在大于5%饱和度,更优选10%的饱和度,更优选大于15%的饱和度,且更优选大于20%的饱和度的溶氧条件下所述微生物产生的PUFA相比,在发酵培养基中不超过约5%饱和度的溶氧条件下具有产生增加的PUFA的能力的微生物。产生至少一种PUFA且在不超过约5%饱和度的溶氧条件下具有产生增加的PUFA的能力的微生物鉴定为含有PUFA PKS系统的候选微生物。鉴定含有PUFA PKS系统的优良候选微生物后,该方法可包括附加步骤(c)检测在步骤(b)中鉴定的生物是否含有PUFA PKS系统。
在本发明的一个实施方案中,通过在低氧/缺氧条件下和有氧条件下培养筛选过程中选择的该微生物,并进一步测量该生物体中PUFA的含量进行步骤(b),测定脂肪酸的分布特征,以及脂肪含量。通过比较在低氧/缺氧条件下的结果与在有氧条件下的结果,该方法提供了试验微生物是否含有本发明的PUFA PKS系统的有力征兆。这一优选的实施方案在下面详细描述。
首先,在有氧条件下培养需要检查是否存在PUFA PKS系统的微生物菌株以诱导产生大量的细胞(微生物生物量)。作为该鉴定方法的一部分,随后将这些细胞放在低氧或缺氧培养条件下(例如不超过约5%饱和度的溶氧,更优选不超过约2%,甚至更优选不超过约1%,且最优选在培养基中约0%饱和度的溶氧)并使其再生长约24-72小时。在该方法中,微生物应在高于约15℃,且更优选高于约20℃,且甚至更优选高于约25℃,且甚至更优选高于约30℃的温度下培养。在能在培养箱中(且因此在培养物中)诱导这类大气环境的培养箱中或者通过以在培养瓶/管本身中直接诱导该低氧环境的方式培养该细胞可容易地维持低氧或缺氧培养环境。
在优选的培养方法中,微生物可在摇瓶中培养,它不同于一般含有少量培养基(不超过约50%的总容积且通常不超过约25%的总容积)以便在摇床上摇动时保持培养基有氧,该摇瓶反而超过其容积的约50%,且更优选超过约60%,且最优选超过其容积的约75%装满培养基。用培养基高装载该摇瓶防止它放在摇床上时在瓶中充分混合,从而防止氧扩散进培养基。因此随着微生物的生长,它们用尽培养基中已有的氧并自然在摇瓶中产生一个低氧或无氧的环境。
培养期后,收获细胞并分析目的生物活性化合物(例如,脂类)的含量,但最具体的是含有两个或多个不饱和键,且更优选3个或更多双键,且甚至更优选4个或更多双键的化合物。对于脂类,将具有高于该微生物干重的约5%,且更优选高于约10%,且更优选高于约15%,且甚至更优选高于约20%的该化合物的那些菌株鉴定为预期含有上述类型的新PKS系统。对于其它生物活性化合物,例如抗生素或以更少量合成的化合物,将具有高于该微生物干重的约0.5%,且更优选高于约0.1%,且更优选高于约0.25%,且更优选高于约0.5%,且更优选高于约0.75%,且更优选高于约1%,且更优选高于约2.5%,且更优选高于约5%的该化合物的那些菌株鉴定为预期含有上述类型的新PKS系统。
作为另一选择,或者与该方法相结合,通过检查该菌株的脂肪酸分布特征(通过培养该生物体或者通过公开的或其它容易获得的来源获得)可鉴定预期含有本文所述新PUFA PKS系统的微生物菌株。如果该微生物含有高于约30%,且更优选高于约40%,且更优选高于约45%,且甚至更优选高于约50%的其总脂肪酸是C14:0,C16:0和/或C16:1,尽管也产生至少一种具有三个或更多个不饱和键,且更优选4个或更多个双键,且更优选5个或更多个双键,且甚至更优选6个或更多个双键的长链脂肪酸,那么将该微生物菌株鉴定为具有本发明所述类型的新PUFA PKS系统的可能候选菌株。在上述低氧条件下筛选该生物体,并证实产生了含有两个或更多个不饱和键的生物活性分子,这表明该生物体中存在新的PUFA PKS系统,通过分析该微生物的基因组可进一步证实这一点。
通过筛选已知含有C17:0和/或C17:1脂肪酸(与上述高百分比的C14:0,C16:0和C16:1脂肪酸相结合)的真核菌株也可提高该方法的成功率,因为C17:0和C17:1脂肪酸是细菌(原核)为基础的或作用的脂肪酸生产系统的有效标记。鉴定含有新PUFA PKS系统的菌株的另一标记是该生物体产生简单的脂肪酸分布特征。根据本发明,“简单的脂肪酸分布特征”定义为该菌株以高于总脂肪酸10%的水平产生8种或更少的脂肪酸。
使用这些方法或标记的任一种(单独或者优选相结合)使得本领域的技术人员能够容易地鉴定可信地预期含有本发明所述类型的新PUFA PKS系统的微生物菌株。
在结合上述众多方法和标记的一个优选的实施方案,建立了一个新的生物学合理的筛选系统(使用摇瓶培养物)用于检测含有产生PUFA的PKS系统的微生物。该筛选系统按如下进行将待测菌株/微生物的一部分培养物放在含有50mL培养基的250mL带挡板的摇瓶中(有氧处理),并将相同菌株的另一部分培养物放在含有200mL培养基的250mL无挡板的摇瓶中(缺氧/低氧处理)。根据被评估的微生物的类型和菌株采用不同的培养基。将两种摇瓶放在200rpm的摇床上。培养48-72小时后,离心收获培养基并通过气相色谱法分析细胞的脂肪酸甲基酯含量以测定各培养物的下列数据(1)脂肪酸分布特征;(2)PUFA含量;和(3)脂肪含量(约计为脂肪酸总量/细胞干重)。
然后分析这些数据并回答下列5个问题(是/否)比较低氧/缺氧瓶的数据与有氧瓶的数据(1)与有氧培养物相比低氧培养物中的DHA(或其它PUFA含量)(以%FAME(脂肪酸甲酯))是否保持约相同或优选提高?(2)缺氧培养物中的C14:0+C16:0+C16:1是否超过约40%的TFA?(3)在缺氧培养物中对于常规氧依赖型延长酶/去饱和酶途径是否有极少(FAME<1%)或者没有前体(C18:3n-3+C18:2n-6+C18:3n-6)?(4)与有氧培养相比低氧培养中的脂肪含量(以脂酸总量/细胞干重表示)是否提高?(5)与有氧培养相比低氧培养中以占细胞干重百分数表示的DHA(或其它PUFA含量)是否增加?如果前3个问题的答案为是,则它是该菌株含有形成长链PUFA的PKS遗传系统的良好征兆。答案为是的问题越多(优选前三个问题的答案必须为是),该菌株含有这种PKS遗传系统的征兆就越强。如果5个问题的答案都为是,那么就是该菌株含有形成长链PUFA的PKS遗传系统的极强征兆。缺少18:3n-3/18:2n-6/18:3n-6表明低氧条件关闭或者抑制了常规的PUFA合成途径。高14:0/16:0/16:1脂肪是细菌作用的脂肪酸合成分布特征(存在C17:0和17:1也是它的指标)和简单的脂肪酸分布特征的初步指标。在低氧条件下PUFA合成和含有PUFA的脂肪合成增加是PUFA PKS系统的直接征兆,因为该系统不需要氧形成高度不饱和脂肪酸。
最后,在本发明的鉴定方法中,一旦鉴定了优良的候选菌株,优选筛选该微生物以检测该微生物是否含有PUFA PKS系统。例如,可筛选该微生物的基因组以检测是否存在编码本文所述PUFA PKS系统的结构域的一种或多种核酸序列。优选的是,该检测步骤包括合适的核酸检测方法,例如,对目的微生物中的一种或多种核酸序列的杂交,扩增和测序。用于该检测方法的探针和/或引物可来源于任何已知的PUFA PKS系统,包括美国专利号6,140,486所述海洋细菌PUFA PKS系统,或美国申请系列号09/231,899和本文所述Thraustochytrid PUFA PKS系统。一旦鉴定了新的PUFA PKS系统,来自这些系统的遗传物质也可用于检测其它新的PUFA PKS系统。以鉴定和检测序列为目的核酸杂交,扩增和测序方法是本领域熟知的。使用这些检测方法,可评估序列同源性和结构域的结构(例如,各种PUFA PKS功能域的存在,数目和/或排列)并与本文所述已知PUFA PKS系统进行比较。
在一些实施方案中,可使用生物学试验鉴定PUFA PKS系统。例如,在美国申请系列号09/231,899的实施例7中,描述了使用一些类型的脂肪酸合成系统的熟知抑制剂,即,硫乳霉素的关键实验的结果。本发明人表明在Schizochytrium的所有细胞中可特异性抑制PUFA的合成而不抑制短链饱和脂肪酸的合成。该结果具有如下意义本发明人从Schizochytrium的cDNA序列分析中了解到在Schizochytrium中存在I型脂肪酸合酶系统。已知硫乳霉素不能抑制I型FAS系统,这与本发明人的数据一致,即,用硫乳霉素处理没有抑制饱和脂肪酸(在Schizochytrium中主要是C14:0和C16:0)的生产。在文献和本发明人自己的数据中没有硫乳霉素对C14:0或C16:0脂肪酸的延长或其去饱和化(即,短链饱和脂肪酸通过传统途径转变成PUFA)具有任何抑制作用的征兆。因此,硫乳霉素强烈抑制Schizochytrium中的PUFA生产的事实表明传统PUFA合成途径在Schizochytrium中不能产生PUFA,而是涉及一个不同的合成途径。另外,以前已经确定硫乳霉素抑制希瓦氏菌属PUFA PKS系统(注意本发明的PUFA PKS系统同时具有I型和II型系统的因子),且已知硫乳霉素是II型FAS系统(例如在大肠杆菌中发现的系统)的抑制剂。因此,该实验表明Schizochytrium以不涉及I型FAS的途径产生PUFA。使用相似的理论和检测步骤可检测使用本文公开的新筛选方法鉴定的微生物中的PUFA PKS系统。
另外,实施例3显示了其它的生化数据,该数据提供了Schizochytrium中的PUFA不通过传统途径产生的证据(即,在所有细胞中没有观察到C16:0与DHA之间的前体产物动力学,且体外PUFA合成可从膜成份分离——除了插入一系列双键中的第一个双键的δ9去饱和酶外,传统PUFA合成途径的所有脂肪酸去饱和酶都与细胞膜相联)。这类生化数据可用于在以上述新筛选方法中鉴定的微生物中检测PUFA PKS活性。
需要使用本发明的筛选/鉴定方法筛选的优选微生物菌株选自由细菌,藻类,真菌,原生动物或原生生物组成的组中,但最优选从由藻类,真菌,原生动物和原生生物组成的真核微生物中选择。这些微生物优选在高于约15℃,更优选高于约20℃,甚至更优选高于约25℃且最优选高于约30℃的温度下能够生长并产生含有两个或多个不饱和键的生物活性化合物。
在本发明该方法的一些实施方案中,可在超过约20℃,优选超过约25℃且甚至更优选超过约30℃的温度下产生PUFA的细菌中鉴定新的细菌PUFAPKS系统。如本文前面所述,美国专利6,140,486中所述海洋细菌,希瓦氏菌属和Vibrio marinus在较高温度下不产生PUFA,这限制了来自这些细菌的PUFA PKS系统的有用性,特别是在野外条件下的植物应用中的有用性。因此,在一个实施方案中,本发明的筛选方法可用于鉴定具有PUFA PKS系统且能在较高温度(例如,超过约20,25,或30℃)下生长并产生PUFA的细菌。在该实施方案中,可将诸如制霉菌素(抗真菌剂)或放线菌酮(真核蛋白合成抑制剂)的真核生物生长抑制剂加入琼脂板中用于从下文所述生境/生态位类型收集的水样品/土壤样品培养/选择起始菌株。该方法可帮助选择没有(或有最小的)真核菌株污染的细菌菌株富集物。该选择方法与在高温(例如,30℃)下培养平板,然后选择产生至少一种PUFA的菌株相结合可初步鉴定具有在高温下有效的PUFA PKS系统的候选细菌菌株(与现有技术中仅在不超过约20℃且更优选低于约5℃的温度下表现出PUFA生产的那些细菌菌株相反)。
收集优选的微生物类型用于筛选根据本发明的PUFA PKS系统的地点包括下列任一处低氧环境(或靠近这些类型的低氧环境的地点,包括在动物的肠道中,该动物包括消耗微生物或含有微生物的食物的无脊椎动物(包括滤食性生物类型)),含有低氧或无氧的水中生境(包括淡水,盐湖和海洋),且特别是处于或者靠近海洋中的低氧环境(区域)。该微生物菌株优选不是专性厌氧菌,而是可适应在有氧及低氧或无氧环境中均可存活。同时含有有氧及低氧或无氧环境的土壤环境也是发现这些生物体的优良环境,特别是在含水生境或暂时含水生境的这些土壤类型中。
特别优选的微生物菌株可以是在其部分生活周期期间它能通过诸如吞噬作用,吞噬营养或内吞能力的机制消耗整个细菌细胞(食细菌生物)和/或在其生活周期中具有以变形虫状阶段或裸露原生质体存在的一个时期的一种菌株(选自由藻类,真菌(包括酵母),原生动物或原生生物组成的组中)。该营养方法如果发生错误且该细菌细胞(或其DNA)不能被消化反而有效掺入真核细胞中将极大地增加将细菌PKS系统转移进真核细胞的可能性。
能够食细菌(特别是通过吞噬作用或内吞)的微生物菌株(不是Thraustochytrids的成员)可在下列微生物纲(包括但不限于举例的属)中找到在藻类和藻类样微生物(包括stramenopiles)中裸藻纲(例如眼虫属(Euglena),和Peranerna),金藻纲(例如赭单胞菌属(Ochromonas)),Dinobryaceae纲(例如Dirzobryon,Platychrysis,和Chrysochromulina属),甲藻纲(包括Crypthecodinium,Gymnodinium,Peridinium,Ceratium,Gyrodinium,和Oxyrrhis属),隐藻纲(例如隐藻属(Cryptomonas),和Rhodomonas),黄藻纲(例如Olisthodiscus属)(且包括存在变形虫状阶段的藻类形式,如鞭毛虫Rhizochloridaceae,和Aphanochaete pascheri,Bumilleria stigeoclonium和Vaucheria geminata的游动孢子/配子),Eustigmatophyceae纲,和Prymnesiopyceae纲(包括Prymnesium和Diacronema属)。
在Stramenopiles中包括Proteromonads,Opalines,Developayella,Diplophorys,Larbrinthulids,Thraustochytrids,Bicosecids,卵菌纲,Hypochytridiomycetes,Commation,Reticulosphaera,Pelagomonas,Pelapococcus,Ollicola,Aureococcus,Parmales,Raphidiophytes,Synurids,Rhizochromulinaales,Pedinellales,Dictyochales,Chrysomeridales,Sarcinochrysidales,Hydrurales,Hibberdiales,和Chromulinales。
在真菌中有粘菌纲(形成粘变形体)-粘液霉菌,聚粘菌亚纲,包括Acrasiceae目(例如Sappinia属),Guttulinaceae纲(例如Guttulinopsis,和Guttulina属),Dictysteliaceae纲(例如宿曲滴菌属(Acrasis),盘基网柄菌属(Dictyostelium),Polysphondylium,和Coenonia),和Phycomyceae纲,包括壶菌目,Ancylistales,Blastocladiales,Monoblepharidales,水霉目,霜霉目,毛霉菌目,和虫霉目。
在原生动物中有具有能够食细菌(包括通过吞噬作用)的生活阶段的原生动物株可选自分类为纤毛虫,鞭毛虫或变形虫的类型。原生动物纤毛虫包括的种类漏斗虫,肾形虫,管口虫,Haptorids,核残迹虫,寡膜虫,Polyhymenophora(旋毛虫),Prostomes和吸管纲。原生动物鞭毛虫包括Biosoecids,Bodonids,单鞭滴虫,Chrysophytes(例如Anthophysa属,Chrysamoemba,金球藻虫属,树滴虫属,锥囊藻虫属,鱼鳞藻虫属,赭滴虫属,Paraphysomonas,Poterioochromonas,Spumella,Syncrypta,黄群藻虫属,和Uroglena),领鞭毛虫,Cryptophytes(例如唇滴虫属,隐滴虫属,Cyanomonas,和Goniomonas),Dinoflagellates,Diplomonads,Euglenoids,Heterolobosea,Pedinellids,Pelobionts,胶领鞭虫,Pseudodendromonads,Spongomonads和Volvocales(和其它鞭毛虫,包括未分类的鞭毛虫Artodiscus属,Clautriavia,曳鞭毛虫属,Kathablepharis和Multicilia)。变形虫状原生动物包括的种类有太阳虫,Centrohelids,Desmothoricids,Diplophryids,Eumamoebae,Heterolobosea,Leptomyxids,Nucleariid filose变形虫,Pelebionts,Testate变形虫和Vampyrellids(且包括未分类的变形虫属Gymnophrys,Biomyxa,Microcometes,Reticulomyxa,Belonocystis,Elaeorhanis,Allelogromia,Gromia或Liebeduhnia)。原生动物包括如下的目Percolomonadeae,Heterolobosea,Lyromonadea,Pseudociliata,Trichomonadea,Hypermastigea,Heteromiteae,Telonemea,Cyathobodonea,Ebridea,Pyytomyxea,Opalinea,Kinetomonadea,Hemimastigea,Protostelea,Myxagastrea,Dictyostelea,Choanomonadea,Apicomonadea,Eogregarinea,Neogregarinea,Coelotrolphea,Eucoccidea,血孢子虫亚目,Piroplasmea,Spirotrichea,Prostomatea,Litostomatea,Phyllopharyngea,Nassophorea,Oligohymenophorea,Colpodea,Karyorelicta,Nucleohelea,Centrohelea,Acantharea,Sticholonchea,Polycystinea,Phaeodarea,Lobosea,Filosea,Athalamea,Monothalamea,Polythalamea,Xenophyophorea,Schizocladea,Holosea,Entamoebea,粘盘孢目,纺线孢子目,Halosporea,Paramyxea,Rhombozoa和Orthonectea。
本发明的一个优选的实施方案包括从上述一种优选的生境中收集的上述微生物的菌株。
本发明的一个实施方案涉及使用上述新PUFA PKS筛选方法鉴定的任何微生物,涉及PUFA PKS基因及其编码的蛋白质,且涉及该微生物和/或PUFAPKS基因和蛋白质(包括其同源物和片段)在本文所述任一方法中的用途。具体地说,本发明包含以本发明的筛选方法鉴定的生物体,该生物体随后被遗传修饰成通过所述PUFA PKS系统调节生物活性分子的生产。
本发明的另一实施方案还涉及一种分离的核酸分子,该分子含有编码来自Thraustochytrid微生物的多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一种生物学活性结构域或其生物学活性片段的核酸序列。如上所述,本发明人成功使用该方法鉴定了一种具有PUFA PKS系统的非细菌微生物,该系统用于鉴定含有PUFA PKS系统的Thraustochytriales目的其它成员。实施例2描述了三种该微生物的鉴定。具体地说,本发明人使用本发明的筛选方法鉴定了认为极有可能含有PUFA PKS系统的破囊壶菌23B(ATCC20892),接着检测了破囊壶菌属种类23B基因组中与本文公开的Schizochytrium PUFA PKS基因杂交的序列。还将Schizochytrium lirnacium(IFO 32693)和Ulkenia(BP5601)鉴定为含有PUFA PKS系统的良好候选菌株。根据这些数据和Thraustochytriales目的成员之间的相似性,据信现在使用本发明提供的方法和工具可容易地鉴定许多其它Thraustochytriales的PUFAPKS系统。因此,本发明包括Thraustochytriales的PUFA PKS系统和其部分和/或其同源物(例如,蛋白质,结构域及其片段),含有该系统和其部分和/或其同源物的遗传修饰的生物体,使用该微生物和PUFA PKS系统的方法。
开发导致对Thraustochytrids的分类学进行了修正。分类学家将Thraustochytrids放在藻类或藻类状原生生物中。然而,由于分类不确定,对于本发明最好认为本发明所述该菌株是Thraustochytrids(目Thraustochytriales;科Thraustochytriaceae;属破囊壶菌属,Schizochytrium,Labyrinthuloides,或Japonochytrium)。对于本发明,labrinthulids的许多成员被认为包含在Thraustochytrids中。分类学改变在下文中概括。本文公开的某些单细胞微生物菌株是Thraustochytriales目的成员。Thraustochytrids是分类史进化的海洋真核生物。Moss(1986),Bahnweb和Jackle(1986),以及Chamberlain和Moss(1988)对Thraustochytrids的分类地位问题进行了综述。根据本发明,短语“Thraustochytrid”,“Thraustochytriales微生物”和“Thraustochytriales目的微生物”可互换使用。
为了方便,分类学家首先将Thraustochytrids与藻菌目(藻类状真菌)的其它无色游动孢子真核生物放在一起。然而,藻菌目这一名称最后从分类学地位中去掉,并将Thraustochytrids保留在卵菌纲(双鞭毛游动孢子真菌)中。最初假定卵菌纲与异鞭毛藻类有亲缘关系,且由Barr(Barr,1981,Biosystems 14359-370)总结的,广泛的超微结构和生化研究最终支持了这一假定。事实上卵菌纲被Leedale(Leedale,1974,Taxon 23261-270)和其他藻类学家作为异鞭毛藻类的一部分接受。然而,事实上由于其异氧特性的方便性,卵菌纲和Thraustochytrids被真菌学家(研究真菌的科学家)而不是藻类学家(研究藻类的科学家)大量研究。
从另一分类学角度来看,进化生物学家对于真核生物如何进化形成了两个系统学派。一个学说认为膜结合细胞器通过一系列的内共生的外生起源(Margulis,1970,Origin of Eukaryotic Cells.Yale University Press,New Haven);例如线粒体起源于细菌的细胞内共生生物,叶绿体起源于蓝藻类,鞭毛起源于螺旋体。另一学说提出膜结合的细胞器从原核祖先的无膜结合的系统通过自生加工逐渐进化(Cavalier-Smith,1975,Nature(Lond.)256462-468)。然而两组进化生物学家都将卵菌纲和Thraustochytrids从真菌中取出并与chromophyte藻类一起放在Chromophyta界中(Cavalier-Smith,1981,BioSystems 14461-481)(该界最近扩展到包括其它原生生物且该界的成员现在称为Stramenopiles)或与所有藻类一起放在Protoctista界中(Margulis和Sagen,1985,Biosystems 18141-147)。
随着电子显微镜的发展,对Thraustochytrids的两个属,即,破囊壶菌属和Schizochytrium的游动孢子超微结构的研究(Perkins,1976,第279-312页,见“Recent Advances in Aquatic Mycology”(ed.E.B.G Jones),John Wiley &Sons,New York;Kazama,1980,Can.J.Bot.582434-2446;Barr,1981,Biosystems 14359-370)提供了Thraustochytriaceae与卵菌纲仅具有较远的亲缘关系的良好证据。另外,对5S核糖体RNA序列的对应分析(多元统计形式)得到的遗传数据表明Thraustochytriales明显是一个独特的真核类型,完全独立于真菌,且与红藻和褐藻,以及与卵菌纲的成员有最近的亲缘关系(Mannella,等,1987,Mol.Evol.24228-235)。大多数分类学家同意将Thraustochytrids从卵菌纲中取出(Bartnicki-Garcia,1987,第389-403页,见“Evolutionary Biology of the Fungi”(eds.Rayner,A.D.M.,Brasier,C.M.&Moore,D.),Cambridge University Press,Cambridge)。
总之,采用Cavalier-Smith的分类系统(Cavalier-Smith,1981,BioSystems14461-481,1983;Cavalier-Smith,1993,Microbiol Rev.57953-994),将Thraustochytrids与chromophyte藻类一起分类进Chromophyta(Stramenopiles)界中。最近Cavalier Smith等使用Heterokonta的18s rRNA标记证实Thraustochytrids是chromists而不是真菌再次确认了该分类地位(Cavalier-Smith等,1994,Phil.Tran.Roy.Soc.London Series BioSciences 346387-397)。该分类将它们放在与真菌完全不同的一个界中,而真菌都放在Eufungi界中。因此Thraustochytrids的分类地位总结如下界Chromophyta(Stramenopiles)门Heterokonta目Thraustochytriales科Thraustochytriaceae属破囊壶菌属,Schizochytrium,Labyrinthuloides,或Japonochytrium一些早期的分类学家将破囊壶菌属的一些原始的成员(具有变形虫状生活阶段的成员)分入一个称为Ulkenia的独立属中。然而,现在知道大多数(如果不是全部的话)Thraustochytrids(包括破囊壶菌属和Schizochytrium)表现出变形虫状阶段且有人认为Ulkenia本身不是一个正确的属。本文使用的破囊壶菌属将包括Ulkenia。
尽管门和界的高级分类中的分类学地位不确定,但是Thraustochytrids保持特有的和特征性的分类,其成员可分类在Thraustochytriales目内。
多不饱和脂肪酸(PUFA)是高等真核生物中的基本膜成份和许多脂类衍生的信号分子的前体。本发明的PUFA PKS系统使用不需要饱和脂肪酸去饱和并延长的PUFA合成途径。该途径由结构和机制上均不同于以前认识的PKSs的PUFA PKSs催化。顺式双键的产生表明包含位置特异性异构酶,据信这些酶用于产生新家族的抗生素。
为了使用本发明的PUFA PKS系统产生明显高产的各种生物活性分子,可对一种生物体,优选微生物或植物,进行遗传修饰以影响PUFA PKS系统的活性。在一个方面,该生物体内源性含有并表达PUFA PKS系统,且该遗传修饰可以是对内源性PUFA PKS系统的一种或多种功能域的遗传修饰,因此该修饰对PUFA PKS系统的活性具有某种影响。在另一方面,该生物体可内源性含有并表达PUFA PKS系统,且该遗传修饰可以是导入至少一种外源性核酸序列(例如,重组核酸分子),其中该外源性核酸序列编码第二种PKS系统的至少一个生物学活性结构域或蛋白质和/或影响所述PUFA PKS系统的活性的蛋白质(例如,磷酸泛酰巯基乙胺转移酶(PPTase),下文讨论)。在还有另一实施方案中,该生物体不必内源性(天然)含有PUFA PKS系统,而是经遗传修饰导入编码具有PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列的至少一个重组核酸分子。在该方面,通过在生物体中导入或提高PUFA PKS活性影响PUFA PKS的活性。与这些方面中任一种相关的各种实施方案在下面更详细地讨论。
因此,根据本发明,一个实施方案涉及遗传修饰的微生物,其中该微生物表达含有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个生物学活性结构域的PKS系统。PUFA PKS系统的至少一个结构域由选自如下的核酸序列编码(a)编码来自Thraustochytrid微生物的多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的核酸序列;(b)编码来自以本发明的筛选方法鉴定的微生物的PUFA PKS系统的至少一个结构域的核酸序列;(c)编码与选自SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的至少500个连续氨基酸有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性;和,(d)编码与选自由SEQ ID NO8,SEQ ID NO10,SEQ IDNO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,和SEQ ID NO32组成的组中的氨基酸序列有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。该遗传修饰影响生物体中PKS系统的活性。(b)部分中提及的筛选方法已在上文中详细描述且包括如下步骤(a)选择产生至少一种PUFA的微生物;和,(b)从(a)中鉴定与发酵培养基中在大于约5%饱和度,且优选约10%,且更优选约15%,且更优选约20%的饱和度的溶氧条件下微生物产生的PUFA相比,在发酵培养基中不超过约5%饱和度的溶氧条件下具有产生增加的PUFA的能力的微生物。该遗传修饰的微生物可包括任意一种或多种上文鉴定的核酸序列,和/或任一上文详细描述的Schizochytrium PUFA PKS ORFs或结构域的任一其它同源物。
本文所用的遗传修饰的微生物包括遗传修饰的细菌,原生生物,显微藻类,真菌,或其它微生物,且特别是本文所述Thraustochytriales目(例如,Thraustochytrid)的任一属(例如,Schizochytrium,破囊壶菌属,Japonochytrium,Labyrinthuloides)。该遗传修饰的微生物具有从其正常(即野生型或天然)形式进行了修饰(即,突变或改变)以便达到所需结果(即,增加或修饰的PUFA PKS活性和/或使用PKS系统产生所需产物)的基因组。使用传统的菌株开发和/或分子遗传技术可完成对微生物的遗传修饰。该技术是本领域已知的且一般公开用于微生物,例如,参见Sambrook等,1989,Molecular CloningALaboratory Manual,冷泉港实验室出版。该参考文献Sambrook等,出处同上在本文中引用以其整体作为参考。遗传修饰的微生物包括这样的微生物,其中的核酸分子以该修饰提供微生物内的所需效果的方式被插入,缺失或修饰(即,突变;例如,通过插入,缺失,取代,和/或核苷酸倒置)。
根据本发明修饰的优选微生物宿主细胞包括,但不限于,任一细菌,原生生物,显微藻类,真菌,或原生动物。在一个方面,遗传修饰的优选微生物包括,但不限于,Thraustochytriales目的任一微生物。用于本发明的特别优选的宿主细胞可包括来自如下属的微生物,该属包括,但不限于破囊壶菌属,Labyrinthuloides,Japonochytrium,和Schizochytrium。这些属内优选的种类包括,但不限于任一Schizochytrium种类,包括Schizochytriumaggregatum,Schizochytrium limacinum,Schizochytrium minutum;任一破囊壶菌属种类(包括以前的Ulkenia种类,例如U.Visurgensis,U.Amoeboida,U.Sarkariana,U.Profunda,U.radiata,U.Minuta和Ulkeniasp.BP-5601),且包括Thraustochytrium stratum,Thraustochytrium aureum,Thraustochytriumroseum;和任一Japonochytrium种类。特别优选的Thraustochytriales菌株包括,但不限于Schizochytrium sp.(S31)(ATCC 20888);Schizochytriumsp.(S8)(ATCC 20889);Schizochytrium sp.(LC-RM)(ATCC 18915);Schizochytrium sp.(SR21);Schizochytrium aggregatum(Goldstein etBelsky)(ATCC 28209);Schizochytrium limacinum(Honda et Yokochi)(IFO32693);破囊壶菌属种类(23B)(ATCC 20891);Thraustochytrium striatum(Schneider)(ATCC 24473);Thraustochytrium aureum(Goldstein)(ATCC34304);Thraustochytrium roseum(Goldstein)(ATCC 28210);和Japonochytrium sp.(L1)(ATCC 28207)。用于遗传修饰的合适宿主微生物的其它例子包括,但不限于,酵母,包括啤酒糖酵母(Saccharomyces cerevisiae),卡尔斯伯糖酵母(Saccharomyces carlsbergensis),或诸如念珠菌属(Candida),克鲁维氏酵母属(Kluyveromyces)的其它酵母,或其它真菌,例如,诸如曲霉属(Aspergillus),链孢霉属(Neurospora),青霉属(Penicillium)的丝状真菌,等。细菌细胞也可用作宿主。它包括可用于发酵方法的大肠杆菌。另外,诸如乳酸杆菌属(Lactobacillus)种类或杆菌属(Bacillus)种类的宿主也可用作宿主。
本发明的另一实施方案涉及遗传修饰的植物,其中该植物被遗传修饰成重组表达含有多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个生物活性结构域的PKS系统。该结构域由选自如下的一种核酸序列编码(a)编码来自Thraustochytrid微生物的多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的核酸序列;(b)编码来自本文所述筛选和选择方法鉴定的微生物的PUFA PKS系统的至少一个结构域的核酸序列(参见上文在遗传修饰的微生物的讨论中的方法的简要小结);(c)编码选自由SEQID NO2,SEQ ID NO4,SEQ ID NO6,和其生物学活性片段组成的组中的氨基酸序列的核酸序列;(d)编码选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ IDNO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ ID NO32,或其生物学活性片段的氨基酸序列的核酸序列;(e)编码与选自SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的至少500个连续氨基酸有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性;和/或(f)编码与选自SEQID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQ ID NO32的氨基酸序列具有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。该遗传修饰的植物可包括任意一种或多种上文鉴定的核酸序列,和/或任一上文详细描述的Schizochytrium PUFA PKS ORFs或结构域的任一其它同源物。
本文所用的遗传修饰的植物可包括任一遗传修饰的植物,包括高等植物且特别是任何可消费的植物或用于产生本发明的所需生物活性分子的植物。该遗传修饰的植物具有从其正常(即野生型或天然)形式进行了修饰(即,突变或改变)以便实现所需结果(即,增加或修饰的PUFA PKS活性和/或使用该PKS系统产生所需产物)的基因组。使用传统的品系开发和/或分子遗传技术可完成对植物的遗传修饰。产生将编码所需氨基酸序列的重组核酸分子插入植物基因组的转基因植物的方法是本领域已知的。根据本发明用于遗传修饰的优选植物优选是适合于被包括人类的动物消费的植物。
根据本发明被遗传修饰的优选植物(即,植物宿主细胞)包括,但不限于任何高等植物,且特别是可消费的植物,包括农作物植物且特别是使用其油类的植物。该植物可包括,例如canola,大豆,油菜,亚麻,玉米,红花,向日葵和烟草。其它优选的植物包括已知产生用作药物试剂,调味剂,neutraceutical试剂,功能食品成份或美容活性剂的那些植物或遗传修饰成产生这些化合物/试剂的植物。
根据本发明,遗传修饰的微生物或植物包括使用重组技术修饰的微生物或植物。本文使用的导致基因表达,基因功能,或基因产物(即,由该基因编码的蛋白)功能降低的遗传修饰可指基因的失活(完全或部分),缺失,中断,阻断或下调。例如,导致该基因编码的蛋白质的功能下降的基因遗传修饰可由该基因的完全缺失(即,该基因不存在,且因此该蛋白质不存在),导致蛋白质不完全翻译或不翻译(例如,蛋白质不表达)的基因突变,或降低或消除该蛋白的天然功能(即表达降低或无酶活性或作用的蛋白质)的基因突变引起。导致基因表达或功能增强的遗传修饰可指基因的扩增,过度表达,激活,增强,增加,或上调。
根据本发明的微生物或植物的遗传修饰优选影响植物表达的PKS系统的活性,无论该PKS系统是内源性且进行了遗传修饰的系统,即向生物体中导入了重组核酸分子的内源性系统,还是完全通过重组技术提供的系统。根据本发明,“影响PKS系统的活性”包括与不存在该遗传修饰相比引起由该生物体表达的PKS系统中任何可检测的或可测量的改变或修饰的任一遗传修饰。PKS系统中可检测的改变或修饰可包括,但不限于将PKS系统活性导入生物体中使得该生物体目前具有可测量的/可检测的PKS系统活性(即,遗传修饰前该生物体不含有PKS系统),将来自与该生物体内源性表达的PKS系统不同的PKS系统的功能域导入该生物体中使得PKS系统的活性得到修饰(例如,将细菌PUFA PKS结构域或I型PKS结构域导入内源性表达非细菌PUFA PKS系统的生物体中),PKS系统产生的生物活性分子的量改变(例如,与不存在遗传修饰相比该系统产生更多(量增大)或更少(量减少)的给定产物),PKS系统产生的生物活性分子的类型改变(例如,该系统产生新的或不同的产物,或由该系统天然产物的变异体),和/或PKS系统产生的多个生物活性分子的比率改变(例如,与不存在该遗传修饰相比该系统产生不同比率的一种PUFA与另一PUFA的比率,产生完全不同的脂类分布特性,或者与天然构型相比将各种PUFA放在三酰甘油的不同位置)。该遗传修饰包括任一类型的遗传修饰且特别包括通过重组技术和通过传统诱变作出的修饰。
应注意提及PUFA PKS系统中功能域或蛋白质的活性增加是指在含有该结构域或蛋白质(或导入了该结构域或蛋白质)的生物体中导致该结构域或蛋白质系统的功能增强的任何遗传修饰且可包括结构域或蛋白质的活性更高(例如,比活或体内酶活性),结构域或蛋白质系统的抑制或降解减少,和该结构域或蛋白质的过度表达。例如,基因拷贝数增加,通过使用与天然启动子相比产生更高表达水平的启动子来增加表达水平,或通过遗传改造或传统诱变改变基因以增加该基因编码的结构域或蛋白质的活性。
同样,提及PUFA PKS系统中功能域或蛋白质的活性降低是指在含有该结构域或蛋白质(或导入了该结构域或蛋白质)的生物体中导致该结构域或蛋白质功能降低的任何遗传修饰且包括该结构域或蛋白质的活性降低,该结构域或蛋白质的抑制或降解增加,和该结构域或蛋白质的表达减少或消除。例如,通过抑制或减少该结构域或蛋白质的生产,“敲除”编码该结构域或蛋白质的基因或其部分,降低结构域或蛋白质活性,或抑制该结构域或蛋白质的活性可减小本发明的结构域或蛋白质的作用。抑制或减少结构域或蛋白质的生产可包括将编码该结构域或蛋白质的基因放在需要在生长培养基中存在诱导化合物的启动子的控制下。通过形成耗尽培养基中的该诱导剂的条件,编码该结构域或蛋白质的基因表达(且因此蛋白质的合成)可被关闭。抑制或减小结构域或蛋白质的活性也可包括使用相似于在美国专利号4,743,546中所述切除技术方案,本文引用以供参考。使用该方法,可将编码目的蛋白的基因克隆到特定遗传序列之间,允许从基因组中特异性,受控制地切除该基因。通过,例如,按美国专利号4,743,546转换培养物的培养温度,或者通过一些其它的物理或营养信号可促进切除。
在本发明的一个实施方案中,遗传修饰包括修饰编码具有本文所述非细菌PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列的核酸序列。该修饰可针对内源性(天然)表达的非细菌PUFA PKS系统内的氨基酸序列,因此通过,例如,传统诱变和选择技术和/或分子遗传技术,包括遗传工程技术可对天然含有该系统的微生物进行遗传修饰。遗传工程技术可包括,例如,使用定向重组载体缺失内源性基因的一部分,或者用异源性序列取代内源性基因的一部分。可导入宿主基因组的异源性序列的例子包括编码来自诸如不同的非细菌PUF APKS系统,细菌PUFA PKS系统,I型PKS系统,II型PKS系统,或模块PKS系统的另一PKS系统的至少一个功能域的序列。导入宿主基因组的其它异源性序列包括编码不是PKS系统的结构域的蛋白质或功能域,但是将影响内源性PKS系统活性的序列。例如,可将编码磷酸泛酰巯基乙胺转移酶的核酸分子导入宿主基因组中(下文讨论)。可对内源性PUFA PKS系统作出的特异性修饰在下文中详细讨论。
在本发明的该实施方案的另一方面,该遗传修饰可包括向宿主中导入(1)编码具有非细菌PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列的重组核酸分子;和/或(2)编码影响PUFA PKS系统的活性的蛋白质或功能域的重组核酸分子。该宿主可包括(1)不表达任一PKS系统的宿主细胞,其中将PKS系统的所有功能域导入该宿主细胞中,且其中至少一种功能域来自于非细菌PUFA PKS系统;(2)表达具有非细菌PUFA PKS系统的至少一个功能域的PKS系统(内源性或重组)的宿主细胞,其中导入的重组核酸分子可编码至少一种其它非细菌PUFA PKS结构域功能或者影响宿主PKS系统的活性的另一蛋白质或结构域;和(3)表达不必包括来自非细菌PUFAPKS的结构域功能的PKS系统(内源性或重组)的宿主细胞,且其中导入的重组核酸分子包括编码非细菌PUFA PKS系统的至少一个功能域的核酸序列。换句话说,本发明试图包括任何遗传修饰的生物体(例如,微生物或植物),其中该生物体包含至少一种非细菌PUFA PKS结构域功能(内源性或者通过重组修饰),且其中当该生物体包含功能性PKS系统时该遗传修饰对非细菌PUFA PKS结构域功能或PKS系统具有可测量的影响。
因此,使用本发明的非细菌PUFA PKS系统,例如,利用来自Thraustochytrid PUFA PKS系统的基因,可使用基因混合将PUFA产物的范围扩展到包括EPA,DHA,ARA,GLA,SDA及其它产物,以及产生广泛的生物活性分子,包括抗生素,其它药用化合物,和其它所需产物。获得这些生物活性分子的方法不仅包括混合来自各种生物的基因,而且还包括遗传修饰本文公开的非细菌PUFA PKS基因的方法。对本发明的非细菌PUFAPKS系统的遗传基础和结构域结构的了解提供了设计产生各种生物活性分子的遗传修饰的新生物体的基础。尽管本发明人预期可混合和修饰任一PKS结构域和有关基因,但是以举例的方式,下面讨论了在遗传修饰和生物活性分子的生产中对PUFA-PKS系统的各种可能的操作。
例如,在一个实施方案中,通过修饰CLF(链长因子)结构域改变非细菌PUFA-PKS系统的产物,例如由Thraustochytrids产生的那些产物。该结构域是II型(分离的酶)PKS系统的特征。其氨基酸序列与KS(酮合酶对)结构域具有同源性,但它缺乏活性位点半胱氨酸。CLF可发挥确定延长循环次数,且因此确定最终产物的链长的功能。在本发明的该实施方案中,使用目前对FAS和PKS合成的了解情况,提供了通过定点修饰非细菌PUFA-PKS系统产生ARA的合理策略。在文献中关于CLF在PKS系统中的功能存在争论(C.Bisang等,Nature 401,502(1999))且认识到其它结构域可能与最终产物的链长确定相关。然而,有意义的是Schizochytrium同时产生DHA(C22:6,ω-3)和DPA(C22:5,ω-6)。在PUFA-PKS系统中,在碳链生长的合成期间导入顺式双键。由于在该分子合成的早期出现ω-3和ω-6双键的放置,因此预期它们不会影响随后的最终产物链长确定。因此,不受理论的约束,本发明人相信将指导C20单元(代替C22单元)合成的因子(例如,CLF)导入Schizochytrium PUFA-PKS系统中将导致产生EPA(C20:5,ω-3)和ARA(C20:4,ω-6)。例如,在异源性系统中,通过将来自产生EPA的系统的CLF(例如,来自发光菌属(Photobacterium)的CLF)直接取代进Schizochytrium基因组可利用该CLF。然后分析所得的转化子的脂肪酸分布特征的变化以鉴定产生EPA和/或ARA的转化子。
除了依赖于异源性系统(重组系统,例如可导入植物中的系统)的开发外,CLF的概念可在Schizochytrium中利用(即,通过修饰Schizochytrium基因组)。转化和异源性重组已经在Schizochytrium中得到证实。通过构建带有OrfB的CLF被来自C20 PUFA-PKS系统的CLF取代的克隆可利用它。编码区的下游可插入标记基因。然后可转化野生型细胞,选择标记表型,然后筛选插入了该新的CLF的细胞。接着可分析它们对脂肪酸分布特征的任何影响以鉴定产生EPA和/或ARA的转化子。如果发现不同于与CLF相关的一些因子影响终产物的链长,则可采用相似的策略改变这些因子。
涉及改变PUFA-PKS产物的另一优选的实施方案包括修饰或取代β-羟酰-ACP脱水酶/酮合酶对。在大肠杆菌的顺式-11-十八碳烯酸(C18:1,Δ11)合成期间,据信顺式双键的产生依赖于特异性DH酶,β-羟酰-ACP脱水酶,即FabA基因的产物。该酶从β-羟酰-ACP去掉HOH并在碳链中留下一个反式双键。DH的一个亚型,即FabA-样DH具有顺反异构酶活性(Heath等,1996,出处同上)。细菌和非细菌PUFA-PKS系统的一个新方面是存在两个FabA-样DH结构域。不受理论的约束,本发明人相信这些DH结构域中的一个或两者都具有顺反异构酶活性(DH结构域的操作在下面进行更详细地讨论)。
大肠杆菌中不饱和脂肪酸合成的另一方面是需要特定的KS酶,β-酮脂酰-ACP合酶,FabB基因的产物。它是完成对连接到活性位点的半胱氨酸残基(通过硫酯键)上的脂肪酸与丙二酰-ACP进行缩合的酶。在多步反应中,释放CO2且以两个碳延长线型链。据信只有该KS延长含有双键的碳链。只有当双键为顺式构型时发生该延长,如果为反式构型,在延长前双键被烯酰-ACP还原酶(ER)还原(Heath等,1996,出处同上)。至今鉴定的所有PUFA-PKS系统都具有两个KS结构域,一个与大肠杆菌的FabB-样KS比与其它KS具有更高的同源性。同样,不受理论的约束,本发明人相信在PUFA-PKS系统中,DH(FabA-样)和KS(FabB-样)酶结构域的特异性和相互作用确定了终产物中顺式双键的数目和位置。由于2-碳延长反应的次数比PUFA PKS终产物中存在的双键数目更大,因此可确定在一些延长循环中发生了完全还原。因此DH和KS结构域可用作改变DHA/DPA比率或其它长链脂肪酸比率的靶。通过导入来自其它系统的同源性结构域或者通过对这些基因片段的诱变可修饰和/或评估它们。
在另一实施方案中,可修饰或取代ER(烯酰-ACP还原酶,一种还原脂肪酸-ACP中的反式双键产生完全饱和碳的酶)结构域以改变PKS系统制备的产物类型。例如,本发明人已知Schizochytrium PUFA-PKS系统与以前描述的细菌系统的区别在于它具有两个(而不是一个)ER结构域。不受理论的约束,本发明人相信这些ER结构域可有效影响所得的PKS生产产物。通过分别敲除单个结构域或者通过修饰其核苷酸序列或者通过用来自其它生物的ER结构域的取代可改变所得的PKS产物。
在另一实施方案中,可将编码不是PKS系统的一部分,但影响PKS系统的蛋白质或结构域的核酸分子导入生物体中。例如,上文所述所有PUFAPKS系统含有多个,串连的,ACP结构域。ACP(作为独立的蛋白质或者作为更大蛋白质的一个结构域)需要附着到磷酸泛酰巯基乙胺辅因子上以产生有活性的,完整(holo)-ACP。磷酸泛酰巯基乙胺与apo-ACP的附着通过酶超家族成员,即磷酸泛酰巯基乙胺基转移酶(PPTase)完成(Lambalot R.H.,等,Chemistry and Biology,3,923(1996))。
与其它PKS和FAS系统相比,本发明人推定通过特异性,内源性,PPTase可完成对Schizochytriurn ORFA蛋白质中存在的多个ACP结构域的激活。在Schizochytrium中尚未鉴定编码该推定的PPTase的基因。如果在Schizochytrium中存在该基因,可预料到用于尝试鉴定和克隆它的一些方法。这些方法包括(但不限于)从活跃生长的Schizochytrium细胞制备的cDNA文库的产生和部分测序(注意,在目前获得的Schizochytrium cDNA文库组中鉴定了与PPTase的序列具有同源性的一个序列;然而,它似乎是多结构域的FAS蛋白质的一部分,且本身不编码所需的OrfA特异性PPTase);使用在许多PPTase中存在的氨基酸基序设计的简并寡核苷酸引物用于PCR反应(以获得用于筛选基因组或cDNA文库的核酸探针分子);基于蛋白质-蛋白质相互作用的遗传方法(例如,酵母双杂交系统),其中ORFA-ACP结构域可用作“钓饵”以发现“靶”(即,PPTase);以及纯化和部分测序酶本身作为产生用于筛选基因组或cDNA文库的核酸探针的工具。
异源性PPTase也许能够激活Schizochytrium ORFA ACP结构域也是可预料到的。已经表明一些PPTases,例如枯草杆菌(Bacillus subtilis)的sfp酶(Lambalot等,出处同上)和Streptomyces verticillus的svp酶(Sanchez等,2001,Chemistry & Biology 8725-738),具有广泛的底物耐受性。可试验这些酶以观察它们是否激活Schizochytrium ACP结构域。另外,最近的一篇文献描述了真菌PKS蛋白质在烟草中的表达(Yalpani等,2001,The Plant Cell 131401-1409)。在该转基因植物中检测到导入的PKS系统(由展青霉,enicilliumpatulum)的6-甲基水杨酸(6-methylsalicyclic acid)合酶基因编码)的产物,尽管在这些植物中不存在相应的真菌PPTase。这表明内源性植物PPTase(s)识别并激活真菌PKS ACP结构域。与该观察结果相关联,本发明人在拟南芥整体基因组数据库中鉴定了很可能编码PPTases的两个序列(基因)。这些序列(GenBank登录号AAG5 1443和AAC05345)目前列为编码“未知蛋白”。根据在翻译的蛋白质序列中存在包括G(I/V)D和WxxKE(A/S)xxK(SEQ IDNO33)的一些标记基序(在Lambalot等,1996中作为所有PPTases的特征列出)将它们鉴定为推定的PPTases。另外,这两个推定的蛋白质含有一般在PPTases中发现的另外两个基序,这两个基序一般与PKS和非核糖体肽合成系统相关;即FN(I/L/V)SHS(SEQ ID NO34)和(I/V/L)G(I/L/V)D(I/L/V)(SEQID NO35)。而且,这些基序在该蛋白质序列的预期相关位置出现。很可能在诸如烟草的其它植物中存在该拟南芥基因的同源物。同样,可克隆并表达这些基因以观察它们编码的酶是否可激活Schizochytrium ORFA ACP结构域,或者作为选择,可在该转基因植物中直接表达OrfA(靶向质体或细胞质)。
可识别ORFA ACP结构域作为底物的另一异源性PPTase是念珠藻属(Nostoc)种类的PCC 7120(以前称为鱼腥藻属(Anabaena)种类的PCC 7120)的HetI蛋白质。正如美国专利号6,140,486中所述,希瓦氏菌属的一些PUFA-PKS基因与在念珠藻属中发现的PKS基因簇中存在的蛋白质结构域具有高度同源性(该专利的图2)。该念珠藻属PKS系统与长链(C26或C28)羟基脂肪酸的合成相关,该脂肪酸与糖类半分子酯化形成异形囊胞细胞壁的一部分。这些念珠藻属PKS结构域也与Schizochytrium PKS蛋白质的Orfs B和C中发现的结构域(即,相应于在希瓦氏菌属PKS蛋白质中发现的那些结构域的相同结构域)具有高度同源性。直到最近,在GenBank数据库中没有一个念珠藻属PKS结构域与Schizochytrium OrfA的任一结构域(或同源性希瓦氏菌属Orf5蛋白质)具有高度同源性。然而,最近已经测序了念珠藻属的全部基因组,因此,现在可得到紧靠该PKS基因簇上游区域的序列。在该区域中有三个Orfs与OrfA的该结构域(KS,MAT,ACP和KR)具有同源性(见图3)。在这组中包含两个ACP结构域,都与ORFAACP结构域表现出高度同源性。在念珠藻属PKS基因簇的末端是编码Het I PPTase的基因。以前,不清楚Het I酶的底物是什么,然而在该基因簇中新鉴定的Orf(Hgl E)中存在串连的ACP结构域强烈地启发了本发明人该底物是那些ACPs。Schizochytrium与念珠藻属的ACP结构域的同源性,以及在两种蛋白质中该结构域的串连排列使得Het I很可能是Schizochytrium ORFA ACPs的异源性激活的候选物。本发明人相信首次认识到并推测了念珠藻属Het I PPTase的该用途。
正如在Metz等,2001,出处同上中所述,PUFA PKS系统的一个新特征是存在两个脱水酶结构域,两者都与大肠杆菌的FabA蛋白质具有同源性。利用上述新的念珠藻属PKS基因序列,现在可比较两个系统及其产物。念珠藻属基因簇(从HglE到Het I)中结构域的顺序本发明人将它们确定为(参见图3)KS-MAT-2xACP,KR,KS,CLF-AT,ER(HetM,HetN)HetI在Schizochytrium PUFA-PKS的Orfs A,B和C中,该顺序(OrfA-B-C)是KS-MAT-9xACP-KR KS-CLF-AT-ER DH-DH-ER可见结构域顺序相对应(也具有较高的氨基酸序列同源性)。念珠藻属PKS系统的产物是不含双键(顺式或反式)的长链羟基脂肪酸(具有一个或两个羟基的C26或C28)。Schizochytrium PKS系统的产物是长链多不饱和脂肪酸(C22,具有5个或6个双键,均为顺式)。两个结构域组之间的明显差异是在Schizochytrium蛋白质中存在两个DH结构域,正好该结构域涉及DHA和DPA中顺式双键的形成(推测念珠藻属系统中的HetM和HetN涉及包含羟基且也含有DH结构域,其起源不同于在PUFA中发现的DH)。另外,在Schizochytrium Orfs B和C中两份ER结构域的作用尚不清楚(在其它鉴定的PUFA PKS系统中不存在第二个ER结构域)。两组结构域之间的氨基酸序列同源性隐含着一种进化关系。可认为该PUFA PKS基因组起源于(在进化意义上)一种插入了DH(FabA样)结构域的祖先念珠藻属样PKS基因组。DH结构域的加入导致在新的PKS终产物结构中导入了顺式双键。
Schizochytrium和念珠藻属PKS结构域结构的比较以及Schizochytrium与希瓦氏菌属PUFA-PKS蛋白质之间的结构域组织的比较证实了改变结构域顺序以及插入新的结构域产生新终产物的天然能力。另外,现在可在实验室改造该基因以产生新产物。这些观察结果的含义是以定向或随机的方式继续改造该系统可影响终产物。例如,在优选的实施方案中,可设想用PUFA-PKS系统的一个DH(FabA-样)结构域取代不具有异构化活性的DH结构域,可能产生具有顺式和反式双键混合体的分子。Schizochytrium PUFAPKS系统的普遍产物是DHA和DPA(C22:5ω6)。如果改造产生C20脂肪酸的系统,可预期该产物是EPA和ARA(C20:4ω6)。这可为ARA提供一种新来源。也可使用产生不同的DHA与DPA比率的有关PUFA-PKS系统的结构域取代,例如,使用来自破囊壶菌属23B的基因(本文首次鉴定了其PUFAPKS系统)。
另外,可设想特异性改变Schizochytrium PUFA PKS系统(至今描述的其它PUFA PKS系统没有两个ER结构域)中的一个ER结构域(例如,去掉,或失活)以测定其对终产物分布特征的影响。可使用复杂性更高或更低的方案对PUFA-PKS蛋白质的各个不同的结构域以定向的方式尝试相似的策略。当然可不限于改造单个结构域。最后,通过混合来自PUFA-PKS系统和其它PKS或FAS系统(例如,I型,II型,模块型)的结构域可扩展该研究以产生全部范围的新终产物。例如,可将PUFA-PKS DH结构域导入正常情况下在其终产物中不掺入顺式双键的系统中。
因此,本发明包含通过遗传修饰生物体中编码具有根据本发明的非细菌PUFA PKS系统的至少一个功能域的生物学活性的氨基酸序列的至少核酸序列,和/或表达含有编码该氨基酸序列的核酸序列的至少一个重组核酸分子来遗传修饰微生物或植物细胞的方法。上文已经详细描述了该序列,用于遗传修饰生物体的方法,和具体修饰的各种实施方案。一般来说,该方法用于产生可生产一种或多种特定的生物活性分子的特定遗传修饰的生物体。
本发明的一个实施方案涉及被修饰成表达多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的重组宿主细胞,其中该PKS催化重复的和非重复的酶反应,且其中该PUFA PKS系统包括(a)至少两个烯酰ACP-还原酶(ER)结构域;(b)至少6个酰基载体蛋白(ACP)结构域;(c)至少两个β-酮脂酰-ACP合酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;(g)至少一个链长因子(CLF)结构域;和(h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域。在一个实施方案中,PUFA PKS系统是真核PUFA PKS系统。在一个优选的实施方案中,PUFA PKS系统是藻类PUFA PKS系统。在一个更优选的实施方案中,该PUFA PKS系统是Thraustochytriales PUFA PKS系统。该PUFA PKS系统可包括,但不限于Schizochytrium PUFA PKS系统,和破囊壶菌属PUFA PKS系统。在一个实施方案中,该PUFA PKS系统可在原核宿主细胞中表达。在另一实施方案中,该PUFA PKS系统可在真核宿主细胞中表达。
本发明的另一实施方案涉及被修饰成表达非细菌PUFA PKS系统的重组宿主细胞,其中该PKS系统催化重复的和非重复的酶反应,且其中该非细菌PUFA PKS系统包括至少下列生物学活性结构域(a)至少一个烯酰ACP-还原酶(ER)结构域;(b)多个酰基载体蛋白(ACP)结构域(至少4个);(c)至少两个β-酮脂酰-ACP合酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;(g)至少一个链长因子(CLF)结构域;和(h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域。
本发明的该实施方案的一个方面涉及产生含有至少一种PUFA的产物的方法,包括在有效产生该产物的条件下生长含有上述任一重组宿主细胞的植物,其中该重组宿主细胞是植物细胞。本发明的该实施方案的另一方面涉及生产含有至少一种PUFA的产物的方法,包括在有效产生该产物的条件下培养含有任一上述重组宿主细胞的培养物,其中该宿主细胞是微生物细胞。在一个优选的实施方案中,该宿主细胞中的PKS系统催化三酰甘油的定向生产。
本发明的另一实施方案涉及含有非细菌多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的微生物,其中该PKS催化重复的和非重复的酶反应,且其中该PUFA PKS系统包括(a)至少两个烯酰ACP-还原酶(ER)结构域;(b)至少6个酰基载体蛋白(ACP)结构域;(c)至少两个β-酮脂酰-ACP合酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;(g)至少一个链长因子(CLF)结构域;和(h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域。优选的是,该微生物是非细菌微生物且更优选的是真核微生物。
本发明还有另一实施方案涉及含有非细菌多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的微生物,其中该PKS催化重复的和非重复的酶反应,且其中该PUFA PKS系统包括(a)至少一个烯酰ACP-还原酶(ER)结构域;(b)多个酰基载体蛋白(ACP)结构域(至少4个);(c)至少两个β-酮脂酰-ACP合酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA-样β-羟酰-ACP脱水酶(DH)结构域;(g)至少一个链长因子(CLF)结构域;和(h)至少一个丙二酰-CoA:ACP酰基转移酶(MAT)结构域。
在本发明的一个实施方案中,预期可结合诱变程序与选择性筛选程序以获得目的生物活性分子。它可包括寻找各种生物活性化合物的方法。该寻找不限于产生具有顺式双键的那些分子。该诱变方法可包括,但不限于化学诱变,基因改组,编码特定酶结构域的基因区域的交换,或局限于这些基因的特定区域的诱变,以及其它方法。
例如,可使用高通量诱变方法影响或优化目的生物活性分子的生产。一旦形成有效的模型系统,可以高通量方式修饰这些基因。可设想在两种水平上利用这些技术。首先,如果可设计足够的选择性筛选方法用于产生目的产物(例如,ARA),则可用于尝试改变该系统以产生该产物(例如,代替诸如上文讨论的其它策略,或者与其协同作用)。另外,如果上文列出的该策略导致一组基因不产生该目的产物,那么可使用该高通量技术优化该系统。例如,如果导入的结构域仅在相当低的温度下起作用,则可设计允许去掉该限制的选择方法。在本发明的一个实施方案中,筛选方法可用于鉴定具有与本文所述Schizochytrium的PUFAPKS系统相似的新PKS系统的其它非细菌生物体(参见上文)。在该生物体中鉴定的同源性PKS系统可用于与本文所述用于Schizochytrium,以及用于其它遗传物质来源的方法相似的方法中,其中从该来源产生,进一步修饰和/或突变PKS系统用于在该微生物中,在另一微生物中,或在高等植物中表达以产生各种化合物。
应认识到可导入天然(内源性,原始的)PKS系统中的随机的或者定向的许多遗传改变会导致酶功能的失活。本发明优选的实施方案包括的系统仅选择不抑制PKS系统产生一种产物的能力的那些修饰。例如,大肠杆菌的FabB-菌株不能合成不饱和脂肪酸且为了生长需要向培养基中补充可代替其正常不饱和脂肪酸的脂肪酸(参见Metz等,2001,出处同上)。然而,当用有功能的PUFA-PKS系统(即,在大肠杆菌宿主中产生PUFA产物的系统,参见(Metz等,2001,出处同上,图2A)转化该菌株时可取消该需要(对培养基的补充需要)。转化的FabB-菌株现在需要有功能的PUFA-PKS系统(以产生该不饱和脂肪酸)用于生长而不需要补充该脂肪酸。该例子中的关键因素在于广泛的不饱和脂肪酸的生产可以满足(即使不饱和脂肪酸代替例如支链脂肪酸)。因此,在本发明的另一优选的实施方案中,可在本文公开的一种或多种PUFAPKS基因中产生大量突变,然后转化适当修饰的FabB-菌株(例如在含有ER结构域的表达构建体中产生突变并转化具有其它必需结构域在独立的质粒中或者整合进染色体中的FabB菌株)并仅选择不需补充培养基就能生长(即,仍然具有产生能补充FabB-缺陷的分子)的那些转化子。可开发其它筛选工具用于寻找在有活性的PKS系统的该选择性亚型中产生的特定的化合物(例如,对于脂肪酸使用GC)。可设想许多相似的选择性筛选工具用于目的生物活性分子。
如上所述,在本发明的一个实施方案中,遗传修饰的微生物或植物包括合成所需生物活性分子(产物)的能力增强或者新导入了合成特定产物(例如,合成特定抗生素)的能力的微生物或植物。根据本发明,“增强合成产物的能力”是指在与该产物合成相关的途径中使得与在相同条件下培养或生长的野生型微生物或植物相比该微生物或植物产生的产物量(包括任何以前不存在的产物的生产)增加的任何增强或上调。产生该遗传修饰的生物体的方法在上文中已有详细描述。
本发明的一个实施方案是通过生长或培养本发明的遗传修饰的微生物或植物(在上文中详细描述)产生所需生物活性分子(也称为产物或化合物)的方法。该方法包括分别在发酵培养基中培养或在合适的环境,例如土壤中生长具有按本文前面所述且根据本发明遗传修饰的微生物或植物的步骤。在一个优选的实施方案中,产生本发明的生物活性分子的方法包括在有效产生该生物活性分子的条件下培养表达包含多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个生物活性结构域的PKS系统的遗传修饰的生物体的步骤。在该优选的方面,PUFA PKS系统的至少一个结构域由选自下组的核酸序列编码(a)编码来自Thraustochytrid微生物的多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的核酸序列;(b)编码来自以本发明的新筛选方法鉴定的微生物(在上文中详细描述)的PUFA PKS系统的至少一个结构域的核酸序列;(c)编码选自由SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,和其生物学活性片段组成的组中的氨基酸序列的核酸序列;(d)编码选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,SEQ ID NO32,或其生物学活性片段的氨基酸序列的核酸序列;(e)编码与选自SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的至少500个连续氨基酸有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性;和,(f)编码与选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQID NO32的氨基酸序列具有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。在该方法的这一优选方面中,该生物体被遗传修饰成影响PKS系统的活性(在上文中详细描述)。用于与本发明的PUFA PKS系统相关的遗传修饰的优选宿主细胞在上文中描述。
在生产本发明的所需生物活性化合物的方法中,在合适的培养基中在有效产生该生物活性化合物的条件下培养或生长遗传修饰的微生物。合适的或有效的培养基是指本发明的遗传修饰的微生物在其中培养时,能够产生所需产物的任何培养基。该培养基一般是含有可同化的碳,氮和磷酸盐来源的含水培养基。该培养基也可包含合适的盐,无机物,金属和其它营养成分。本发明的微生物可在常规发酵生物反应器中培养。可通过包括,但不限于,分批,补料分批,细胞再循环,和连续发酵的任何发酵方法培养该微生物。用于根据本发明的潜在宿主微生物的优选生长条件是本领域熟知的。该遗传修饰的微生物产生的所需生物活性分子可使用常规分离和纯化技术从发酵培养基中回收。例如,可过滤或离心该发酵培养基以去掉微生物,细胞碎片和其它特定物质,并通过例如,离子交换,色谱法,萃取,溶剂萃取,膜分离,电透析,逆向渗透,蒸馏,化学衍生化和结晶的常规方法从无细胞上清中回收该产物。作为选择,可使用产生所需化合物的微生物,或其提取物和各种分级分离成份而不必从该产物中去掉微生物成份。
在生产本发明的所需生物活性化合物的方法中,在发酵培养基中培养或在诸如土壤的合适培养基中生长遗传修饰的植物。合适的,或有效的发酵培养基在上文中详细讨论。用于高等植物的合适生长培养基包括用于植物的任何生长培养基,包括,但不限于,土壤,沙土,支持根生长的任何其它颗粒培养基(例如,蛭石,perlite,等)或水耕法培养基,以及优化该高等植物生长的合适的光照,水和营养补充物。本发明的遗传修饰的植物可通过按照本发明遗传修饰的PKS系统的活性改造成产生大量所需产物。通过从该植物中提取该化合物的纯化方法可回收该化合物。在一个优选的实施方案中,通过收获该植物回收该化合物。在该实施方案中,可以其天然状态消费该植物或者进一步加工成可消费的产物。
如上所述,在一个方面,用于本发明的遗传修饰的微生物可内源性含有并表达PUFA PKS系统,且该遗传修饰可以是对内源性PUFA PKS系统的一个或多个功能域的遗传修饰,因此该修饰对PUFA PKS系统的活性具有一些影响。在另一方面,该生物体可内源性含有并表达PUFA PKS系统,且该遗传修饰可以是导入至少一个外源性核酸序列(例如,重组核酸分子),其中该外源性核酸分子编码第二个PKS系统的至少一个生物活性结构域或蛋白质和/或影响所述PUFA PKS系统的活性的蛋白质(例如,磷酸泛酰巯基乙胺基转移酶(PPTase),下文讨论)。在还有另一方面,该生物体不必内源性(天然)含有PUFA PKS系统,但是被遗传修饰成导入至少一个编码具有PUFA PKS系统的至少一个结构域的生物学活性的氨基酸序列的重组核酸分子。在该方面,通过在该生物体中导入或增加PUFA PKS活性来影响PUFA PKS的活性。分别与这些方面相关的各种实施方案已在上文中详细讨论。
在产生生物活性化合物的方法的一个实施方案中,与野生型生物体相比,该遗传修饰改变了由内源性PKS系统产生的至少一种产物。
在另一实施方案中,该生物体内源性表达含有该PUFA PKS系统的至少一种生物学活性结构域的PKS系统,且该遗传修饰包含用选自由编码来自第二个PKS系统的至少一个生物学活性结构域的重组核酸分子和编码影响PUFA PKS系统的活性的蛋白质的重组核酸分子组成的组中的重组核酸分子转染该生物体。在该实施方案中,与野生型生物体相比,该遗传修饰优选改变由内源性PKS系统产生的至少一种产物。第二个PKS系统可包括另一PUFA PKS系统(细菌或非细菌),I型PKS系统,II型PKS系统,和/或模块型PKS系统。影响PKS系统的活性的蛋白质的例子已在上文中描述(例如,PPTase)。
在另一实施方案中,该生物体通过用编码多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的重组核酸分子转染来进行遗传修饰。该重组核酸分子在本文前面进行了详细描述。
在另一实施方案中,该生物体内源性表达非细菌PUFA PKS系统,且该遗传修饰包括用来自不同PKS系统的结构域取代编码该非细菌PUFA PKS系统的至少一个结构域的核酸序列。在另一实施方案中,该生物体内源性表达非细菌PUFA PKS系统,且通过用编码调节PUFA PKS系统产生的脂肪酸的链长的蛋白质的重组核酸分子转染该生物体进行了修饰。在一个方面,编码调节脂肪酸链长的蛋白质的重组核酸分子取代编码该非细菌PUFA PKS系统中的链长因子的核酸序列。在另一方面,调节PUFA PKS系统产生的脂肪酸的链长的蛋白质是链长因子。在另一方面,调节PUFA PKS系统产生的脂肪酸的链长的蛋白质是指导C20单位合成的链长因子。
在另一实施方案中,该生物体表达在选自由编码β-羟酰-ACP脱水酶(DH)的结构域和编码β-酮脂酰-ACP合酶(KS)的结构域组成的组中的一个结构域中包含遗传修饰的非细菌PUFA PKS系统,其中与没有该修饰相比,该修饰改变了由PUFA PKS系统产生的长链脂肪酸的比率。在该实施方案的一个方面,该修饰选自由该结构域的全部或部分缺失,用来自不同生物体的同源性结构域取代该结构域,和该结构域的突变组成的组中。
在另一实施方案中,该生物体表达在烯酰-ACP还原酶(ER)结构域中含有修饰的非细菌PUFA PKS系统,其中与没有该修饰相比,该修饰导致产生不同化合物。在该实施方案的一个方面,该修饰选自由该ER结构域的全部或部分缺失,用来自不同生物体的ER结构域取代该ER结构域,和该ER结构域的突变组成的组中。
在产生生物活性分子的方法的一个实施方案中,该生物体产生的多不饱和脂肪酸(PUFA)分布特征不同于没有遗传修饰的天然生物体。
用于产生生物活性分子的许多其它遗传修饰对于本领域的技术人员而言在本说明书的教导下是显而易见的,且各种其它修饰已在本文前面进行了讨论。本发明包含导致产生所需生物活性分子的与本文所述PUFA PKS系统相关的任何遗传修饰。
根据本发明的生物活性分子包括具有生物学活性且可由包含具有本文所述非细菌PUFA PKS系统的至少一个功能域的生物学活性的至少一种氨基酸序列的PKS系统产生的任何分子(化合物,产物,等)。该生物活性分子可包括,但不限于多不饱和脂肪酸(PUFA),抗炎症配制品,化疗剂,有效赋形剂,骨质疏松症药物,抗抑郁剂,抗惊厥剂,抗幽门螺杆菌(Heliobactorpylori)药物,治疗神经变性疾病的药物,治疗变性肝脏疾病的药物,抗生素,和降胆固醇配制品。本发明的非细菌PUFA PKS系统的一个优势是该系统具有诱导顺式构型的碳-碳双键的能力,且该分子在每第三个碳包含一个双键。该能力可用于产生各种化合物。
优选的是,目的生物活性化合物由该遗传修饰的微生物以高于约0.05%,且优选高于约0.1%,且更优选高于约0.25%,且更优选高于约0.5%,且更优选高于约0.75%,且更优选高于约1%,且更优选高于约2.5%,且更优选高于约5%,且更优选高于约10%,且更优选高于约15%,且更优选高于约20%的微生物干重的量产生。对于脂类化合物,优选的是,该化合物以高于约5%的微生物干重的量产生。对于其它生物活性化合物,例如抗生素或以更少量合成的化合物,将在微生物干重中具有该化合物的那些菌株鉴定为预期含有上述类型的新PKS系统。在一些实施方案中,特定的生物活性分子(化合物)由该微生物分泌,而不是累积。因此,该生物活性分子一般从培养基中回收且产生的分子浓度随该微生物和培养规模而变化。
本发明的一个实施方案涉及修饰含有至少一种脂肪酸的终产物的方法,包括向所述终产物中添加一种由重组宿主细胞产生的油类,该重组宿主细胞表达至少一个含有编码PUFA PKS系统的至少一个生物活性结构域的核酸序列的重组核酸分子。该PUFA PKS系统是任一非细菌PUFA PKS系统,且优选选自(a)编码来自Thraustochytrid微生物的多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的核酸序列;(b)编码来自以本文公开的新筛选方法鉴定的微生物的PUFA PKS系统的至少一个结构域的核酸序列;(c)编码选自由SEQ ID NO2,SEQ ID NO4,SEQ ID NO6,和其生物学活性片段组成的组中的氨基酸序列的核酸序列;(d)编码选自SEQ IDNO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ IDNO30,SEQ ID NO32,或其生物学活性片段的氨基酸序列的核酸序列;(e)编码与选自SEQ ID NO2,SEQ ID NO4,或SEQ ID NO6的氨基酸序列的至少500个连续氨基酸有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性;和(f)编码与选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQ ID NO32的氨基酸序列具有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。上文中已经详细描述了这些核酸序列的变化。
优选的是,该终产物选自由食品,饮食添加剂,药物配制品,人源化动物乳汁,和婴儿配制品组成的组中。合适的药物配制品包括,但不限于抗炎症配制品,化疗剂,有效赋形剂,骨质疏松症药物,抗抑郁剂,抗惊厥剂,抗幽门螺杆菌药物,治疗神经变性疾病的药物,治疗变性肝脏疾病的药物,抗生素,和降胆固醇配制品。在一个实施方案中,该终产物用于治疗选自由慢性炎症,急性炎症,胃肠疾病,癌症,恶病质,心脏再狭窄,神经变性疾病,肝脏变性疾病,血脂疾病,骨质疏松症,骨关节炎,自身免疫疾病,先兆子痫,早产,年老相关性黄斑病,肺病,和过氧化物酶体疾病组成的组中的一种症状。
合适的食品包括,但不限于,精细面包商品,面包卷(bread and rolls),早餐谷类食品,加工的和未加工的乳酪,调味品(番茄酱,蛋黄酱,等),乳制品(奶,酸乳酪),布丁和胶质甜点,碳酸饮料,茶,粉末状饮料混合物,加工的鱼产物,水果类饮料,口香糖,硬甜食,冷冻乳制品,加工的肉类产物,坚果和坚果饼(nut-based spreads),意大利面食,加工的家禽产物,肉汁和酱,马铃薯片和其它片状食品或松脆食品,巧克力和其它甜食,汤和汤混合物,大豆类产物(奶,饮料,乳酪,whiteners),以植物油为基础的饼(spreads),和蔬菜类饮料。
本发明的另一实施方案涉及生产人源化的动物乳汁的方法。该方法包括用至少一种含有编码PUFA PKS系统的至少一个生物活性结构域的核酸序列的重组核酸分子遗传修饰产奶动物的产奶细胞的步骤。该PUFA PKS系统是一种非细菌PUFA PKS系统,且优选的是,该PUFA PKS系统的至少一个结构域由选自下组的核酸序列编码(a)编码来自Thraustochytrid微生物的多不饱和脂肪酸(PUFA)聚酮化合物合酶(PKS)系统的至少一个结构域的核酸序列;(b)编码来自以本文前面描述的新筛选方法鉴定的微生物的PUFA PKS系统的至少一个结构域的核酸序列;(c)编码选自由SEQ ID NO2,SEQ IDNO4,SEQ ID NO6,和其生物学活性片段组成的组中的氨基酸序列的核酸序列;(d)编码选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ ID NO22,SEQ ID NO24,SEQ IDNO26,SEQ ID NO28,SEQ ID NO30,SEQ ID NO32,或其生物学活性片段的氨基酸序列的核酸序列;(e)编码与选自SEQ ID NO2,SEQ IDNO4,或SEQ ID NO6的氨基酸序列的至少500个连续氨基酸有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性;和/或(f)编码与选自SEQ ID NO8,SEQ ID NO10,SEQ ID NO13,SEQ ID NO18,SEQ ID NO20,SEQ IDNO22,SEQ ID NO24,SEQ ID NO26,SEQ ID NO28,SEQ ID NO30,或SEQ ID NO32的氨基酸序列具有至少约60%相同性的氨基酸序列的核酸序列;其中该氨基酸序列具有PUFA PKS系统的至少一个结构域的生物学活性。
遗传修饰宿主细胞并产生遗传修饰的非人产奶动物的方法是本领域已知的。可修饰的宿主动物的例子包括牛,绵羊,猪,山羊,牦牛,等,它们易于进行遗传操作和克隆用于迅速扩大表达转基因的群体。对于动物,通过修饰基因调控区可使PKS-样转基因适应于在靶器官,组织和体液中表达。特别所需是在宿主动物乳腺乳汁中生产PUFA。
提供下面的实施例用于说明的目的而不打算用于限制本发明的范围。
实施例实施例1下面的实施例描述了对来自Schizochytrium的PKS相关性序列的进一步分析。
本发明人使用PCT
发明者詹姆斯·G·梅茨, 威廉·R·巴克利, 詹姆斯·H·弗拉特, 杰里·M·库纳, H 弗拉特, M 库纳, R 巴克利, 詹姆斯 G 梅茨 申请人:马泰克生物科学公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1