用于产量增加的方法中的重组体微生物的制作方法_2

文档序号:9457259阅读:来源:国知局
分比类似性"来表示。尽管对于表示"百分比同 一性"或"百分比类似性"会引起争论,但"同一性水平"或"百分比同源性"经常被互换使 用。能够利用数学算法来完成两个序列之间的序列的比较和百分比同一性的确定。本领域 技术人员知晓若干准哦功能不同的计算机程序能够用于比对两个序列并确定两个序列之 间的同源性(Kruskal,J.B. (I983)An overview of sequence comparison In D.Sankoff 和 J. B. Kruskal,(ed.),Time warps, string edits and macromoleucle: the theory and practice of sequence comparison,pp.l_44Addison Wesley) D 能够利用用于比对两个序 列的Needleman和Wunsch算法来确定两个氨基酸序列之间的百分比同一性(Needleman,S. B.和Wunsch,C.D. (1970) J. Mol. Biol. 48, 443-453)。该算法比对氨基酸序列和核苷酸序 列D Needleman-Wunsch算法已在计算机程序NEEDLE上实现出于本发明的目的,使用来 自 EMBOSS 程序包的 NEEDLE 程序(2. 8. O 或更高版本,EMBOSS:The European Molecular Biology Open Software Suite(2000)Rice, P.Longden,I.和 Bleasby,A. Trends in Genetics 16,(6)pp276-277, http://emboss, bioinformatics· nl/)。对于蛋白质序列, EBL0SUM62被用作取代矩阵。对于核苷酸序列,使用EDNAFULL。可以指定其他矩阵。用于 氨基酸序列比对的可选参数为:空位开放罚分为10且空位延伸罚分为〇. 5。本领域技术人 员将理解,当利用不同算法时,所有这些不同参数将产生稍有不同的结果,但两个序列的总 体百分比同一性不会发生显著变化。
[0039] 全局同源性定义
[0040] 同源性或同一性是在包括任何空位或延伸的整个比对区上两个完整序列之间的 相同匹配的百分比。两个比对序列之间的同源性或同一性如下计算:示出了两个序列中相 同氨基酸的比对结果中相应位置的数目除以包括空位的比对结果的总长度。同一性在本文 中被定义为能够由NEEDLE获得并且在该程序的输出结果中被标识为"IDENTITY"。
[0041] 最长同一"性定义
[0042] 两个比对序列之间的同源性或同一性计算如下:示出了两个序列中相同氨基酸的 比对结果中相应位置的数目减去比对结果中空位总数之后除以比对结果的总长度。该同一 性在本文中被定义为能够利用N0BRIEF选项由NEEDLE获得的,并且在该程序的输出结果中 被标识为"最长同一1性"。
[0043] 本文中披露的核苷酸或氨基酸序列的变体也可以被定义为相比于本文中具体披 露的核苷酸或氨基酸序列具有一个或多个取代、插入和/或删除的核苷酸或氨基酸(例如 在序列表中所列出的)。
[0044] 可选地,在确定氨基酸类似性的程度时,本领域技术人员也可以考虑所谓的"保 守"氨基酸取代,因为其对于本领域技术人员而言是明确的。保守氨基酸取代是指具有类似 侧链的残基的可替换性。例如,具有脂肪族侧链的一组氨基酸为甘氨酸、丙氨酸、缬氨酸、亮 氨酸、和异亮氨酸;具有脂肪族-羧基侧链的氨基酸组为丝氨酸和苏氨酸;具有含氨基侧链 的氨基酸组为天门冬酰胺和谷氨酰胺;具有芳香族侧链的氨基酸组为苯丙氨酸、酪氨酸和 色氨酸;具有碱性侧链的氨基酸组为赖氨酸、精氨酸和组氨酸;以及具有含硫侧链的氨基 酸组为半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组为:缬氨酸-亮氨酸-异亮氨酸、苯 丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天门冬酰胺-谷氨酰胺。本文中披露 的氨基酸序列的取代变体是所披露序列中的至少一个残基已被除去而在该位置插入不同 的残基。优选地,该氨基酸改变是保守的。对于每一天然存在氨基酸的优选保守取代如下: Ala 变成 ser ;Arg 变成 Iys ;Asn 变成 gin 或 his ;Asp 变成 glu ;Cys 变成 ser 或 ala ;Gln 变 成 asn ;Glu 变成 asp ;Gly 变成 pro ;His 变成 asn 或 gin ;Ile 变成 Ieu 或 val ;Leu 变成 ile 或 val ;Lys 变成 arg ;gln 或 glu ;Met 变成 Ieu 或 ile ;Phe 变成 met, Ieu 或 tyr ;Ser 变成 thr ;Thr 变成 ser ;Trp 变成 tyr ;Tyr 变成 trp 或 phe ;以及 Val 变成 ile 或 leu。
[0045] 也可以通过其分别在温和或优选在严格杂交条件下与本文中披露的特定核苷酸 序列的部分进行杂交的能力来定义本发明的核苷酸序列。严格杂交条件在本文中被定义为 使至少约25个,优选约50个核苷酸,75个或100个以及最优选约200个或更多个核苷酸的 核酸序列在约65°C的温度下,在包含约IM盐、优选6x SSC的溶液中或具有相当离子强度的 其他任何溶液中进行杂交,并且在65°C下在包含约0.1 M盐或更低,优选0.2x SSC的溶液中 或具有相当离子强度的其他任何溶液中进行洗涤的条件。优选地,该杂交进行过夜,即,至 少持续10小时并且优选洗涤进行持续1小时并且更换至少两次洗涤溶液。这些条件通常 使得能够获得具有约90%或更高序列同一性的序列的特定杂交产物。
[0046] 温和条件在本文中被定义为使得至少50个核苷酸的核酸序列,优选约200或更多 个核苷酸能够在约45°C的温度下,在包含约IM盐、优选6x SSC的溶液中或具有相当离子强 度的其他任何溶液中进行杂交的条件。优选地,该杂交进行过夜,即,至少持续10小时并且 优选洗涤进行持续1小时并且更换至少两次洗涤溶液。这些条件通常使得能够获得具有高 达50%序列同一性的序列的特定杂交产物。本领域技术人员能够改变这些杂交条件,以具 体鉴别同一性在50%至90% .之间变化的序列。
[0047] "表达"是指基因转录称为结构RNA (rRNA、tRNA)或信使RNA (mRNA),其随后被翻译 称为蛋白质。
[0048] 如本文中使用的,"异源的"在指代核酸或蛋白时是指来源于外来物种的核酸或蛋 白,或者当来源于相同的物种时,是指通过审慎的人为干涉使其天然形式的组成和/或基 因组位点被实质上改变的形式。例如,操作性连接至异源结构基因的启动子来源于不同于 该结构基因来源于相同物种的物种,或者,如果来源于相同物种,则其中之一或二者的原始 形式均发生实质性改变。异源蛋白可以来源于外来物种,或者如果来源于相同的物种,则通 过审慎的人为干涉使其原始形式发生实质性改变。
[0049] 术语"异源表达"是指异源核酸在宿主细胞中的表达。异源蛋白在真核宿主细胞 系统例如酵母中的表达是本领域技术人员公知的。包含编码具有特异性活性的基因的核酸 序列的多核苷酸能够在这样的真核系统中被表达。在一些实施方式中,转化的/翻译的酵 母细胞可以被用于酶表达的表达系统。异源蛋白在酵母中的表达是公知的。Sherman,F., 等人,Methods in Yeast Genetics, Cold Spring Harbor Laboratory(1982)公认作出了 描述可用于在酵母中表达蛋白的多种方法的工作。两种广泛使用的酵母是酿酒酵母和巴斯 德毕赤酵母。在酿酒酵母和巴斯德毕赤酵母中用于表达的载体、菌株和实验方案是本领域 公知的并且可获自供应商(例如,Invitrogen)。适合的载体通常具有表达控制序列,例如, 如所需要的启动子,包括3-磷酸甘油酸激酶或醇氧化酶,以及复制起点、序列终点等等。
[0050] 如本文中所使用的,"启动子"是涉及(结构)基因转录的DNA序列。通常,启动子 位于基因的5'-区中,邻近于(结构)基因的转录起始位点。启动子序列可以是组成性的、 可诱导的或可抑制的。如果启动子为可诱导启动子,则转录的速率响应于诱导剂而增加。
[0051] 如本文中所使用的,术语"载体"包括指代常染色体表达载体和用于整合到染色体 组中的整合载体。
[0052] 术语"表达载体"是指包含编码感兴趣多肽的片段的线性或环状DNA分子,在另外 的核酸片段的控制(例如操作性连接至另外的核酸片段)下实现其转录。这样的另外的片 段可以包括启动子和终止子序列,并且可以可选地包括一个或多个复制起点、一个或多个 可选择的标志物、增强子、多腺苷酸化信号等。表达载体通常来自质粒或病毒DNA,或可以含 有二者的元素。尤其是,表达载体包含如下处于5'至3'方向并且可操作地连接的核酸序 列:(a)酵母识别的转录和翻译起始区,(b)感兴趣多肽的编码序列,和(c)酵母识别的转录 和翻译起始区。"质粒"是指自主地复制染色体外DNA,其不被整合到微生物的基因组中并 且通常在性质上是环状的。
[0053] "整合载体"是指能够结合到微生物的基因组中并且提供编码感兴趣多肽的基因 的稳定遗传的线形或圆形DNA分子。该整合载体通常包含一个或多个片段,该片段包含编 码感兴趣多肽的基因序列,在另外的核酸片段控制下(即,可操作性连接于)提供其转录。 这样的另外片段可以包括启动子和终止子序列,以及通常通过同源重组过程驱动感兴趣的 基因结合到靶细胞基因组中的一个或多个片段。通常,该整合载体是能够转移到靶细胞中 的载体,但其具有在生物体中是非功能性的复制子。如果该片段中包括适当的标志物,则可 以选择包含感兴趣基因的片段的整合。
[0054] "宿主细胞"意指含有载体或支持该载体复制和/或表达的细胞。宿主细胞可以是 原核细胞例如大肠杆菌,或真核细胞例如酵母、昆虫、两栖动物、或哺乳动物细胞。优选地, 宿主细胞为放线菌目(Actinomycetales)的真核细胞。
[0055] 如在本文中使用的,"转化"是指外源多核苷酸插入到宿主细胞中,而与用于插入 的方法无关,例如直接摄取、转导、f-mating或电穿孔。该外源多核苷酸可以作为未整合的 载体(例如质粒)得以保持,或可替代地可以被整合到宿主细胞基因组中。
[0056] 该微生物优选选自酵母科(Saccharomyceraceae),例如酿酒酵母、巴斯德 酉孝母(Saccharomyces pastorianus)、布拉迪酉孝母(Saccharomyces beticus)、发酉孝 酉孝母(Saccharomyces fermentati)、奇异酉孝母(Saccharomyces paradoxus)、葡萄 汁酵母(Saccharomyces uvarum)和贝酵母(Saccharomyces bayanus);裂殖酵母 属(Schizosaccharomyces)例如粟酒裂殖酵母(Schizosaccharomyces pombe)、日本 裂殖酵母(Schizosaccharomyces japonicus)、八抱裂殖酵母(Schizosaccharomyces octosporus)和嗜冷裂殖酵母(Schizosaccharomyces cryophilus);有抱圆酵母属 (Torulaspora),例如德布尔有孢酵母(Torulaspora delbrueckii);克鲁维酵母属 (Kluyveromyces),例如马克斯克鲁维酵母(Kluyveromyces marxianus);毕赤酵母属 (Pichia),例如树干毕赤酵母(Pichia stipitis)、巴斯德毕赤酵母(Pichia pastoris) 或安格斯毕赤酵母(pichia angusta);接合酵母属(Zygosaccharomyces)例如拜耳接合 酵母(Zygosaccharomyces bailii);酒香酵母属(Brettanomyces),例如间型酒香酵母 (Brettanomyces intermedius)、布鲁塞尔酒香酵母(Brettanomyces bruxellensis)、异 型酒香酵母(Brettanomyces anomalus)、班图酒香酵母(Brettanomyces custersianus)、 纳氏酒香酵母(Brettanomyces naardenensis)、Brettanomyces nanus、布鲁塞尔德 克酵母(Dekkera bruxellensis)和异型德克酵母(Dekkera anomala);梅奇酵母属 (Metschnikowia),伊萨酵母属(Issatchenkia),例如东方伊萨酵母(Issatchenkia orientalis)、克勒克酵母(Kloeckera),例如梓檬形克勒克酵母(Kloeckera apiculata); 海洋酵母属(Aureobasidium),例如出芽短梗霉(Aureobasidium pullulans)。
[0057] 在高度优选的实施方式中,该微生物为选自酵母科的酵母细胞。尤其是,用酿酒酵 母细胞已经获得了良好的结果。一经发现,在用于制备醇(乙醇)的方法中能够利用这样 的根据本发明的细胞,其中相比于不具有Rubisco和PRK的相似细胞,NADH-依赖性副产物 形成(甘油)减少了约90%,并且其中期望产物(乙醇)的产量增加了 10%。
[0058] Rubisco原则上可选自真核和原核Rubisco。
[0059] Rubisco优选来自非光养生物。尤其是,Rubisco可来自化能自养微生物。
[0060] 用细菌Rubisco已经获得了良好的结果。优选地,细菌Rubisco来源于硫杆菌属 (Thiobacillus),尤其是脱氮硫杆菌(Thiobacillus denitrificans),其是化能自养的。
[0061] Rubisco可以是单一亚单位Rubisco或具有多于一个亚单位的Rubisco。尤其是, 用单一亚单位Rubisco已经获得了良好结果。
[0062] 尤其是,用II型Rubisco,更加尤其是CbbM已经获得了良好结果。
[0063] SEQUENCE ID NO: 2示出了尤其根据本发明的优选的Rubisco的序列。其由来自脱 氮硫杆菌的cbbM基因编码。这种Rubisco的一种优选的替代物是该Rubisco的功能性同 源物,尤其是这样的功能性同源物包含与SEQUENCE ID N0:2具有至少80%,85%,90%或 95%序列同一"性的序列。表1中给出了适合的天然Rubisco多肽。
[0064] 表1 :Rubisco 多肽
[0066] 根据本发明,Rubisco在微生物中被功能性表达,至少在感兴趣化合物的总也制备 过程中。
[0067] 为了增加本文中在转化的(重组体)宿主细胞中酶活性以足够的水平被表达并且 处于活性形式的可能性,编码这些酶、以及Rubisco酶和本发明的其他酶(见下文)的核苷 酸序列优选被用于最优化所讨论的宿主细胞的密码子使用。编码酶为宿主细胞的密码子使 用的核苷酸序列的适应性可被表示为密码子适应指数(CAI)。该密码子适应指数在本文中 被定义为在特定宿主细胞或生物体中,基因的密码子使用朝向高度表达的基因的密码子使 用的相对适应性的量度。每个密码子的相对适应性(w)是每个密码子的使用与相同氨基酸 的最丰富密码子的比值。CAI指数被定义为这些相对适应性值的几何平均数。非同义密码 子和终止密码子(依赖于基因编码)被排除。CAI值的范围为0至1,该值越高表示最丰富 密码子的比例越高(参见 Sharp 和 Li,1987, Nucleic Acids Research 15:1281-1295;还 参见:Jansen等人,2003, Nucleic Acids Res. 31 (8) :2242-51)。适用的核苷酸优选具有至 少0. 2, 0. 3, 0. 4, 0. 5, 0. 6, 0. 7, 0. 8或0. 9的CAI。最优选已经针对在所讨论的真菌宿主细 胞(例如酿酒酵母细胞)中的表达密码子最优化的序列。
[0068] 优选地,功能性表达的Rubisco具有至少lnmol. min、(mg蛋白)1的活性,该由细 胞提取物结合1,5-二磷酸核酮糖-依赖性14C-碳酸氢盐的速率来定义,尤其是活性为至少 Snmol.min1. (mg蛋白)\更加尤其是活性为至少4nmol.min-l. (mg蛋白)1C3活性的上限不 是关键的。在实践中,该活性可以为约SOOnmol.min1. (mg蛋白)1或更低,尤其是25nmol. min1· (mg蛋白)\更加尤其是Ιδηηιο?.η?η1
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1