适合含油酵母内的基因表达的甘油醛-3-磷酸脱氢酶和磷酸甘油酸变位酶启动子的制作方法

文档序号:426498阅读:1476来源:国知局
专利名称:适合含油酵母内的基因表达的甘油醛-3-磷酸脱氢酶和磷酸甘油酸变位酶启动子的制作方法
技术领域
本发明属于生物技术领域。更具体而言,本发明涉及从解脂耶氏酵母(Yarrowia lipolytica)中分离获得的有助于含油酵母内的基因表达的启动子区。
背景技术
含油酵母的定义是能够自然合成和累积油的生物,其中油累积范围是占细胞干重的至少大约25%直到大约80%。被鉴定为含油酵母的属典型地包括,但不限于耶氏酵母属、假丝酵母属、红酵母属、红冬孢属、隐球酵母属、丝孢酵母属和油脂酵母属耶氏酵母、假丝酵母、红酵母、红冬孢、隐球酵母、丝孢酵母和油脂酵母。更具体而言,例证性的油合成酵母包括类酵母红冬孢、斯达氏油脂酵母、产油油脂酵母、Candida revkaufi、铁红假丝酵母、热带假丝酵母、产朊假丝酵母、Trichosporon pullans、皮状丝孢酵母、胶粘红酵母、R.graminis和解脂耶氏酵母(曾被分类为解脂假丝酵母)。
培养高含油量的含油酵母的技术已充分完善(例如参见EP 0 005277B1;Ratledge,C.,Prog.Ind.Microbiol.16119-206(1982))。且上述生物在过去便已被应用于多种工业用途。例如,有多种解脂耶氏酵母菌株曾被用于生产和制备异柠檬酸裂合酶(DD259637);脂酶(SU1454852、WO2001083773、DD279267);多羟基链烷酸(WO2001088144);柠檬酸(RU2096461、RU2090611、DD285372、DD285370、DD275480、DD227448、PL160027);赤藓糖醇(EP770683);2-氧化戊二酸(DD2667999);γ-十内酯(U.S.6,451,565、FR2734843);γ-十二内酯(EP578388)和丙酮酸(JP09252790)。但最近,业已通过遗传工程方面的进展提高了含油酵母的自然能力,获得了能够生成多不饱和脂肪酸(“PUFAs”)的生物。具体而言,Picataggio等人已证实,可通过导入和表达ω-3/ω-6生物合成途径的编码基因改造解脂耶氏酵母,用于生成ω-3和ω-6脂肪酸(共同待决的美国专利申请10/840579)。
所有异源蛋白的重组生成通常均是通过构建特定表达组件而得以实现的,该表达组件中的目标蛋白编码DNA受到了与宿主细胞相适的启动子的控制。接着将该表达组件导入宿主细胞(通常通过质粒介导的转化或定向整合进入宿主基因组),并通过在该表达组件所含启动子可正常发挥功能所必需的条件下培养转化宿主细胞,便可实现异源蛋白的生成。因此,对用于重组生成蛋白的新宿主细胞(例如含油酵母)的研发通常要求适合控制宿主细胞内的目标蛋白表达的启动子具有有效性。
业已从酿酒酵母中分离出多种有助于酵母内的异源基因表达的强启动子。例如,Bitter,G.A.和K.M.Egan描述的甘油醛-3-磷酸脱氢酶(GPD)启动子(Gene 32(3)263-274(1984));和Rodicio,R.等人所研究的磷酸甘油酸变位酶(GPM1)启动子(Gene 125(2)125-133(1993))。从解脂耶氏酵母中还分离出了若干种适合重组表达蛋白的启动子。例如,U.S.4,937,189和EP220864(Davidow等人)公开的用于异源蛋白表达的XPR2基因序列(编码可诱导碱性胞外蛋白酶)和上游启动子区。但该启动子仅在缺乏优选碳和氮源且pH高于6.0的培养基上具有活性;且完全诱导需要培养基中存在高水平的蛋白胨。Blanchin-Roland,S.等人对该XPR2启动子序列的后续分析(EP832258;Mol.Cell Biol.14(1)327-338(1994))确定仅含部分XPR2启动子序列的杂合启动子可被用于获得在耶氏酵母内的高水平表达,而没有因利用该完整启动子序列所造成的局限性。
U.S.6,265,185(Muller等人)描述了解脂耶氏酵母来源的用于翻译延伸因子EF1-α(TEF)蛋白和核糖体蛋白S7的酵母启动子,适合在酵母内的表达克隆和蛋白的异源表达。当在生长平板上检测酵母启动子活性(实施例9,U.S.6,265,185)并以上述启动子和XPR2启动子在4-11pH范围内的活性为基础时,发现上述启动子与XPR2启动子相比被改良了。
不过,即使可以利用上述已知启动子,还仍然需要新的改良酵母启动子,用于酵母(含油和非含油的)的代谢改造和控制异源基因在酵母内的表达。此外,具有一套在酵母内多种自然生长和诱导条件下可调的启动子将在工业方面具有重要作用,其中需要在所述宿主内以工业量表达异源多肽,以经济地生产那些多肽。因此,本发明的一个目标是提供这种有助于在多种酵母培养物中的基因表达的启动子,优选耶氏酵母种培养物及其它含油酵母。
申请人通过鉴定解脂耶氏酵母来源的甘油醛-3-磷酸脱氢酶(GPD)和磷酸甘油酸变位酶(GPM)编码基因和负责驱动这两种天然基因表达的启动子,解决了上述难题。这两种启动子有助于异源基因在耶氏酵母内的表达,且活性比TEF启动子提高了。
发明概述本发明提供了利用甘油醛-3-磷酸脱氢酶(gpd)或磷酸甘油酸变位酶(gpm)基因在转化的酵母细胞内表达目标编码区的方法。本发明相应提供了在转化的酵母细胞内表达目标编码区的方法,包括a)提供具有嵌合基因的转化的酵母细胞,该嵌合基因含有(i)选自gpm基因和gpd基因的耶氏酵母基因的启动子区;和(ii)可在该酵母细胞内表达的目标编码区;其中所述启动子区与目标编码区可操作连接;并b)在表达步骤(a)所述的嵌合基因的条件下培养步骤(a)所述的转化的酵母细胞。
在一种优选实施方案中,本发明提供了生成ω-3或ω-6脂肪酸的方法,包括a)提供具有嵌合基因的转化的含油酵母,该嵌合基因含有(i)选自gpm基因和gpd基因的耶氏酵母基因的启动子区;和(ii)编码ω-3/ω-6脂肪酸生物合成途径中的至少一种酶的编码区;其中所述启动子区和编码区可操作连接;并b)在表达ω-3/ω-6脂肪生物合成途径的至少一种酶并生成ω-3或ω-6脂肪酸的条件下培养步骤(a)所述的转化的含油酵母;并c)任选地回收ω-3或ω-6脂肪酸。
本发明还提供了含有选自SEQ ID NO23、SEQ ID NO24和SEQID NO43的gpd启动子的分离核酸分子。
本发明同样还提供了含有选自SEQ ID NO27、SEQ ID NO28和SEQ ID NO44的gpm启动子的分离核酸分子。
附图简述和序列说明

图1A和1B所示为酿酒酵母(GenBank编号CAA24607)、粟酒裂殖酵母(GenBank编号NP_595236)、米曲霉(GenBank编号AAK08065)、牙鲆(GenBank编号BAA88638)、非洲爪蟾(GenBank编号P51469)和原鸡(GenBank编号DECHG3)来源的已知甘油醛-3-磷酸脱氢酶(GPD)蛋白的序列对比,被用于鉴定该序列对比范围内的两个保守区。
图2所示为编码解脂耶氏酵母、粟酒裂殖酵母、原鸡和非洲爪蟾来源GPD蛋白的若干部分的氨基酸序列的对比。
图3所示为解脂耶氏酵母和酿酒酵母来源的磷酸甘油酸变位酶(GPM)蛋白的序列对比。
图4图解了与解脂耶氏酵母内的甘油醛-3-磷酸脱氢酶(GPD)均相关的SEQ ID NOs11、12、23-26和43之间的关系。
图5图解了与解脂耶氏酵母内的磷酸甘油酸变位酶(GPM)均相关的SEQ ID NOs14-16、27、28和44之间的关系。
图6所示为质粒载体pY5-4的构建。
图7A、7B、7C和7D分别提供了pY5-10、pY5-30、pYZGDG和pYZGMG的质粒图谱。
图8A所示为细胞培养物的图象,比较了通过组织化学染色测定的TEF和GPD在解脂耶氏酵母内的启动子活性。图8B为细胞培养物的图象,比较了通过组织化学染色测定的TEF和GPM在解脂耶氏酵母内的启动子活性。
图9A为比较了荧光法所测TEF和GPD的启动子活性的坐标图。图9B为比较了荧光法所测TEF和GPM的启动子活性的坐标图。
图10所示为ω-3/ω-6脂肪酸生物合成途径。
通过下文详述和构成本发明一部分的附带序列说明,可以更充分地理解本发明。
下列序列遵循37C.F.R.§1.821-1.825(“对含有核苷酸序列和/或氨基酸序列公开内容的专利申请的要求---序列规则”),并符合世界知识产权组织(WIPO)标准ST.25(1998)以及EPO和PCT的序列表要求(管理细则的规则5.2和49.5(a-bis),以及第208节和附录C)。应用于核苷酸和氨基酸序列信息的符号和格式遵循37C.F.R.§1.822所述规则。
SEQ ID NOs1-6分别对应于酿酒酵母(GenBank编号CAA24607)、粟酒裂殖酵母(GenBank编号NP_595236)、米曲霉(GenBank编号AAK08065)、牙鲆(GenBank编号BAA88638)、非洲爪蟾(GenBank编号P51469)和原鸡(GenBank编号DECHG3)的GPD氨基酸序列。
SEQ ID NOs7和8对应于GPD蛋白的保守氨基酸区。
SEQ ID NOs9和10分别对应于简并引物YL193和YL194,被用于分离解脂耶氏酵母GPD基因的内部片段。
SEQ ID NO11编码解脂耶氏酵母GPD基因内长为507bp的内部片段,SEQ ID NO12为其对应氨基酸序列。
SEQ ID NO13对应于酿酒酵母GPM蛋白(GenBank编号NP_012770)。
SEQ ID NO14对应于重叠群2217,包括解脂耶氏酵母GPM蛋白的完整核苷酸编码序列。
SEQ ID NO15对应于解脂耶氏酵母GPM编码区的推导核苷酸序列,SEQ ID NO16则对应于其氨基酸序列。
SEQ ID NOs17-22分别对应于引物YL206、YL196、YL207、YL197、YL208和YL198,被用于基因组步查。
SEQ ID NO23对应于被命名为“GPDP”的长为1848bp的片段,包括解脂耶氏酵母内GPD基因上游长为1525bp的片段和代表GPD基因5’部分的长为323bp的片段。
SEQ ID NO24对应于装配的长为2316bp的DNA重叠群,相当于GPD基因内-1525到+791号位的区域,其中‘ATG’翻译起始密码子的‘A’位被指定为+1号位。
SEQ ID NO25对应于编码解脂耶氏酵母GPD基因的部分cDNA序列,SEQ ID NO26则对应于其氨基酸序列。
SEQ ID NO27对应于被命名为“GPML”的长为953bp的片段,相当于GPM基因内-875到+78号位的区域,其中‘ATG’翻译起始密码子的‘A’位被指定为+1号位。
SEQ ID NO28对应于装配的长为1537bp的DNA重叠群,相当于GPM基因内-875到+662号位的区域,其中‘ATG’翻译起始密码子的‘A’位被指定为+1号位。
SEQ ID NOs29和30分别对应于引物YL33和YL34,被用于扩增报道基因GUS。
SEQ ID NOs31和32分别对应于引物TEF5’和TEF3’,被用于分离TEF启动子。
SEQ ID NOs33和34分别对应于引物XPR5’和XPR3’,被用于分离XPR2转录终止子。
SEQ ID NOs35-42分别对应于引物YL1、YL2、YL3、YL4、YL23、YL24、YL9和YL10,被用于pY5-10质粒构建期间进行的定点诱变。
SEQ ID NO43对应于被命名为“GPDPro”的长为971bp的片段,本文将其视为解脂耶氏酵母内的推定GPD启动子。该片段对应于GPD基因内-968到+3号位的区域,其中‘ATG’翻译起始密码子的‘A’位被指定为+1号位。
SEQ ID NO44对应于被命名为“GPMLPro”的长为878bp的片段,本文将其视为解脂耶氏酵母内的推定GPM启动子。该片段对应于GPM基因内-875到+3号位的区域,其中‘ATG’翻译起始密码子的‘A’位被指定为+1号位。
SEQ ID NOs45和46分别对应于引物YL211和YL212,被用于扩增上述推定GPD启动子。
SEQ ID NOs47和48分别对应于引物YL203和YL204,被用于扩增上述推定GPM启动子。
SEQ ID NOs49-54分别对应于引物YL5、YL6、YL7、YL8、YL61和YL62,被用于构建质粒pY5-13。
SEQ ID NOs55和56分别对应于引物GPD有义和GPD反义,被用于扩增GPDPro。
SEQ ID NO57对应于串珠镰孢菌株M-8114 Δ15去饱和酶编码区的核苷酸序列,SEQ ID NO58则对应于其氨基酸序列。
SEQ ID NOs59和60分别对应于引物P192和P193,被用于扩增串珠镰孢Δ15去饱和酶。
发明详述申请人根据本发明描述了含油酵母解脂耶氏酵母来源的启动子和基因的分离和特征。这些启动子区,即甘油醛-3-磷酸脱氢酶(GPD)和磷酸甘油酸变位酶(GPM)基因的分离上游区域有助于在解脂耶氏酵母及其它用于生成异源多肽的酵母内所进行的遗传改造。
本发明的优选异源多肽是参与微生物油,尤其是多不饱和脂肪酸(PUFAs)的合成的那些多肽。通过本文所述方法制备的PUFAs或其衍生物可具有多种应用。例如,PUFAs可作为膳食替代品或补充剂,尤其是婴儿配方的补充剂,被应用于接受静脉摄食的患者,或被用于预防或治疗营养失调。可选地,纯化PUFAs(或其衍生物)可被掺入烹调用油、脂肪或人造黄油配方中,使受者可通过正常渠道接受膳食补充所需量的PUFAs。PUFAs还可被掺入婴儿配方、营养补充剂或其它食品中,可发现其作为抗炎症剂或降胆固醇剂的用途。任选地,所述组合物可被用作药物(人用或兽用)。在该情况中,PUFAs通常被口服,但也可通过任意的可使其被成功吸收的途径施用,例如肠胃外(例如皮下、肌内或静脉内)、直肠、阴道或体表(例如作为皮肤用软膏或洗液)。
因此,本发明通过提供使目标编码区在转化酵母内表达的方法发展了该领域,所述方法包括a)提供具有特定嵌合基因的转化的酵母细胞,该嵌合基因含有(i)gpd基因或gpm基因的启动子区;和(ii)可在所述宿主细胞内表达的目标编码区,其中所述启动子区与目标编码区可操作连接;和b)在可发酵碳源存在条件下培养步骤(a)的转化的酵母细胞,其中表达了所述嵌合基因,并任选地将其从培养基中分离出来。在优选实施方案中,所述启动子区包括选自SEQ IDNOs23、24、27、28、43和44的序列。
定义在本发明公开内容中,应用了大量术语和缩写词。相关定义如下所述。
“甘油醛-3-磷酸脱氢酶”缩写为GPD。
“磷酸甘油酸变位酶”缩写为GPM。
“可读框”缩写为ORF。
“聚合酶链反应”缩写为PCR。
“多不饱和脂肪酸”缩写为PUFA(s)。
术语“含油的”指那些倾向于储备脂质形式的能量源的生物(Weete,InFungal Lipid Biochemistry,2nded.,Plenum,1980)。这些微生物的细胞PUFA含量通常符合S形曲线,其中脂质浓度升高至对数期晚期或生长稳定期早期达到最大,并在稳定期晚期和死亡期期间逐渐降低(Yongmanitchai and Ward,Appl.Environ.Microbiol.57419-25(1991))。
术语“含油酵母”指那些被归类为酵母并可累积占其干细胞重量至少25%的油的微生物。含油酵母的实例包括(但不限于)下列属耶氏酵母属、假丝酵母属、红酵母属、红冬孢属、隐球酵母属、丝孢酵母属和油脂酵母属。
术语“可发酵碳源”指可被微生物代谢并使其获得能量的碳源。适用于本发明的典型碳源包括,但不限于单糖、寡糖、多糖、链烷、脂肪酸、脂肪酸的酯、甘油单酯、甘油二酯、甘油三酯、二氧化碳、甲醇、甲醛、甲酸和含碳的胺。
术语“GPD”指甘油醛-3-磷酸脱氢酶(E.C.1.2.1.12),该酶由gpd基因编码并可在糖酵解期间将D-甘油醛-3-磷酸转化为3-磷-D-甘油酰磷酸。分离自解脂耶氏酵母的代表性gpd基因的部分编码区如SEQ IDNOs25和26所示;具体而言,其序列缺少编码该基因C-末端的约115个氨基酸(基于与其它已知gpd序列的对比)。
术语“GPD启动子”或“GPD启动子区”指在GPD的‘ATG’翻译起始密码子之前的5’上游未翻译区,是实现表达所必须的区域。合适GPD启动子区的实例如SEQ ID NOs23和43所示,但不仅限于此。
术语“GPM”指磷酸甘油酸变位酶(EC 5.4.2.1),该酶由gpm基因编码,并在糖酵解期间负责3-磷酸甘油酸与2-磷酸甘油酸的相互转换。酿酒酵母来源的代表性gpm基因是GenBank编号NP_012770(SEQID NO13);分离自解脂耶氏酵母的gpm基因如SEQ ID NO15所示。
术语“GPM启动子”或“GPM启动子区”指在GPM的‘ATG’翻译起始密码子之前的5’上游未翻译区,是实现表达所必须的区域。合适GPM启动子区的实例如SEQ ID NOs27和44所示,但不仅限于此。
术语“启动子活性”指对启动子转录效率的评估。该活性可通过,例如测定由该启动子转录的mRNA量而得以直接确定(例如通过RNA印迹法或引物延伸法),或者通过测定由该启动子表达的基因产物量而得以间接确定。
本文所用“分离核酸分子”指单或双链形式并任选地含有合成、非天然或改变的核苷酸碱基的RNA或DNA聚合体。DNA聚合体形式的分离核酸分子可包括cDNA、基因组DNA或合成DNA的一个或多个片段。
当单链形式的核酸分子可在合适的温度和溶液离子强度条件下退火至另一个核酸分子时,该核酸分子与所述另一个核酸分子,诸如cDNA、基因组DNA或RNA分子是“可杂交的”。杂交和洗涤条件众所周知,实例参见由Cold Spring Harbor LaboratoryCold SpringHarbor,NY(1989)出版Sambrook,J.,Fritsch,E.F.和Maniatis,T.编辑的第二版Molecular CloningA Laboratory Manual,尤其是其中的第11章和表11.1(完整引入本文作为参考)。温度和离子强度的条件决定了杂交的“严格性”。可调节严格条件,以筛选中度相似片段(诸如远缘相关生物来源的同源序列),乃至高度相似片段(诸如可复制近缘相关生物来源的功能酶的基因)。杂交后的洗涤决定了严格条件。一组优选条件采用了系列洗涤步骤,首先于室温用6X SSC、0.5%SDS洗涤15分钟,接着于45℃用2X SSC、0.5%SDS重复洗涤30分钟,再于50℃用0.2X SSC、0.5%SDS洗涤30分钟并重复2次。更优选的一组严格条件采用了较高温度,其中的洗涤步骤除了最后两次用0.2XSSC、0.5%SDS洗涤30分钟的温度提高至60℃外,其它条件与上述一致。另一组优选的高度严格条件所采用的最后两次洗涤是于65℃在0.1X SSC、0.1%SDS中进行。另一组严格条件包括例如,于65℃在0.1XSSC、0.1%SDS中进行杂交,和相继用2X SSC、0.1%SDS和0.1X SSC、0.1%SDS洗涤。
杂交要求两个核酸含有互补序列,但根据杂交的严格性,碱基之间仍然可能出现错配。使核酸杂交所需的合适严格性取决于杂交核酸的长度和互补程度,这些变量是本领域所熟知的。两个核苷酸序列之间的相似性或同源性程度越高,含有这些序列的核酸杂合体的Tm值越高。核酸杂交的相对稳定性(对应于较高Tm)按照下列次序降低RNARNA、DNARNA、DNADNA。业已推导出计算长度大于100个核苷酸的杂合体的Tm的方程式(参见Sambrook et al.,同上,9.50-9.51)。错配位置对较短核酸,即寡核苷酸的杂交而言更为重要,且该寡核苷酸的长度决定了其特异性(参见Sambrook et al.,同上,11.7-11.8)。在一种实施方案中,可杂交核酸的长度至少为大约10个核苷酸。可杂交核酸的优选最小长度是至少大约15个核苷酸;更优选的是至少大约20个核苷酸;最优选长度是至少大约30个核苷酸。此外,技术人员应认识到的是,可根据诸如探针长度等因素的需要调节温度和洗涤液的盐浓度。
氨基酸或核苷酸序列的“重要部分”指包括了多肽的特定氨基酸序列或基因的特定核苷酸序列的部分,通过本领域技术人员对这些特定序列的人工评估,或者通过利用诸如BLAST的算法进行的计算机自动序列对比和鉴定,便足以根据这些特定序列推断上述多肽或基因的同一性(Basic Local Alignment Search Tool;Altschul,S.F.,et al.,J.Mol.Biol.215403-410(1993))。通常,为了推定多肽或核酸序列与已知蛋白或基因的同源性,序列必须包括10个或以上的相邻氨基酸或30个或以上的核苷酸。此外,就核苷酸序列而言,包括20-30个相邻核苷酸的基因特异性寡核苷酸探针可被应用在基因鉴定(例如DNA杂交)和分离(例如细菌菌落或噬斑的原位杂交)的序列依赖性方法中。还可将具有12-15个碱基的短寡核苷酸作为扩增引物应用于PCR,以获得包括该引物的特定核酸分子。相应地,核苷酸序列的“重要部分”包括特定序列,根据该特定序列便足以特异性地鉴定和/或分离包括该序列的核酸分子。
本说明书描述了编码一种或多种特定微生物蛋白和启动子的部分或完整氨基酸和核苷酸序列。了解本文所报道序列优势的技术人员可将全部公开序列或其重要部分应用在本领域技术人员已知的许多方面。本发明相应包括附带序列表所提供的完整序列,以及上述序列的重要部分。
术语“寡核苷酸”指通常具有至少18个核苷酸并可与基因组DNA分子、cDNA分子或mRNA分子杂交的核酸。在一种实施方案中,可将标记寡核苷酸作为“探针”用于检测本发明所述核酸的存在。因此,术语“探针”指可与互补单链靶核酸碱基配对形成双链分子的单链核酸分子。术语“标记”指所有易于与mRNA或DNA连接并产生一定强度的可检测信号的常规分子,其中所述强度可说明被标记探针与所述DNA片段的杂交量。
术语“互补”被用于描述能够彼此杂交的核苷酸碱基之间的关系。例如,就DNA而言,腺苷与胸腺嘧啶互补,胞嘧啶与鸟嘌呤互补。本发明还相应包括与附带序列表所报道的完整序列互补的分离核酸分子,以及那些基本相似的核酸序列。
正如本领域所知,术语“同一性百分率”指两个或以上的多肽序列或两个或以上的多核苷酸序列之间的关系,是通过对这些序列进行比较而得以确定的。在本领域中,“同一性”还指多肽或多核苷酸序列之间的序列相关性程度,在该情况中,可根据这些序列的若干部分之间的匹配情况得以确定。通过已知方法,包括但不限于1.)Computational Molecular Biology(Lesk,A.M.,Ed.)Oxford UniversityNY(1988);2.)BiocomputingInformatics and Genome Projects(Smith,D.W.,Ed.)AcademicNY(1993);3.)Computer Analysis of SequenceData,Part I(Griffin,A.M.,and Griffin,H.G.,Eds.)HumanaNJ(1994);4.)Sequence Analysis in Molecular Biology(von Heinje,G.,Ed.)Academic(1987);以及5.)Sequence Analysis Primer(Gribskov,M.andDevereux,J.,Eds.)StocktonNY(1991)中所描述的那些方法,可快速计算“同一性”和“相似性”。确定同一性的优选方法被设计用于提供受检序列之间的最佳匹配。确定同一性和相似性的方法被编成了公用计算机程序。序列对比和同一性百分率计算可利用LASERGENE生物信息处理系统(DNASTAR Inc.,Madison,WI)的Megalign程序进行。序列多重对比是利用Clustal对比法(Higgins and Sharp,CABIOS.5151-153(1989))并采用默认参数(GAP PENALTY=10,GAP LENGTHPENALTY=10)进行。利用Clustal法进行两两对比的默认参数是KTYPLE 1、GAP PENALTY=3、WINDOW=5和DIAGONALSSAVED=5。
合适的核酸分子(本发明所述分离多核苷酸)编码与本文所报道氨基酸序列具有至少大约70%同一性,优选至少大约75%同一性,更优选至少大约80%同一性的多肽。优选的核酸分子编码与本文所报道氨基酸序列具有大约85%同一性的氨基酸序列。更优选的核酸分子编码与本文所报道氨基酸序列具有至少大约90%同一性的氨基酸序列。最优选的核酸片段则编码与本文所报道氨基酸序列具有至少大约95%同一性的氨基酸序列。合适的核酸片段不仅具有上述同源性,还典型地编码具有至少50个氨基酸的多肽,该多肽优选地具有至少100个氨基酸,更优选地具有至少150个氨基酸,还要更优选地具有至少200个氨基酸,最优选地具有至少250个氨基酸。
同样,合适的启动子区(本发明所述分离多核苷酸)编码与本文所报道核苷酸序列具有至少大约70%同一性,优选至少大约75%同一性,更优选至少大约80%同一性的启动子区。优选的核酸分子与本文所报道核苷酸序列具有大约85%同一性。更优选的核酸分子与本文所报道核苷酸序列具有至少大约90%同一性,最优选的核酸分子则与本文所报道核苷酸序列具有至少大约95%同一性。合适的启动子区不仅具有上述同源性,还典型地具有至少50个核苷酸的长度,更优选地具有至少100个核苷酸的长度,更优选地具有至少250个核苷酸的长度和更优选地具有至少500个核苷酸的长度。
“密码子简并”指遗传密码允许核苷酸序列变异而不影响被编码多肽的氨基酸序列的特性。本发明相应涉及编码特定氨基酸序列的全部或其重要部分的所有核酸分子,其中所述特定氨基酸序列编码本发明所述微生物多肽,如SEQ ID NOs16和26所示。技术人员熟知特定宿主细胞在选择核苷酸密码子方面所表现的“密码子偏倚性”,用于确定特定氨基酸。因此,当合成一种基因,使其提高在宿主细胞内的表达时,理想的方法是对该基因进行设计,使其密码子选择频率接近该宿主细胞的优选密码子选择频率。
与DNA序列相关的“化学合成的”指在体外装配组分核苷酸。DNA的人工化学合成可通过已完善的方法实现;或者可以利用许多可通过商业渠道获得的仪器进行自动化学合成。“合成基因”可从本领域技术人员利用已知方法化学合成的寡核苷酸构件装配而得。将这些构件连接并使它们退火形成可继续通过酶促方法被装配并构建成完整基因的基因片段。可以在优化核苷酸序列以反映宿主细胞密码子偏倚性的基础上,对所述基因进行相应调整,使其实现最佳的基因表达。技术人员知道当密码子选择偏向宿主所偏爱的那些密码子时基因表达成功的可能性。可根据对来源于特定宿主细胞且序列信息已知的基因所做的研究确定优选密码子。
“基因”指可表达特定蛋白的核酸分子,包括在编码序列之前(5’非编码序列)和之后(3’非编码序列)的调节序列。“天然基因”指被发现存在于自然界中并具有自身调节序列的基因。“嵌合基因”指所有并非天然基因且包括被发现无法同时存在于自然界中的调节和编码序列的基因。嵌合基因可相应包括不同来源的调节序列和编码序列,或来源相同但排列方式不同于在自然界中所发现方式的调节序列和编码序列。本发明所述嵌合基因典型地包括与目标编码区可操作连接的GPD或GPM启动子区。“内源基因”指位于生物基因组内的自然位置上的天然基因。“外源”基因指通常不存在于宿主生物内,而是通过基因转移被导入该宿主生物内的基因。外源基因可包括被插入非天然生物内的天然基因,或嵌合基因。“转基因”指通过转化方法已被导入基因组内的基因。“密码子最优化基因”指所具有的密码子选择频率经过设计后模拟了宿主细胞的优选密码子选择频率的基因。
“编码序列”指编码用于特定氨基酸序列的DNA序列。
“合适的调节序列”指位于编码序列上游(5’非编码序列)、内部或下游(3’非编码序列)并影响关联编码序列的转录、RNA加工或稳定性或翻译的转录和翻译核苷酸序列。调节序列可包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎-环结构。
“启动子”指能够控制编码序列或功能RNA的表达的DNA序列。编码序列通常位于启动子序列的3’端。启动子可能全部来源于天然基因,或者由来源于自然界存在的不同启动子的不同元件构成,或者甚至包括合成的DNA片段。本领域技术人员应理解的是,不同启动子可引导基因在处于不同发育期或对不同环境或生理条件反应的不同组织或细胞类型内的表达。可使基因在大部分细胞类型中的大部分时间内表达的启动子通常被称为“组成型启动子”。应进一步认同的是,由于大多数情况下,调节序列的准确边界尚未被完整定义,因此,不同长度的DNA片段可能具有相同的启动子活性。
术语“突变启动子”在本文被定义为相对于亲本启动子而言具有包括了一个或多个核苷酸的置换、缺失和/或插入的特定核苷酸序列的启动子,其中该突变启动子的启动子活性高于或低于其对应亲本启动子。术语“突变启动子”包括天然变体和利用本领域所熟知方法体外生成的变体(例如经典诱变、定点诱变和“DNA改组”)。
术语“3’非编码序列”或“转录终止子”指位于编码序列下游的DNA序列。该术语包括多腺苷酸化识别序列及其它编码特定调节信号的序列,该调节信号能够影响mRNA加工或基因表达。多腺苷酸化信号的特征通常在于可影响mRNA前体3’末端添加聚腺苷酸束。该3’区可影响关联编码序列的转录、RNA加工或稳定性或翻译。
“RNA转录物”指DNA序列在RNA聚合酶催化下转录的产物。当RNA转录物是所述DNA序列的完全互补拷贝时,它被称为初级转录物,或者当其可能是所述初级转录物的转录后加工衍生的RNA序列时,则被称为成熟RNA。“信使RNA”或“mRNA”指无内含子并且可被细胞翻译成蛋白的RNA。“cDNA”指与mRNA互补和由其衍生的双链DNA。“有义”RNA指包括上述mRNA并因此可被细胞翻译成蛋白的RNA转录物。“反义RNA”指与靶初级转录物或mRNA的全部或一部分互补并可阻断靶基因表达的RNA转录物(U.S.5,107,065;WO99/28508)。反义RNA可能与特定基因转录物的任意部分,即5’非编码序列、3’非编码序列或编码序列均具有互补性。“功能RNA”指反义RNA、核糖酶RNA或其它不被翻译但仍然影响细胞过程的RNA。
术语“可操作连接的”指核酸序列与单个核酸分子的连接使二者之一的功能受另一方的影响。例如,当启动子与所述编码序列连接并能够影响该编码序列的表达时,该启动子与该编码序列是可操作连接的(即该编码序列受该启动子的转录控制)。编码序列可与调节序列按有义或反义方向可操作连接。
本文所用术语“表达”指来源于编码序列的有义(mRNA)或反义RNA的转录和稳定累积。表达还可指mRNA翻译成多肽。
“内含子”是存在于大部分真核细胞的基因序列中的非编码DNA序列(或者存在于编码区、5’非编码区或3’非编码区)。它们的完整功能尚未知;不过,某些增强子位于这些内含子中(Giacopelli F.et al.,Gene Expr.1195-104(2003))。这些内含子序列被转录后,却在所述mRNA被翻译为蛋白质之前从上述前mRNA转录物中被去除。该内含子去除过程是通过该内含子任意一侧序列(外含子)的自剪接而得以发生的。
术语“改变的生物学活性”指与核苷酸序列编码的蛋白有关并可通过分析方法测定的活性,且该活性高于或低于天然序列的相关活性。“增强的生物学活性”指经过改变后比天然序列的相关活性高的活性。“降低的生物学活性”指经过改变后比天然序列的相关活性低的活性。
“转化”指将核酸分子转移进宿主生物内,获得在基因方面稳定的遗传。该核酸分子可能是质粒,例如自主复制质粒;或者可以整合进宿主生物的基因组内。含有该转化核酸分子的宿主生物被称为“转基因”或“重组”或“转化”生物。
术语“质粒”、“载体”和“组件”指通常携带了不属于细胞中枢代谢部分的基因,并且通常为环状双链DNA片段形式的额外染色体元件。这种元件可能是任意来源的自主复制序列、基因组整合序列、噬菌体或核苷酸序列、线型或环状的单或双链DNA或RNA,其中的许多核苷酸序列已被加入或重组进特定的独特结构中,该独特结构能够将用于特定基因产物的启动子片段和DNA序列连同合适的3’未翻译序列一起导入细胞。“转化组件”指除了含有外源基因之外还含有有利于转化特定宿主细胞的其它元件的特异性载体。“表达组件”指除了含有外源基因之外还含有可增强该基因在外源宿主内的表达的其它元件的特异性载体。
术语“序列分析软件”指所有有助于分析核苷酸或氨基酸序列的计算机算法或软件程序。“序列分析软件”可通过商业渠道或自主研发获得。典型的序列分析软件包括但不限于1.)GCG系列程序(Wisconsin Package Version 9.0,Genetics Computer Group(GCG),Madison,WI);2.)BLASTP、BLASTN、BLASTX(Altschul et al.,J.Mol.Biol.215403-410(1990));3.)DNASTAR(DNASTAR,Inc.Madison,WI);以及4.)编入Smith-Waterman算法的FASTA程序(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date1992,111-20.Editor(s)Suhai,Sandor.PlenumNew York,NY)。应当理解的是,在本申请的上下文中,如无另外指明,序列分析软件均被用于分析,且分析结果将基于上述程序的“默认值”。本文所用的“默认值”指软件最初在首次初始化时便加载的所有数值或参数组。
本文所用的标准重组DNA和分子克隆技术是本领域熟知的,参见由Cold Spring Harbor LaboratoryCold Spring Harbor,NY(1989)出版Sambrook,J.,Fritsch,E.F.和Maniatis,T.编辑的第2版MolecularCloningA Laboratory Manual(下文参见“Maniatis”);由Cold SpringHarbor LaboratoryCold Spring Harbor,NY(1984)出版Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.编辑的Experiments with GeneFusions;以及由Greene Publishing Assoc.和Wiley-Interscience(1987)出版Ausubel,F.M.等人编辑的Current Protocols in MolecularBiology。
对解脂耶氏酵母内gpd和gpm基因的鉴定本发明鉴定了解脂耶氏酵母基因组内所含甘油醛-3-磷酸脱氢酶(gpd)基因的部分序列(其中编码蛋白C末端约115个氨基酸未在本文中公开)和磷酸甘油酸变位酶(gpm)基因的全部序列。
利用Smith-Waterman序列对比算法(W.R.Pearson,同上)对部分gpd核苷酸碱基及其推导氨基酸序列(SEQ ID NOs25和26)和公开数据库比较的结果表明,对比长度超过215个氨基酸时,大部分相似的已知序列与本文所报道gpd的氨基酸序列具有大约81%的同一性。优选氨基酸片段与本文所述序列具有至少大约70%-80%的同一性,同一性为85%-90%的那些序列尤其优选,具有大约95%同一性的那些序列最为优选。同样,与本发明所述ORF对应的优选gpd编码核酸序列是与本文所报道gpd核酸序列具有至少大约70%-80%同一性并编码活性蛋白的那些序列,同一性为85%-90%的那些序列尤其优选,具有大约95%同一性的那些序列最为优选。
利用Smith-Waterman序列对比算法(W.R.Pearson,同上)对gpm核苷酸碱基及其推导氨基酸序列(SEQ ID NOs15和16)和公开数据库比较的结果表明,对比长度超过216个氨基酸时,大部分相似的已知序列与本文所报道gpm的氨基酸序列具有大约71%的同一性。优选氨基酸片段与本文所述序列具有至少大约70%-80%的同一性,同一性为85%-90%的那些序列尤其优选,具有大约95%同一性的那些序列最为优选。同样,与本发明所述ORF对应的优选gpm编码核酸序列是与本文所报道gpm核酸序列具有至少大约70%-80%同一性并编码活性蛋白的那些序列,同一性为85%-90%的那些序列尤其优选,具有大约95%同一性的那些序列最为优选。
对解脂耶氏酵母内天然启动子区的鉴定本发明还鉴定了可自然调节解脂耶氏酵母内的GPD和GPM的推定启动子区。业已确定这些推定启动子区有助于驱动所有合适的目标编码区在转化的酵母细胞内的表达。
在本发明的上下文中,适用于含油酵母的启动子应符合下列标准1.)强度。强酵母启动子是高表达水平的必要前提,且当以解脂耶氏酵母作为宿主生物时,被整合进基因组内的以低拷贝数ars18(Fournier,P.et al.Yeast 725-36(1991))为基础的表达载体或嵌合基因使该要求变得尤为重要。
2.)在适合表达目标编码区的培养基中的活性,和该目标编码区的高酶活性。
3.)pH耐受性。如果已知目标编码区仅在例如,酸性环境中生成,则与该目标编码区可操作连接的启动子必须能在适当pH条件下发挥功能。当然,pH耐受性受限于宿主生物的耐受性。
4.)可诱导性。密调节酵母启动子可能有助于将生长期和表达期分开,从而使已知将抑制细胞生长的产物实现表达。
5.)在含油酵母宿主的生长稳定期间累积PUFAs的活性。
此外,使新型酵母启动子在与已知解脂耶氏酵母TEF和/或XPR2启动子有关的活性方面具有差异是可取的(U.S.4,937,189;EP220864;EP832258;U.S.6,265,185)。本发明对TEF启动子与GPD和GPM启动子的对比研究如实施例7所述。该研究结果表明,与TEF启动子相比,本发明所述酵母启动子的活性提高了。本发明所述GPD基因的启动子区被包含在若干种核酸分子内,具体而言,即SEQ ID NOs23、24和43。在一种实施方案中,GPD启动子包括SEQ ID NO43中从-500到+1号位的核苷酸(其中‘ATG’翻译起始密码子的‘A’位被指定为+1号位),从而具有了相对强的启动子活性;在可选实施方案中,SEQ ID NO43中从-100到+1号位的区域足以满足该启动子的基础活性。
本发明的GPM启动子区被包含在本文所公开的若干种核酸分子中,包括SEQ ID NOs27、28和44。在一种实施方案中,GPM启动子包括SEQ ID NO44中从-500到+1号位的核苷酸(其中‘ATG’翻译起始密码子的‘A’位被指定为+1号位),从而具有了相对强的启动子活性;可选地,SEQ ID NO44中从-100到+1号位的区域足以满足该启动子的基础活性。
本发明所述启动子区可能除了上述核苷酸外还包括其它核苷酸。例如,可基于SEQ ID NO23或SEQ ID NO27(SEQ ID NOs43和44分别为它们的子序列)所示DNA序列构建本发明的启动子序列。应认同的是,由于调节序列的准确边界尚未被完整定义,因此,具有不同缩减长度的启动子片段可能具有相同的启动子活性。
在可选实施方案中,可构建突变启动子,其中该启动子的DNA序列具有一个或多个核苷酸置换(即序列中一个或多个核苷酸的缺失、插入、置换或添加),但不影响(尤其是削弱)该酵母启动子活性。可通过缺失研究鉴定可被改变但不显著影响所述酵母启动子活性的区域。本发明所述突变启动子的启动子活性是SEQ ID NOs43和44所示GPD或GPM启动子区的启动子活性的至少大约20%、优选至少大约40%、更优选至少大约60%、更优选至少大约80%、更优选至少大约90%、更优选至少大约100%、更优选至少大约200%、更优选至少大约300%和最优选至少大约400%。
诱变法是本领域所熟知的,适用于生成突变启动子。例如,可应用体外诱变和筛选、基于PCR的随机诱变、定点诱变或其它方法使本发明所述天然存在的启动子和基因实现突变。这将可能获得在宿主细胞内具有更理想的启动子活性水平的推定启动子,或者获得在宿主细胞内具有更理想的功能所需物理和动力学参数的多肽。
如需要,可通过常规诱变、所获突变启动子或多肽的表达和对它们活性的测定,以分别确定对启动子或酶活性具有重要作用的目标核苷酸区域。突变体可包括缺失、插入和点突变,或它们的组合。典型的功能分析首先是缺失诱变,以确定1.)所述推定启动子中对活性而言所必需的最小部分;或2.)所述蛋白中对功能而言所必需的N-和C-末端界限。接着是进行内部缺失、插入或点突变,以进一步确定对功能而言所必需的区域。还可采用其它技术,诸如组件诱变或全合成。
编码序列的缺失诱变是通过例如,利用外切核酸酶序贯去除5’或3’编码区而得以实现的。有试剂盒可应用于这种技术。实现缺失后,通过将含有起始或终止密码子的寡核苷酸分别与5’或3’缺失后获得的缺失编码区连接,使该编码区完整。可选地,可通过包括定点诱变、诱变PCR在内的多种方法,将编码起始或终止密码子的寡核苷酸插入所述编码区中,或者通过连接方法,使其连接到在既有限制位点处被消化过的DNA上。
同样,可通过多种方法,包括利用DNA内的既有限制位点、利用诱变引物进行定点诱变或诱变PCR,以在推定启动子区或编码序列内实现内部缺失。插入可通过诸如接头分区诱变、定点诱变或诱变PCR的方法实现,而点突变则可通过诸如定点诱变或诱变PCR的技术实现。
还可采用化学诱变法鉴定推定启动子区或多肽内对活性而言具有重要作用的区域。即表达突变构建体,并分别测定所获已变更启动子或蛋白质的能力。这种结构-功能分析法可确定哪一个区域可以被缺失、哪一个区域耐受插入以及哪一种点突变可使突变启动子或蛋白质以与天然启动子或蛋白质基本相同的方式发挥功能。所有这样的突变启动子和编码本文所述启动子和基因来源的多肽的核苷酸序列均属于本发明范畴。
对gpd和gpm基因和推定启动子区的同源物的分离本领域技术人员应当理解的是,本发明所述启动子区和基因在多种酵母种内均有同源物;且用于异源基因表达的启动子和基因的应用不仅限于那些来源于解脂耶氏酵母的启动子和基因,还可扩展至它们在其它酵母种内的同源物。例如,本发明包括来源于含油属,包括但不限于耶氏酵母属、假丝酵母属、红酵母属、红冬孢属、隐球酵母属、丝孢酵母属和油脂酵母属的同源物;在这些属中,优选种的实例包括类酵母红冬孢、斯达氏油脂酵母、产油油脂酵母、Candidarevkaufi、铁红假丝酵母、热带假丝酵母、产朊假丝酵母、Trichosporonpullans、皮状丝孢酵母、胶粘红酵母和R.graminis。
同源性典型地通过利用序列分析软件而得以测定,其中术语“序列分析软件”指所有有助于分析核苷酸或氨基酸序列的计算机算法或软件程序(可通过商业渠道或自主研发获得)。通常,这种计算机软件是通过对多种置换、缺失及其它修饰的同源性程度赋值,以匹配相似序列。
正如本领域所熟知的,采用序列依赖型方案对同源启动子区或基因的分离可通过多种技术快速实现。序列依赖型方案的实例包括,但不限于1.)核酸杂交法;2.)可通过核酸扩增技术的多种应用进行说明的DNA和RNA扩增法[例如聚合酶链反应(PCR),Mullis et al,U.S.Patent 4,683,202;连接酶链反应(LCR),Tabor,S.et al.,Proc.Acad.Sci.USA 821074(1985);或链置换扩增(SDA),Walker,et al.,Proc.Natl.Acad.Sci.U.S.A.,89392(1992)],以及3.)文库构建和互补筛选法。
例如,可通过本领域技术人员熟知的方法,采用本发明所述核酸分子的全部或其部分作为DNA杂交探针筛选任意目标微生物来源的文库,以直接分离编码与本发明所述蛋白或多肽相似的蛋白或多肽的推定启动子区或基因。可通过本领域熟知的方法设计并合成以本发明所述核酸序列为基础的特异性寡核苷酸探针(Maniatis,同上)。此外,还可通过技术人员已知的方法,利用所述完整序列直接合成DNA探针(例如随机引物DNA标记、切口平移或末端标记技术),或者利用有效的体外转录系统直接合成RNA探针。此外,还可设计特异性引物,用于扩增本发明所述序列的一部分(或全长)。可于扩增反应期间直接标记扩增所获的产物,或在扩增反应后进行标记,并以其作为探针,在合适的严格性条件下分离全长DNA片段。
在PCR型扩增技术中,引物典型地具有不同序列,并且彼此不互补。根据预期的试验条件,应对引物序列进行设计,以有效并可靠地复制靶核酸。PCR引物的设计方法是本领域技术人员常用并熟知的(Thein和Wallace在由IRLHerndon,VA出版K.E.Davis编辑(1986)的Human Genetic DiseasesA Practical Approach第33-50页发表的“The use of oligonucleotide as specific hybridization probes inthe Diagnosis of Genetic Disorders”;以及Rychlik,W.在由HumaniaTotowa,NJ出版White,B.A.编辑的Methods in Molecular Biology(1993)Vol.15第31-39页发表的PCR ProtocolsCurrent Methods andApplications)。
本发明所述序列的两个短片段通常可被应用在聚合酶链反应方案中,以扩增编码DNA或RNA来源的同源多核苷酸的较长核酸分子。聚合酶链反应还可基于已克隆核酸分子文库进行,其中一种引物的序列来源于本发明所述核酸分子,另一种引物的序列则利用了编码微生物基因的mRNA前体的3’末端存在的聚腺苷酸束。
可选地,本发明所述序列可作为杂交试剂应用于同源物的鉴定。核酸杂交试验的基本组分包括探针、疑似含有目标核苷酸序列的样品和特异性杂交方法。本发明所述探针典型地是与待检核酸序列互补的单链核酸序列。探针与待检核酸序列是“可杂交的”。探针长度的变化范围是5个到数万个碱基,这将取决于待进行的特定实验。合适的探针长度典型地为大约15到大约30个碱基。该探针分子只需要一部分与待检核酸序列互补。此外,探针与靶序列之间无需完全互补。不完全互补分子之间杂交的结果是杂交区内某一部分的碱基与正确互补碱基不配对。
业已明确定义了杂交方法。探针和样品典型地必须在允许核酸杂交的条件下混合。这包括使探针和样品在合适的温度和合适浓度的无机或有机盐存在条件下接触。探针和样品核酸必须接触足够长的时间,以使该探针和样品核酸之间所有可能的杂交均可发生。混合物中的探针或靶的浓度决定了发生杂交所需的时间。探针或靶的浓度越高,所需的杂交温育时间越短。可任选地加入离液剂。离液剂通过抑制核酸酶活性使核酸稳定。此外,离液剂可使短寡核苷酸探针在室温下实现灵敏和严格杂交(Van Ness and Chen,Nucl.Acids Res.195143-5151(1991))。合适的离液剂包括氯化胍、硫氰酸胍、硫氰酸钠、四氯乙酸锂、高氯酸钠、四氯乙酸铷、碘化钾和三氟乙酸铯等。离液剂的终浓度典型地为大约3M。如果需要,可将甲酰胺加入杂交混合物中,其浓度典型地为30-50%(v/v)。
可应用多种杂交溶液。这些溶液典型地包括大约20-60%体积,优选30%体积的极性有机溶剂。常用杂交溶液应用了大约30-50%v/v甲酰胺,大约0.15-1M氯化钠、大约0.05-0.1M缓冲剂(例如柠檬酸钠、Tris-HCl、PIPES或HEPES(pH范围是大约6-9))、大约0.05-0.2%去污剂(例如十二烷基硫酸钠),或0.5-20mM EDTA、FICOLL(Pharmacia Inc.)(大约300-500kdal)、聚乙烯吡咯烷酮(大约250-500kdal)和血清白蛋白。典型杂交溶液还可包括大约0.1-5mg/mL的未标记载体核酸、片段化核DNA(例如小牛胸腺或鲑精DNA或酵母RNA),并任选地含有重量体积比约为0.5-2%的甘氨酸。还可包括其它添加剂,诸如体积排阻剂,包括多种极性水溶性或可膨胀剂(例如聚乙二醇)、阴离子聚合物(例如聚丙烯酸酯或聚甲基丙烯酸酯)和阴离子糖聚合物(例如葡聚糖硫酸酯)。
酵母内的重组表达有助于驱动目标编码基因在目标宿主细胞内的表达的起始控制区或启动子区选自那些来源于gpd和gpm基因(分别为SEQ ID NOs25和15)上游部分的区域。可根据常用方法,从gpd和gpm基因以及它们的同源物的上游序列中鉴定出上述启动子区,并将其分离(Maniatis,同上)。一旦鉴定并分离出该启动子区,便可使其与将在合适表达载体内表达的目标编码区可操作连接。这些嵌合基因从而得以在天然宿主细胞和异源宿主细胞,尤其是在含油酵母宿主的细胞内表达。因此,本发明的一个方面是提供含有本发明所述酵母启动子的重组表达载体。
在进一步的方面中,本发明提供了在转化的酵母细胞内表达目标编码区的方法,其中的转化细胞具有特定嵌合基因,该嵌合基因含有(i)GPD或GPM启动子区和(ii)可在所述宿主内表达的目标编码区,其中该启动子区与目标编码区可操作地连接;且所述转化细胞在表达上述嵌合基因的条件下生长。可任选地从培养物中回收由上生成的多肽。
微生物表达系统和表达载体是本领域技术人员所熟知的。它们均可被用于构建含有gpm和gpd基因来源的启动子区的嵌合基因,以生成适合在理想酵母宿主细胞内表达的任意一种特异性的目标编码区。这些嵌合基因接着可以通过整合和转化法被导入合适的微生物内,并在诱导的基础上获得高水平表达的酶。可选地,可将所述启动子克隆进能够转化优选酵母宿主细胞并在其中复制自身的质粒内。接着可将待表达的目标编码区克隆在该启动子下游。一旦获得重组宿主,便可通过在合适的条件下培养细胞,以实现基因表达(如下所述)。
合适的目标编码区有用的嵌合基因包括与将在优选宿主细胞内表达的合适目标编码区可操作连接的本文所述gpd和gpm基因的启动子区或其突变启动子。
将于重组酵母宿主内表达的目标编码区可能是该宿主内生的,也可能与其异源,但必须与该宿主生物相容。具有经济价值的蛋白的编码基因尤其适用于表达。例如,合适的目标编码区可包括(但不限于)病毒、细菌、真菌、植物、昆虫的目标编码区,或脊椎动物的目标编码区,包括哺乳动物多肽。此外,这些目标编码区可能是例如,结构蛋白、酶(例如氧化还原酶、转移酶、水解酶、裂合酶、异构酶、连接酶)或肽。非限制性实例包括编码诸如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-葡聚糖酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂酶、甘露糖苷酶、齿斑葡聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶和木聚糖酶的酶的基因。
本发明的某些实施方案优选参与包括ω-6和ω-3脂肪酸在内的微生物油生成的酶的编码区。包括藻类、细菌、霉菌和酵母在内的许多微生物可以在普通的细胞代谢过程中合成PUFAs和ω脂肪酸。被着重深入研究的是真菌,包括Schizochytrium aggregatm、破囊壶菌属和高山被孢霉属的种。此外,还有许多腰鞭毛虫(甲藻纲)可自然生成高浓度PUFAs。同样,业已通过遗传方法鉴定了多种参与油生成的基因,在这些基因中,有若干个基因的DNA序列已公开(例如,参见GenBank编号中的AY131238、Y055118、AY055117、AF296076、AF007561、L11421、NM_031344、AF465283、AF465282、AF465281、AF110510、AF419296、AB052086、AJ250735、AF126799、AF126798、AF199596、AF226273、AF320509、AB072976、AF489588、AJ510244、AF419297、AF07879、AF067654、AB022097、AF489589.1、AY332747、AAG36933、AF110509、AB020033、AAL13300、AF417244、AF161219、X86736、AF240777、AB007640、AB075526、AP002063、NP_441622、BAA18302、BAA02924、AAL36934、AF338466、AF438199、E11368、E11367、D83185、U90417、AF085500、AY504633、NM_069854、AF230693、AX464731、NM_119617、NM_134255、NM_134383、NM_134382、NM_068396、NM_068392、NM_070713、NM_068746和NM_064685)。此外,专利文献还提供了其它许多参与油生成的基因的DNA序列(和/或与上述若干基因及它们的分离方法相关的细节)。参见例如,被完整引入本文作为参考的U.S.5,968,809(Δ6去饱和酶);U.S.5,972,664和U.S.6,075,183(Δ5去饱和酶);WO 91/13972和U.S.5,057,419(Δ9去饱和酶);WO 93/11245(Δ15去饱和酶);WO 94/11516、U.S.5,443,974和WO 03/099216(Δ12去饱和酶);U.S.2003/0196217A1(Δ17去饱和酶);WO 00/12720和U.S.2002/0139974A1(延伸酶)。
载体/DNA组件的组成有助于转化合适宿主细胞的载体或DNA组件是本领域所熟知的。对所述构建体内存在的序列的特定选择取决于目标表达产物(同上)、宿主细胞的特性和拟采用的将转化细胞与未转化细胞分离的方法。不过,所述载体或组件典型地含有引导相关基因转录和翻译的序列、可选择标记和允许自主复制或染色体整合的序列。合适的载体包括控制转录起始的基因的5’区和控制转录终止的DNA片段的3’区。虽然这种控制区域被认为无需来源于被选定作为生产宿主的特定宿主种类的天然基因,但最优选的仍然是这两个控制区域均来源于转化宿主细胞的基因。
业已发现翻译起始密码子‘ATG’周围的核苷酸序列可影响酵母细胞内的表达。如果目标多肽在酵母内的表达不足,可修饰外源基因的核苷酸序列,使其包括有效的酵母翻译起始序列基序,从而获得最佳基因表达。通过定点诱变低效表达基因,使其包括有利的翻译起始基序,便可使其实现在酵母内的表达。
终止区可来源自获得起始区的基因的3’区或者来源自不同基因。有大量终止区是已知的,并且可以在多种宿主内良好地发挥功能(当被利用在其来自的相同和不同属和种时)。通常是考虑方便的因素而对终止区进行选择,而不考虑任何特定属性。该终止区优选地来源自酵母基因,尤其是酵母、裂殖酵母、假丝酵母、耶氏酵母或克鲁维酵母菌。还已知编码γ-干扰素和α-2干扰素的哺乳动物基因的3’区可在酵母内发挥功能。终止控制区还可来源自优选宿主的多种天然基因。任选地,终止位点可能并非必要;但最优选的仍是将其包括在内。
就本领域技术人员所知,仅将嵌合基因插入克隆载体并不能保证其能够以要求的水平成功表达。为了满足高表达率的需要,业已通过操纵许多可控制转录、翻译、蛋白质稳定性、氧限度和宿主细胞分泌方面的不同遗传元件,构建了许多专用表达载体。更具体而言,已被操纵用于控制基因表达的若干分子特征包括1.)相关转录启动子和终止序列的性质;2.)克隆基因的拷贝数量和该基因是质粒所具有的还是被整合进宿主细胞内的;3.)合成外源蛋白的最终细胞定位;4.)在宿主生物内的翻译效率;5.)克隆基因蛋白在宿主细胞内的固有稳定性;和6.)该克隆基因内的密码子选择,可使其频率接近宿主细胞的优选密码子选择频率。这些修饰类型均被包括在本发明中,被用于进一步优化包括本文所述gpd和gpm基因的启动子区或其突变启动子在内的嵌合基因的表达,其中所述启动子区与合适的目标编码区可操作连接。
酵母细胞的转化一旦构建出适合在酵母细胞内表达的合适嵌合基因,便可将其置入能够在宿主细胞内自主复制的质粒载体内,或者将其直接整合进该宿主细胞的基因组内。表达组件的整合可随机发生在宿主基因组内,或者可以通过利用含有特定区域的构建体而被导向,该特定区域与宿主基因组同源并足以导向该宿主位点内的重组。构建体被导向内源位点的情况中,全部或部分的转录和翻译调节区可由该内源位点提供。
当两个或多个基因是从分离的复制载体中表达时,各载体需要具有不同的选择方式,并应缺乏与另一个构建体的同源性,以维持稳定表达并避免元件在构建体中的重配。调节区的明智选择、选择方法和导入构建体的增殖方法可通过试验确定,使所有导入基因均以必需水平表达,以实现目标产物的合成。
含有目标编码区的构建体可通过任意标准技术被导入宿主细胞内。这些技术包括转化(例如乙酸锂转化[Methods in Enzymology,194186-187(1991)])、原生质体融合、基因枪冲击、电穿孔、微量注射或其它所有可将目标基因导入宿主细胞内的方法。可应用于含油酵母(即解脂耶氏酵母)的更多具体学说包括美国专利4,880,741和5,071,764以及Chen,D.C.等人的学说(Appl Microbiol Biotechnol.48(2)232-235-(1997))。
为方便起见,已通过任意方法被操纵并获得DNA序列(例如表达组件)的宿主细胞在本文中被称为“转化的”或“重组的”。该转化宿主应具有至少一个拷贝的表达构建体,根据所述基因是被整合进基因组的、扩增的还是存在于具有多重拷贝数的染色体外元件上的,则可具有两个或多个拷贝的表达构建体。可通过对导入构建体所含标记的选择鉴定转化的宿主细胞。可选地,由于许多转化技术可将多个DNA分子导入宿主细胞中,因此可用目标构建体共转化单个标记构建体。对转化宿主的选择典型地基于它们在选择性培养基上生长的能力。选择性培养基可掺入抗生素或者缺乏未转化宿主生长所必需的因子,诸如营养或生长因子。导入的标记基因可具有抗生素抗性或编码必需生长因子或酶,从而当其在转化宿主内被表达时能够允许宿主在选择性培养基中的生长。当被表达的标记蛋白可被直接或间接检测时,也可实现对转化宿主的选择。该标记蛋白可以单独或与另一种蛋白融合的形式表达。该标记蛋白可通过1.)其酶活性(例如β-半乳糖苷酶可将底物X-gal[5-溴-4-氯-3-吲哚-β-D-吡喃糖苷半乳糖]转化为有色产物;荧光素酶可将虫荧光素转化为发光产物);或者2.)其产生或改变光的特征(例如当用蓝光照射维多利亚水母时,其绿色荧光蛋白将发出荧光)。可选地,可采用抗体检测标记蛋白或位于例如,目标蛋白上的分子标记。可通过例如,直观或诸如FACS或利用抗体淘选等技术选择可表达上述标记蛋白或标记的细胞。对酵母转化体的选择而言,任何可在酵母内发挥功能的标记均可被采用。本文优选的是对卡那霉素、潮霉素和氨基糖苷G418的抗性,以及在缺乏尿嘧啶或亮氨酸的培养基上的生长能力。
正调节含有与目标编码区可操作连接的GPD或GPM启动子的嵌合基因表达的技术特定目标编码区(与本发明所述启动子可操作连接)的其它拷贝可被导入所述宿主内,以提高表达。还可通过使所述mRNA或编码蛋白除去/缺失失稳序列,或者通过将稳定化序列加入所述mRNA中,以提高目标编码区的表达(U.S.4,910,141)。
另一种可提高目标编码区的表达的方法是通过将天然基因内的密码子置换为可在选定宿主微生物内实现最佳表达的基因所用的密码子,从而提高编码mRNAs的翻译效率。本领域技术人员应当意识到,利用宿主优选密码子可充分增强编码所述多肽的外源基因的表达。通常,通过在特定目标宿主种类内检验蛋白质(优选表达量最大的那些蛋白质)的密码子选择,并确定哪一个密码子被选用的频率最高,便可确定宿主优选密码子。接着,便可利用该宿主种类优选的密码子完整或部分地合成目标多肽的编码序列。
优选宿主在本文中,适用于表达本发明所述基因和与本发明所述启动子分子可操作连接的目标编码区的优选宿主细胞为酵母细胞(当目的是生成微生物油时最优选含油酵母,如下所述)。含油酵母能够自然合成并累积油,其中的油含量可大于细胞干重的大约25%,更优选地大于细胞干重的大约30%,最优选地大于细胞干重的大约40%。被鉴定为含油酵母的属典型地包括,但不限于耶氏酵母属、假丝酵母属、红酵母属、红冬孢属、隐球酵母属、丝孢酵母属和油脂酵母属。更具体而言,例证性的油合成酵母包括类酵母红冬孢、斯达氏为油脂酵母、产油油脂酵母、Candida revkaufi、铁红假丝酵母、热带假丝酵母、产朊假丝酵母、Trichosporon pullans、皮状丝孢酵母、胶粘红酵母、R.graminis和解脂耶氏酵母(曾被划分为解脂假丝酵母)。
最优选的是含油酵母解脂耶氏酵母;在进一步的实施方案中,最优选的是被命名为ATCC#20362、ATCC#8862、ATCC#18944、ATCC#76982和/或LGAM S(7)1的解脂耶氏酵母菌株(Papanikolaous S.和Aggelis G.,Bioresour.Technol.82(1)43-9(2002))。被命名为ATCC#76982的解脂耶氏酵母菌株是本文所述用来分离GPD和GPM启动子和基因的特定菌株。
利用可表达合适目标编码区的转化酵母进行的工业生产可被最优化用于高水平表达特定目标编码区的培养基条件通常包括碳源的类型和数量、氮源的类型和数量、碳-氮比率、氧水平、生长温度、pH、生物量生产期的长度和细胞收获时间。诸如含油酵母的目标微生物生长在复合培养基(例如酵母提取物-蛋白胨-葡萄糖液体培养基(YPD))或缺乏生长必需组分并因而迫使选择预期表达组件的确定成分的基本培养基(例如酵母氮源(DIFCO Laboratories,Detroit,MI))。
本发明所用发酵培养基必须含有合适的碳源。合适的碳源包括,但不限于单糖(例如葡萄糖、果糖)、二糖(例如乳糖、蔗糖)、寡糖、多糖(例如淀粉、纤维素或它们的混合物)、糖醇(例如甘油)或可再生原料的混合物(例如干酪乳清透过物、玉米浆、甜菜糖浆、大麦芽)。碳源还可包括链烷、脂肪酸、脂肪酸的酯、甘油单酯、甘油二酯、甘油三酯、磷脂和多种商业来源的脂肪酸,包括植物油(例如豆油)和动物脂肪。碳底物还可包括已被证实可被代谢转化为关键生化中间产物的单碳源(例如二氧化碳、甲醇、甲醛、甲酸、含碳的胺)。因此,应用于本发明的碳源被认为可包括广泛多种的含碳源,并仅受限于宿主生物的选择。尽管上述所有碳源和它们的混合物均被认为适用于本发明,优选碳源仍然是糖和/或脂肪酸。最优选的是葡萄糖和/或含有10-22个碳的脂肪酸。
氮可由无机(例如(NH4)2SO4)或有机来源(例如尿素或谷氨酸)提供。除了合适的碳和氮源外,发酵培养基还必须含有合适的无机物、盐、辅因子、缓冲剂、维生素及本领域技术人员已知适合微生物生长的其它组分。
本发明中的优选生长培养基是通用的商业制备培养基,诸如酵母氮源(DIFCO Laboratories,Detroit,MI)。也可利用其它成分明确的或合成的生长培养基,而适用于特定微生物生长的合适培养基是微生物学或发酵学领域的技术人员已知的。对发酵而言合适的pH范围典型地为大约pH4.0-pH8.0,其中优选pH5.5-pH7.0作为初始生长条件适用的范围。该发酵可在需氧或厌氧条件下进行,其中优选微好氧条件。
可采用本领域已知的方法培养含有与本发明所述启动子可操作连接的合适目标编码区的宿主细胞。例如,可通过在允许表达所述目标编码区的条件下,在合适的培养基中进行的摇瓶培养、在实验室或工业发酵罐中进行的小规模或大规模发酵,以培养所述细胞。
需要工业生产以本发明所述遗传嵌合体为基础的产物时,可应用多种培养方法。例如,可通过分批、补料分批或连续发酵方法大规模生产重组宿主过量表达的特定基因产物。
分批发酵方法是封闭系统,其中的培养基组成在该过程之初便固定,除了在该过程期间为维持pH和氧水平所必需的添加之外不再进行其它添加。因此,在该培养过程之初,用指定生物接种培养基,并在不向该培养基添加其它物质(即碳和氮源)的条件下使该生物生长或具有代谢活性。在分批方法中,系统的代谢产物和生物量组成稳定地发生变化,直到培养结束。在典型的分批方法中,细胞经历了静态迟滞期、快速生长对数期和最终的稳定期,其中稳定期的生长速率是降低或停止的。不加处理的话,稳定期的细胞将最终死亡。标准分批方法的变化是补料分批方法,其中底物是在该发酵过程期间被连续加入发酵罐中。补料分批方法也适用于本发明。当分解代谢物抑制倾向于抑制细胞代谢或者需要使培养基中的底物量在任意时刻均受限时,补料分批方法是有用的。由于补料分批系统的底物浓度难以测定,所以可基于可测因素,诸如pH、溶解氧和废气(例如CO2)分压的变化进行估计。分批和补料分批培养方法是本领域常用并熟知的,实例可参见被引入本文作为参考的Thomas D.Brock在Sinauer AssociatesSunderland,MA(1989)出版的第二版BiotechnologyA Textbook ofIndustrial Microbiology中所述的相关内容或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36227(1992)。
工业生产还可通过连续发酵方法实现,其中成分确定的培养基被连续加入生物反应器内,同时取出等量的培养体积用于产物回收。连续培养通常使细胞维持在对数生长期且细胞密度恒定。连续或半连续培养方法允许调节可影响细胞生长或终产物浓度的一种或任意多种因素。例如,一种方法可能限制碳源,但不限定其它所有可调节代谢的参数。在另一些系统中,影响生长的许多因素可被连续改变,而通过培养基浊度测定的细胞浓度则保持恒定。连续系统需要维持稳态生长,因此必须平衡细胞生长率,以补偿因为培养期间取出了培养基所造成的细胞损失。调节连续培养过程所需营养物和生长因子的方法,以及最大化产物形成速率的技术均是工业微生物学领域所熟知的,多种方法的详述参见上述Brock的文献资料。
优选实施方案详述尽管本发明所述启动子适合所有合适的目标编码区在含油酵母内的表达,但在一种优选实施方案中,本发明所述启动子则被应用于研发可累积富含PUFAs的油的含油酵母。为实现该目标,就必须导入并表达例如,可被用于合成并累积ω-3和/或ω-6脂肪酸的去饱和酶和延伸酶。
术语“脂肪酸”指链长度变化范围是大约C12到C22的长链脂肪族酸(链烷酸)(但已知也有更长和更短链长度的酸)。大部分链长度介于C16和C22之间。脂肪酸的结构由简单的符号方法“X:Y”表示,其中X是碳(C)原子的总数量,Y是双键数量。
脂肪酸通常被划分为饱和或不饱和两种。术语“饱和脂肪酸”指那些碳主链之间无“双键”的脂肪酸。与之相反,“不饱和脂肪酸”是沿其碳主链具有“双键”的顺式异构体。“单不饱和脂肪酸”沿碳主链仅具有一个“双键”(例如对棕榈油酸(16:1)和油酸(18:1)而言通常位于第9和第10个碳原子之间),而“多不饱和脂肪酸”(或“PUFAs”)沿碳主链具有至少2个双键(例如,对亚油酸(18:2)而言是位于第9和第10个碳原子之间和第12和第13个碳原子之间;对α亚麻酸(18:3)而言则位于第9和第10个碳原子之间、第12和第13个碳原子之间和第15和第16个碳原子之间)。
“PUFAs”可被划分为两大类(取决于距脂肪酸碳链甲基末端最近处的第一个双键位置(n))。因此,“ω-6脂肪酸”(ω-6或n-6)在距其分子ω(甲基)末端的第6个碳原子处具有第一个不饱和双键,并另外具有共计2个或以上的特定双键,后续的每一次不饱和均发生在接近该分子羧基末端的另外3个碳原子处。与之相反,“ω-3脂肪酸”(ω-3或n-3)在距其分子ω末端的第3个碳原子处具有第一个不饱和双键,并另外具有共计3个或以上的双键,后续的每一次不饱和均发生在接近该分子羧基末端的另外3个碳原子处。
就本公开内容的目的而言,ω-参考系被用于说明从ω碳开始记数(就该目的而言,将其编号为1)的碳数量、双键数量和最接近该ω碳的双键位置。该命名法如下表1中的“简化符号”一栏所示。该表还概括了ω-3和ω-6脂肪酸的通用名、本说明书通篇将用到的缩写词和各化合物的化学名称。
表1多不饱和脂肪酸命名
肪酸的微生物生物合成含油微生物内的脂质累积通常是在响应培养基的总体碳氮比时被引发的。当细胞耗尽可利用的氮源时(例如当碳氮比大于大约40时),细胞腺苷酸(AMP)的耗尽导致线粒体中的AMP-依赖性异柠檬酸脱氢酶活性终止和柠檬酸的累积,柠檬酸被转运进细胞溶胶中,并随后被ATP-柠檬酸裂解酶裂解生成乙酰辅酶A和草酰乙酸。乙酰辅酶A是重新生物合成脂肪酸所需的主要构件。脂肪酸生物合成的第一个关键步骤是通过乙酰辅酶A的羧化而合成丙二酰辅酶A。脂肪酸合成由多酶脂肪酸合酶复合物催化,并通过8个双碳片段(来源于乙酰辅酶A的乙酰基)的缩聚,形成16-碳饱和脂肪酸,即棕榈酸。
棕榈酸是较长链的饱和和不饱和脂肪酸(例如硬脂酸(18:0)、棕榈油酸(16:1)和油酸(18:1))通过内质网膜中存在的延伸酶和去饱和酶作用的前体。棕榈酸和硬脂酸在Δ9去饱和酶的作用下分别转化为它们的不饱和衍生物,棕榈油酸(16:1)和油酸(18:1)。
ω-3和ω-6脂肪酸的生物合成简言之,将LA转化为GLA、DGLA和ARA(ω-6途径)和将ALA转化为STA、ETA、EPA和DHA(ω-3途径)的代谢过程包括碳链通过加入碳原子而获得的延长和所述分子通过加入双键而实现的去饱和。这需要一系列存在于内质网膜内的特定去饱和酶和延伸酶的参与,下文将这些酶称为“PUFA生物合成途径酶”。
更具体而言,“PUFA生物合成途径酶”指与PUFA的生物合成相关的下述任意一种酶(和编码该酶的基因),包括Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶和/或延伸酶。为进一步阐明本公开内容,术语“去饱和酶”指多酶复合物中可使一种或多种脂肪酸去饱和生成单或多不饱和脂肪酸或目标前体的多肽组分。尽管本说明书就特定脂肪酸而言采用了ω-参考系,但通过利用Δ系从所述底物羧基末端开始记数更易于说明去饱和酶的活性。例如,Δ17去饱和酶可在所述分子中从羧基末端开始编号为第17和第18的碳原子之间实现去饱和并且可以例如,催化从ARA到EPA和/或DGLA到ETA的转化。与之相反,术语“延伸酶”指多酶复合物中可使脂肪酸碳链延伸生成比其作用的脂肪酸底物多2个碳的单或多不饱和脂肪酸的多肽组分。该延伸过程发生在与脂肪酸合酶相关的多步机制中,其中的辅酶A为酰基载体(Lassner etal.,The Plant Cell 8281-292(1996))。简言之,用长链酰基辅酶A缩聚丙二酰辅酶A,产生CO2和β-酮酰基辅酶A(其中该酰基部分已延伸2个碳原子)。后续反应包括还原为β-羟酰基辅酶A、脱水为烯酰基辅酶A并第二次还原生成延伸的酰基辅酶A。
ω-6脂肪酸的合成以下述方式进行油酸(第一种ω-6脂肪酸)在Δ12去饱和酶作用下转化为LA(18:2)(图10)。后续ω-6脂肪酸的生成步骤如下1.)LA在Δ6去饱和酶活性作用下转化为GLA;2.)GLA在延伸酶作用下转化为DGLA;和3.)DGLA在Δ5去饱和酶作用下转化为ARA。与之相比,ω-3脂肪酸则全部来源于亚油酸(LA)。具体而言1.)LA在Δ15去饱和酶作用下转化为ALA;2.)ALA在Δ6去饱和酶活性作用下转化为STA;3.)STA在延伸酶活性作用下转化为ETA;和4.)ETA在Δ5去饱和酶活性作用下转化为EPA。可选地,ETA和EPA可以是DGLA和ARA在Δ17去饱和酶活性作用下分别生成的。EPA可在延伸酶和Δ4去饱和酶活性作用下进一步转化为DHA。
PUFAs的生成对本领域技术人员而言显而易见的是,为生成特定PUFA终产物而需被导入宿主生物内的特定功能性将取决于宿主细胞(及其天然PUFA分布图和/或去饱和酶分布图)、底物的有效性及目标终产物。如图10所示,通过导入下述PUFA酶功能性的多种组合Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶和/或延伸酶,便可在含油酵母内生成LA、GLA、DGLA、ARA、ALA、STA、ETA、EPA、DPA和DHA。本领域技术人员根据公开的文献资料(例如GenBank)、专利文献和对具有PUFAs生成能力的微生物的试验分析,应该能够鉴定编码上述任意酶的不同候选基因。因此,有多种去饱和酶和延伸酶均适合作为目标编码区应用在本发明中。这些目标编码区均可通过本领域技术人员所熟知的技术与本发明所述GPD和/或GPM启动子或它们的突变启动子可操作连接,并作为嵌合基因被用于表达多种ω-6和ω-3脂肪酸(参见例如被完整引入本文作为参考的共同待决的美国专利申请10/840579)。同样,本发明提供了ω-3和/或ω-6脂肪酸的生成方法,包括
a)提供具有特定嵌合基因的转化的含油酵母宿主细胞,该嵌合基因含有1)特定基因的启动子区,选自gpm基因的启动子区和gpd基因的启动子区;和2)可在所述含油酵母内表达的编码功能性ω-3/ω-6脂肪酸生物合成途径酶的目标编码区;其中所述启动子区与编码区是可操作连接的;以及b)在合适的生长条件下培养步骤(a)的宿主细胞,以生成一种或多种ω-3或ω-6脂肪酸。
在优选实施方案中,所述启动子区的核酸序列选自SEQ IDNOs23、27、43和44,以及它们的亚序列和突变启动子;所述目标编码区则是适合在所述含油酵母内表达生成ω-3或ω-6脂肪酸的任意去饱和酶或延伸酶。
为了以最经济方式最大产量地生产PUFAs,需在特定条件下培养已转化的含油酵母宿主细胞,该条件可通过优化本发明所述嵌合基因的表达从而优化去饱和酶和延伸酶活性,其中这些嵌合基因包括gpm或gpd基因的启动子区,以及编码PUFA生物合成途径酶的目标编码区。
在发酵培养基中,尤其需要注意的是若干种可促进脂质和PUFAs合成的金属离子(例如Mn+2、Co+2、Zn+2、Mg+2)(Nakahara,T等人在D.J.Kyle和R.Colin编辑的Ind.Appl.Single Cell Oils(1992)第61-97页所述相关内容)。
可表达多种ω-6和ω-3脂肪酸的含油酵母的生产优选的“可发酵碳源”包括但不限于单糖、寡糖、多糖、链烷、脂肪酸、脂肪酸的酯、甘油单酯、甘油二酯、甘油三酯、二氧化碳、甲醇、甲醛、甲酸和含碳的胺。
PUFAs在含油酵母细胞内的高水平累积典型地需要两个阶段的过程,因为代谢状态必须在生长和脂肪的合成/贮藏之间获得“平衡”。因此,含油酵母内的PUFAs生成最优选地必需两个阶段的发酵过程。在该方法中,发酵的第一个阶段是生成并累积细胞物质,其特征在于快速的细胞生长和细胞分裂。在发酵的第二个阶段中,可优选的是在培养中建立脱氮条件,以促进高水平的脂质累积。该脱氮的作用是降低AMP在细胞内的有效浓度,从而降低线粒体的NAD-依赖性异柠檬酸脱氢酶活性。脱氮发生时将累积柠檬酸,从而在胞质内形成大量乙酰辅酶A,并引发脂肪酸合成。因此,该阶段的特征在于细胞分裂的终止及其后发生的脂肪酸合成和油累积。尽管细胞典型地生长在大约30℃的条件下,仍有若干研究显示较低的温度可提高不饱和脂肪酸的合成(Yongmanitchai and Ward,Appl.Environ.Microbiol.57419-25(1991))。根据过程经济学,该温度变动很可能发生在上述两阶段发酵的第一个阶段之后,即大部分生物开始生长时。
PUFAs的纯化PUFAs可以诸如酰基甘油、磷脂、硫脂或糖脂的游离脂肪酸或酯化形式在宿主微生物中生成,可通过本领域熟知的多种方法将其从宿主细胞中提取出来。Z.Jacobs综述了针对酵母脂质而言的提取技术、性质分析和可接受性标准(Critical Reviews in Biotechnology12(5/6)463-491(1992))。有关下游加工的简述可参见A.Singh和O.Ward所著文献(Adv.Appl.Microbiol.45271-312(1997))。
通常,PUFAs的纯化方法可包括用有机溶剂提取、超声处理、超临界流体提取(例如利用二氧化碳)、皂化和诸如压力的物理方法,或这些方法的组合。尤为关注的方法是在水存在条件下,用甲醇和氯仿进行的提取(E.G.Bligh & W.J.Dyer,Can.J.Biochem.Physiol.37911-917(1959))。需要时,水层可被酸化为带负电荷的质子化部分,并从而使分配进入有机层的目标产物增多。提取结束后,可通过在氮气流条件下进行的蒸发,除去有机溶剂。当产物以共轭形式被分离时,可通过酶促或化学法将其裂解,以释放游离脂肪酸或被关注的较不复杂的共轭物,并可对其进行进一步的操作,以获得目标终产物。用氢氧化钾可理想地裂解脂肪酸的共轭形式。
如需要进一步的纯化,可采用标准方法。这些方法可包括提取、尿素处理、分部结晶、HPLC、分部蒸馏、硅胶层析、高速离心或蒸馏,或这些技术的组合。对诸如酸或烯烃基的反应基的保护可通过已知技术(例如烷基化或碘化)在任意步骤进行。所用方法包括对脂肪酸的甲基化,以获得甲基酯。同样,可在任意步骤除去保护基。对含有GLA、STA、ARA、DHA和EPA的部分的纯化可通过尿素处理和/或分部蒸馏而理想地实现。
实施例下述实施例进一步定义了本发明。应当理解的是,这些实施例虽然指出了本发明的优选实施方案,但仅用于例证。通过上文的论述和这些实施例,本领域技术人员可确定本发明的基本特征,并且在不背离本发明精神和范畴的前提下,可对其进行多种改变和改进,使其适用于多种用途和条件。
常规方法应用在实施例中的标准重组DNA和分子克隆技术是本领域熟知的,相关描述可参见1.)由Cold Spring Harbor Laboratory;ColdSpring Harbor,NY(1989)出版Sambrook,J.、Fritsch,E.F.和Maniatis,T.所著的Molecular CloningA Laboratory Manual(下文参见“Maniatis”);2.)由Cold Spring Harbor LaboratoryCold SpringHarbor,NY(1984)出版T.J.Silhavy、M.L.Bennan和L.W.Enquist所著的Experiments with Gene Fusions;以及3.)由Greene PublishingAssoc.and WileyInterscience(1987)出版Ausubel,F.M等人所著的Current Protocols in Molecular Biology。
适用于微生物培养的维持和生长的材料和方法是本领域熟知的。适用于下述实施例的技术可参见American Society for MicrobiologyWashington,D.C.(1994)出版的Manual of Methods for GeneralBacteriology(由Phillipe Gerhardt、R.G.E.Murray、Ralph N.Costilow、Eugene W.Nester、Willis A.Wood、Noel R.Krieg和G.BriggsPhillips编辑);或Thomas D.Brock在Sinauer AssociatesSunderland,MA(1989)出版的第二版BiotechnologyA Textbook of IndustrialMicrobiology中所述的相关内容。如无另外指明,用于微生物细胞的生长和维持的所有试剂、限制酶和材料获自Aldrich Chemicals(Milwaukee,WI)、DIFCO Laboratories(Detroit,MI)、GIBCO/BRL(Gaithersburg,MD)或Sigma Chemical Company(St.Louis,MO)。
解脂耶氏酵母的亮氨酸自养菌株购自美国模式培养物保藏所(Rockville,MD;ATCC#76982),被用于功能性测定。解脂耶氏酵母菌株通常于28℃生长在YPD琼脂(1%酵母提取物、2%细菌用蛋白胨、2%葡萄糖、2%琼脂)上。为选择转化体,采用了基本培养基(不含硫酸铵或氨基酸的0.17%酵母氮源(NIFCO Laboratories)、2%葡萄糖、0.1%脯氨酸、pH6.1)。所加入的补充腺嘌呤、亮氨酸、赖氨酸和/或尿嘧啶的终浓度为0.01%。
常规分子克隆是根据标准方法进行的(Sambrook et al.,同上)。寡核苷酸由Sigma-Genosys(Spring,TX)合成。定点诱变是利用Stratagene的QuikChangeTM定点诱变试剂盒(San Diego,CA)并遵循生产商的用法说明书进行的。当亚克隆包括聚合酶链反应(PCR)或定点诱变时,需对构建体测序,以确定其序列中未导入差错。PCR产物被克隆进Promega的pGEM-T-easy载体(Madison,WI)中。
对遗传序列的操纵是利用一套可获自Genetics Computer GroupInc.的程序(Wisconsin Package Version 9.0,Genetics Computer Group(GCG),Madison,WI)实现的。该GCG程序“Pileup”所用的缺口产生默认值为12,缺口延伸默认值为4。GCG“Gap”或“Bestfit”程序所用的默认缺口产生罚分为50,默认的缺口延伸罚分为3。如无另外指出,其它所有情况均采用了GCG程序的默认参数。
缩写词的意义如下“sec”指秒、“min”指分钟、“h”指小时、“d”指天、“μL”指微升、“mL”指毫升、“L”指升、“μM”指微摩尔、“mM”指毫摩尔、“M”指摩尔、“mmol”指毫摩尔、“μmole”指微摩尔、“g”指克、“μg”指微克、“ng”指纳克、“U”指单位、“bp”指碱基对,“kB”指千碱基。
实施例1解脂耶氏酵母GPD部分的分离本实施例描述了通过利用其它GPD序列保守区来源的引物鉴定解脂耶氏酵母基因中编码GPD的部分(SEQ ID NOs11和12)的方法。
对来源于酿酒酵母(GenBank编号CAA24607;SEQ ID NO1)、粟酒裂殖酵母(GenBank编号NP_595236;SEQ ID NO2)、米曲霉(GenBank编号AAK08065;SEQ ID NO3)、牙鲆(GenBank编号BAA88638;SEQ ID NO4)、非洲爪蟾(GenBank编号P51469;SEQ IDNO5)和原鸡(GenBank编号DECHG3;SEQ ID NO6)的编码GPD基因的不同蛋白质序列所作的比较显示这6种不同生物存在若干段保守氨基酸序列(图1A和1B)。由此设计了分别对应于保守‘KYDSTHG’(SEQ ID NO7)和‘TGAAKAV’(SEQ ID NO8)氨基酸序列的两种简并寡核苷酸(如下所示),并用于扩增解脂耶氏酵母来源GPD编码区的一部分简并寡核苷酸YL193(SEQ ID NO9)AAGTACGAYTCBACYCAYGG简并寡核苷酸YL194(SEQ ID NO10)ACRGCCTTRGCRGCDCCRGT[注SEQ ID NOs9和10所用的核酸简并密码为R=A/G;Y=C/T;B=C/G/T;和D=A/G/T]基于图1所示GPD序列的全长序列,猜测如上所述扩增的解脂耶氏酵母GPD基因的N-末端将缺失约50个氨基酸,C-末端将缺失大约约115个氨基酸。
PCR扩增在总体积为50μl并包括PCR缓冲液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH8.75)、2mM MgSO4、0.1%TritonX-100)、100μg/mL BSA(终浓度)、均为200μM的各种脱氧核苷三磷酸、均为10pmol的各种引物、50ng解脂耶氏酵母(ATCC#76982)基因组DNA和1μl Taq DNA聚合酶(Epicentre Technologies)的混合物中进行。热循环仪的条件被设定为35个循环,每个循环包括95℃1分钟、56℃30秒和72℃1分钟,接着于72℃进行10分钟的最终延伸。
利用Qiagen PCR纯化试剂盒(Valencia,CA)纯化PCR产物,并接着通过1%(w/v)琼脂糖凝胶电泳将其进一步纯化。随后将该PCR产物克隆进pGEM-T-easy载体(Promega,Madison,WI)中。将连接的DNA用于转化大肠杆菌DH5α的细胞,并在含有氨苄青霉素(100μg/mL)的LB上筛选转化体。对一种转化体来源的质粒DNA的分析证实存在预期大小的质粒,将其命名为“pT-GPD”。
序列分析显示pT-GPD含有一个长为507bp的片段(SEQ IDNO11)。通过运行BLAST(Basic Local Alignment Search Tool;Altschul,S.F.,et al.,J.Mol.Biol.215403-410(1993))搜索该序列与BLAST“nr”数据库(包括所有非冗余GenBank CDS翻译、3维结构Brookhaven Protein Data Bank来源的序列、SWISS-PROT蛋白质序列数据库、EMBL和DDBJ数据库)中所含序列的相似性,可确定该序列的同一性。利用国立生物技术信息中心(NCBI)提供的BLASTN算法可确定与“nr”数据库中所含所有公开DNA序列的相似性。翻译所有可读框内的DNA序列,并利用NCBI提供的BLASTX算法(Gish,W.和States,D.J.Nature Genetics 3266-272(1993))比较其与“nr”数据库所含所有公开蛋白质序列的相似性。概括了与SEQ ID NO11具有最大相似性的序列的BLAST对比结果是依照%同一性、%相似性和期望值发布的。“%同一性”的定义是两种蛋白质之间相同氨基酸所占的百分比。“%相似性”的定义是两种蛋白质之间相同或保守氨基酸所占的百分比。“期望值”估计了匹配的统计显著性,是用特定分数表示在完全随机搜索特定大小的数据库时所期望的匹配数量。
上述长为507bp的pT-GPD被发现编码169个氨基酸(SEQ IDNO12)。该氨基酸片段与裂殖酵母(GenBank编号NP_595236)的GPD蛋白质序列具有77%同一性和84%相似性(图2),期望值为6e-68。该耶氏酵母序列在N-和C-末端分别具有‘KYDSTHG’(SEQID NO7)和‘TGAAKAV’(SEQ ID NO8)氨基酸序列(与被用于扩增该片段的简并引物对应)。对该部分GPD序列进一步的序列对比结果证实其与小鸡(GenBank编号DECHG3)和蛙(GenBank编号P51469)来源的GPD蛋白质分别具有大约72%和74%的同一性(图2)。
实施例2对解脂耶氏酵母GPM的鉴定本实施例描述了以酿酒酵母GPM蛋白质序列为查询序列搜索解脂耶氏酵母基因组数据库,以鉴定解脂耶氏酵母的GPM编码基因的方法。
具体而言,在运行BLAST(如实施例1所述)搜索“Yeast projectGenolevures”的公开解脂耶氏酵母数据库(Center for Bioinformatics,LaBRI,Talence Cedex,France)时应用了酿酒酵母GPM蛋白质序列(GenBank编号NP_012770;SEQ ID NO13)。
一个重叠群(“重叠群2217”;SEQ ID NO14)被鉴定编码解脂耶氏酵母中的GPM。重叠群2217的长度为1049bp,但有5个核苷酸位置的序列不确定(1020号核苷酸位为“n”、39、62、331号位为“y”;以及107号位为“m”)。翻译所有可读框内的重叠群2217的DNA序列,并利用BLASTX算法(如实施例1所述)比较其与“nr”数据库所含所有公开蛋白质序列的相似性。基于这些DNA和蛋白质序列分析结果,证实
●GPM翻译起始密码子‘ATG’位于SEQ ID NO14的388bp处;因此,重叠群2217相对于该‘ATG’密码子具有大约388bp长的上游序列;和●重叠群2217在470号核苷酸位处缺失一个碱基,导致移码。
GPM中与重叠群2217对应的推导编码区序列的长度为651bp(SEQ ID NO15),其蛋白质序列由SEQ ID NO16编码。该蛋白质具有216个氨基酸,与酿酒酵母(GenBank编号NP_012770;Goffeau,A.,et al.,Science 274(5287)546(1996))的GPM蛋白质序列具有71%同一性、82%相似性,期望值为3e-81(图3)。
实施例3对解脂耶氏酵母来源gpd和gpm基因的5’上游区的分离为分离实施例1和2中所鉴定基因的GPD和GPM启动子区,应用了基因组步查技术(TOPOWalker Kit,Invitrogen,CA)。
简言之,分别用Kpnl、Sacl、Sphl或Pacl消化解脂耶氏酵母的基因组DNA,并用牛小肠碱性磷酸酶(CIP)将其去磷酸化。接着以去磷酸化DNA为模板并以下述一种寡核苷酸为引物分别进行引物延伸反应,所述引物即对GPD而言采用YL206(SEQ ID NO17),对GPM而言采用YL196(SEQ ID NO18)。用TOPO接头连接引物延伸产物,并以其为模板和以LinkAmp引物1和第二种合适的寡核苷酸为引物进行第一次PCR反应。具体而言,在PCR反应中,以YL207(SEQ IDNO19)作为导向GPD上游启动子区的第二种引物,以YL197(SEQ IDNO20)作为导向GPM上游启动子区的第二种引物。PCR扩增在总体积为50μl并包括PCR缓冲液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH8.75)、2mM MgSO4、0.1%Triton X-100)、100μg/mLBSA(终浓度)、均为200μM的各种脱氧核苷三磷酸、均为10pmol的各种引物和1μl Taq DNA聚合酶(Epicentre Technologies)的混合物中进行。热循环仪的条件被设定为35个循环,每个循环包括95℃1分钟、56℃30秒和72℃1分钟,接着于72℃进行10分钟的最终延伸。
接着以第一个PCR产物为模板并以LinkAmp引物2和合适的寡核苷酸为引物进行第二次PCR反应。具体而言,在包括LinkAmp引物2和YL208(SEQ ID NO21)的反应中所用模板是对GPD而言的第一个PCR产物;与之相比,在包括LinkAmp引物2和YL198(SEQ IDNO22)的反应中所用模板是对GPM而言的第一个PCR产物。该PCR扩增如上所述方法进行。
相继利用Qiagen PCR纯化试剂盒和1%(w/v)琼脂糖凝胶电泳单独纯化分别含有GPD和GPM基因5’上游区的PCR产物。接着将产物克隆进pGEM-T-easy载体(Promega,Madison,WI)中。将连接的DNA用于转化大肠杆菌DH5α,并在含有氨苄青霉素(100μg/mL)的LB琼脂上筛选转化体。
对一种含有gpd基因5’上游区的转化体来源的质粒DNA所作的分析证实存在预期质粒,将其命名为“pT-GPDP”。序列分析显示pT-GPDP含有一个长为1848bp的片段(SEQ ID NO23),该片段包括从GPD基因的翻译起始密码子‘ATG’的核苷酸‘A’(被指定为+1号位)开始长为1525bp的5’上游序列。完整装配重叠SEQ ID NOs23和11可获得包括GPD起始密码子上游长为1525bp的片段和该基因中长为791bp的片段的单重叠群(SEQ ID NO24;图4)。对部分基因序列(+1-+791)的进一步分析表明存在内含子(碱基对+49-+194)。因此,编码解脂耶氏酵母中GPD基因的部分cDNA序列的长度仅为645bp(SEQ ID NO25),其对应蛋白质序列(SEQ ID NO26)具有215个氨基酸。通过BLAST分析比较该蛋白与所有公开蛋白质序列的相似性(如实施例1所述)。基于该分析结果确定上述部分GPD蛋白与Cryotococcus cyrvatus(GenBank编号Q9Y796和AAD25080)的GPD最相似(81%同一性)。
对一种含有gpm基因5’上游区的转化体来源的质粒DNA所作的分析证实存在预期质粒,将其命名为“pT-GPML”。序列分析显示pT-GPML含有一个长为953bp的片段(SEQ ID NO27)。该克隆具有从GPM基因的翻译起始密码子开始长为875bp的5’上游序列。装配与重叠SEQ ID NOs27和15对应的DNA,可获得如SEQ ID NO28所示的单DNA重叠群(图5)。因此,该重叠群含有GPM基因中从-875到+662号位的区域,其中‘ATG’翻译起始密码子的‘A’位被指定为+1号位。
实施例4pY5-30的合成本实施例描述了合成含有TEF∷GUS∷XPR嵌合基因的pY5-30的方法。该合成是考查TEF、GPD和GPM启动子活性的对比研究所必需的,其中制备了含有各启动子和报道基因的构建体,并对它们进行了分析(实施例5-7)。具体而言,报道基因为大肠杆菌的β-葡糖醛酸糖苷酶编码基因(GUS;Jefferson,R.A.Nature.342(6251)837-838(1989))。
GUS编码区的扩增以pBI101(Jefferson,R.A.et al.,EMBO J.63901-3907(1987))为模板和以寡核苷酸YL33(SEQ ID NO29)和YL34(SEQ ID NO30)为引物扩增GUS编码区。该PCR扩增在总体积为50μl并包括PCR缓冲液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH8.75)、2mM MgSO4、0.1%Triton X-100)、100μg/mL BSA(终浓度)、均为200μM的各种脱氧核苷三磷酸、均为10pmol的各种引物和1μl Pfu DNA聚合酶(Stratagene,San Diego,CA)的混合物中进行。热循环仪的条件被设定为35个循环,每个循环包括95℃1分钟、56℃30秒、72℃1分钟,接着于72℃进行10分钟的最终延伸。用Ncol和Pacl消化该PCR产物。
质粒pY5-10的合成质粒pY5是pINA532(由Insitut National Agronomics,Centre debioteehnologie AgroIndustrielle,laboratoire de Genetique Moleculaireet Cellularie INRACNRS,F-78850 Thiverval-Grignon,France的Dr.Claude Gaillardin所赠)的衍生物,被构建用于在解脂耶氏酵母内表达异源基因,如图6所示。将含有pINA532的ARS18序列和LEU2基因并经过部分消化的长为3598bp的EcoRI片段亚克隆进pBluescript(Strategene,San Diego,CA)的EcoRI位点,可生成pY2。
通过以TEF5’(SEQ ID NO31)和TEF3’(SEQ ID NO32)为引物进行的PCR,由解脂耶氏酵母基因组DNA扩增TEF启动子(MullerS.,et al.,Yeast,141267-1283(1998))。该PCR扩增在总体积为50μl并包括100ng耶氏酵母基因组DNA、PCR缓冲液(含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH8.75)、2mM MgSO4、0.1%TritonX-100)、100μg/mL BSA(终浓度)、均为200μM的各种脱氧核苷三磷酸、均为10pmol的各种引物和1μl Pfu Turbo DNA聚合酶(Stratagene,San Diego,CA)的混合物中进行。扩增步骤如下95℃初始变性3分钟,接着进行35个循环,每个循环包括95℃1分钟、56℃30秒、72℃1分钟。最终的延伸循环于72℃进行10分钟,接着于4℃终止反应。将长为418bp的PCR产物连接进pCR-Blunt中,生成pIP-tef。将pIP-tef的BamHI/EcoRV片段亚克隆进pY2的BamHI/Smal位点,可生成pY4。
XPR2转录终止子是通过以pINA532为模板,以XPR5’(SEQ IDNO33)和XPR3’(SEQ ID NO34)为引物进行PCR而得以扩增的。该PCR扩增是在总体积为50μl的反应混合物中进行,采用了上述组分和条件。用SacII消化长为179bp的PCR产物后,将其连接进pY4的SacII位点,可生成pY5。因此,pY5(如图6所示)含有耶氏酵母自主复制序列(ARS18)、ColE1质粒复制起点、用于在大肠杆菌内进行选择的氨苄青霉素抗性基因(AmpR)、用于在耶氏酵母内进行选择的编码异丙基苹果酸异构酶的耶氏酵母LEU2基因、用于耶氏酵母内的异源基因表达的翻译延伸启动子(“TEF P”),和在耶氏酵母内用于转录终止异源基因表达的胞外蛋白酶基因终止子(XPR2)。
质粒pY5-10(图7A)是由pY5构建而得的衍生物。首先,通过3轮以pY5为模板进行的定点诱变构建pY5-4(图6)。利用寡核苷酸YL1和YL2(SEQ ID NOs35和36)除去pY5中位于LEU2报道基因内的Ncol位点,可生成pY5-1。通过利用寡核苷酸YL3和YL4(SEQID NO37和38)进行的定点诱变,将Ncol位点导入pY5-1中的TEF启动子和XPR转录终止子之间,可生成pY5-2。接着利用寡核苷酸YL23和YL24(SEQ ID NO39和40),将Pacl位点导入pY5-2中的TEF启动子和XPR转录终止子之间,可生成pY5-4。最后,通过以寡核苷酸YL9(SEQ ID NO41)和YL10(SEQ ID NO42)为引物进行的定点诱变,将Sall位点导入pY5-4中的TEF启动子和LEU2基因之间,可生成pY5-10(图7A)。
质粒pY5-30的合成含有TEF∷GUS∷XPR嵌合基因的质粒pY5-30(图7B)是通过将含有GUS编码区(同上)的Ncol/Pacl PCR产物插入经由Ncol/Pacl消化的pY5-10中而得以合成的。
实施例5DYZGDG和pYZGMG的合成本实施例描述了pYZGDG(含有GPD∷GUS∷XPR嵌合基因)和pYZGMG(含有GPM∷GUS∷XPR嵌合基因)的合成方法。合成这两种质粒首先需要鉴定和扩增推定GPD和GPM启动子区。接着将各推定启动子区克隆进pY5-30的衍生物中。
推定启动子区的鉴定和扩增通过基因组步查分离GPD和GPM基因的5’上游序列后,通过查找翻译起始密码子‘ATG’周围的共有基序,并将耶氏酵母GPD和GPM基因的翻译编码区分别与其它生物来源的GPD和GPM基因做比较,便可确定翻译起始位点。这两种基因的‘ATG’起始位点的上游区域被用于鉴定推定启动子区。
因此,可确定在GPD基因中(其中‘ATG’翻译起始密码子的‘A’核苷酸被指定为+1号位),介于-968号位和‘ATG’翻译起始位点之间的核苷酸区域含有所述推定启动子区(“GPDPro”,如SEQ ID NO43所示)。同样可确定在GPM基因中,介于-875号位与‘ATG’翻译起始位点之间的核苷酸区域含有所述推定启动子区(“GPMLPro”,如SEQ ID NO44所示)。
如上述方法鉴定的推定启动子区是通过PCR扩增的。具体而言,以寡核苷酸YL211(SEQ ID NO45)和YL212(SEQ ID NO46)为引物和以pT-GPDP(实施例3)为模板扩增GPDPro。以寡核苷酸YL203(SEQ ID NO47)和YL204(SEQ ID NO48)为引物和以pT-GPML(实施例3)为模板扩增GPMLPro。这些PCR扩增均在总体积为50μl并包括PCR缓冲液(含有10mM KCl、10mM(NH4)2SO4、20mMTris-HCl(pH8.75)、2mM MgSO4、0.1%Triton X-100)、100μg/mLBSA(终浓度)、均为200μM的各种脱氧核苷三磷酸、均为10pmol的各种引物和1μl Pfu DNA聚合酶(Stratagene,San Diego,CA)的混合物中进行。热循环仪的条件被设定为35个循环,每个循环包括95℃1分钟、56℃30秒、72℃1分钟,接着于72℃进行10分钟的最终延伸。
接着利用Qiagen PCR纯化试剂盒纯化PCR产物,并对其进行下述限制酶切消化和连接反应
●用Sall完全消化GPDPro后,用Ncol对其进行部分消化。通过1%(w/v)琼脂糖凝胶电泳纯化由上所获的Sall/Ncol片段,将其连接进经由Ncol/Sall消化的pY5-30载体(实施例4)中(其中Ncol/Sall消化切除了pY5-30载体主链上的TEF启动子)。
●于37℃用Ncol和Sall消化GPMLPro 1小时,接着通过1%(w/v)琼脂糖凝胶电泳对其进行纯化。将经由Ncol/Salll消化的PCR产物连接进经由Ncol/Sall消化的pY5-30载体中。
接着将各反应所获的连接DNA用于单独转化大肠杆菌DH5α。在含有氨苄青霉素(100μg/mL)的LB琼脂上筛选转化体。
对一个含有GPDPro的转化体来源的质粒DNA所作的分析证实存在被命名为“pYZGDG”的预期质粒(图7C)。因此,该质粒含有包括GPD启动子、GUS报道基因和XPR终止子在内的嵌合基因。
对一个含有GPMLPro的转化体来源的质粒DNA所作的分析证实存在被命名为“pYZGMG”的预期质粒,该质粒含有GPM∷GUS∷XPR嵌合基因(图7D)。
实施例6用pY5-30、pYZGDG和pYZGMG对解脂耶氏酵母的转化根据Chen,D.C.等人所述方法(Appl.Microbiol Biotechnol.48(2)232-235(1997)),分别将质粒pY5-30(实施例4;含有TEF∷GUS∷XPR嵌合基因)、pYZGDG(实施例5;含有GPD∷GUS∷XPR嵌合基因)和pYZGMG(实施例5;含有GPM∷GUS∷XPR嵌合基因)单独转化进解脂耶氏酵母ATCC#76982中。
简言之,将耶氏酵母的亮氨酸营养缺陷体划线接种至YPD平板上,并于30℃培养大约18小时。从平板上刮取若干次大菌环量的细胞,重悬浮于1mL含有下述物质的转化缓冲液中●2.25mL 50%PEG,平均MW3350;●0.125mL的2M乙酸锂,pH6.0;●0.125mL的2M DTT;以及●50μg剪切的鲑精DNA。
将大约500ng质粒DNA温育在100μl重悬浮细胞中,并于39℃每15分钟涡旋混合一次,保持1小时。将细胞接种至缺乏亮氨酸的基本培养基平板上,并于30℃温育2到3天。
利用该技术可分别获得含有pY5-30、pYZGDG和pYZGMG的转化体。
实施例7对解脂耶氏酵母内TEF、GPD和GPM启动子活性的对比分析TEF、GPD和GPM启动子的活性是在含有pY5-30、pYZGDG和pYZGMG构建体的解脂耶氏酵母内测定的,其中所述三种构建体均具有GUS报道基因和XPR终止子。各表达构建体内的GUS活性是通过组织化学和荧光测定法测定的(Jefferson,R.A.Plant Mol.Biol.Reporter 5387-405(1987))。
通过组织化学试验测定的GUS活性具体而言,于30℃条件下,在3mL基本培养基(20g/L葡萄糖、1.7g/L不含氨基酸的酵母氮源、1g/L L-脯氨酸、0.1g/L L-腺嘌呤、0.1g/LL-赖氨酸,pH6.1)中,从单菌落开始分别培养含有质粒pY5-30的两个解脂耶氏酵母菌株、含有质粒pYZGDG的两个解脂耶氏酵母菌株和含有质粒pYZGMG的两个解脂耶氏酵母菌株,直至OD600约1.0。接着通过离心收集100μl细胞,将其重悬浮于100μl组织化学染色缓冲液中,并于30℃温育。[染色缓冲液的制备方法为将5mg 5-溴-4-氯-3-吲哚葡糖苷酸(X-Gluc)溶解在50μl二甲基甲酰胺中,接着加入5mL50mM NaPO4,pH7.0。]组织化学染色结果显示构建体pY5-30中的TEF启动子、构建体pYZGDG中的GPD启动子和构建体pYZGMG中的GPM启动子均具有活性。GPD启动子似乎比TEF启动子强得多(图8A),而GPM启动子则与TEF启动子至少一样强(图8B)。
通过荧光测定法测定的GUS活性还可通过荧光法测定由对应底物β-葡糖苷酸生成的4-甲基伞形酮,以分析GUS活性(Jefferson,R.A.,同上)。
于30℃条件下,在3mL基本培养基(如上所述)中,从单菌落开始分别培养含有质粒pY5-30、pYZGDG和pYZGMG的解脂耶氏酵母菌株,直至OD600约1.0。接着分别将这些3mL培养物加入含有50mL基本培养基的500mL摇瓶中,于30℃震荡培养箱中培养大约24小时。通过离心收集细胞,重悬浮于Promega细胞裂解缓冲液中,并利用BIO101Biopulverizer系统(Vista,CA)裂解。离心后,取出上清液,保存在冰上。
每一次荧光测定均是将100μl提取液加入700μl GUS测定缓冲液(由2mM 4-甲基伞形酮-β-D-葡糖苷酸(“MUG”)在提取缓冲液中所形成的)中,并置于37℃。分别于0、30和60分钟时间点取出100μl等分试样,加入900μl终止缓冲液(1M Na2CO3)中。利用激发波长被设定为360nm,发射波长被设定为455nm的荧光计(CytoFluorR Series4000,Framingham,MA)对各时间点样品读数。用10μl提取液和200μlBioRad Bradford试剂确定各样品中的总蛋白质浓度(Bradford,M.M.Anal.Biochem.72248-254(1976))。GUS活性被表达为纳摩尔4-MU/分钟/毫克蛋白质。
这些荧光测定的结果如图9所示。具体而言,图9A所示为在解脂耶氏酵母内,GPD启动子的强度是基准标记TEF启动子的3倍;与之相比,图9B所示为GPM启动子的GUS活性约为基准标记TEF启动子的110%。
实施例8GPD启动子在解脂耶氏酵母内的Δ15去饱和酶表达方面的用途本实施例描述了含有GPD启动子、真菌Δ15去饱和酶和XPR终止子的嵌合基因的构建,以及该基因在解脂耶氏酵母内的表达。由于转化的宿主细胞均能够生成ALA(虽然野生型解脂耶氏酵母不具有任何Δ15去饱和酶活性),这证实GPD启动子在诸如解脂耶氏酵母的含油酵母细胞内具有可驱动异源PUFA生物合成途径酶表达的能力。
含有GPD∷Fm1∷XPR嵌合基因的质粒pY34的构建首先,由pY5衍生构建质粒pY5-13(实施例4)。具体而言,通过以pY5为模板进行6轮定点诱变,构建pY5-13。通过利用寡核苷酸YL5和YL6(SEQ ID NOs49和50)进行的定点诱变,除去pY5中的Sall和Clal位点,可生成pY5-5。通过利用寡核苷酸YL9和YL10(SEQID NOs41和42)进行的定点诱变,将Sall位点导入pY5-5中的LEU2基因和TEF启动子之间,可生成pY5-6。通过利用寡核苷酸YL7和YL8(SEQ ID NOs51和52)进行的定点诱变,将Pacl位点导入pY5-6中的LEU2基因和ARS18之间,可生成pY5-8。通过利用寡核苷酸YL3和YL4(SEQ ID NOs37和38),将Ncol位点导入pY5-8中TEF启动子的翻译起始密码子周围,可生成pY5-9。利用YL1和YL2寡核苷酸(SEQ ID NOs35和36)除去pY5-9中LEU2基因内的Ncol位点,可生成pY5-12。最后,利用寡核苷酸YL61和YL62(SEQ ID NOs53和54),将BsiWI位点导入pY5-12中的ColEI和XPR区之间,可生成pY5-13。
将含有GPDPro(获自实施例5)的纯化Sall/Ncol片段连接进经由Ncol/Sall消化的pY5-13载体(其中Ncol/Sall消化已将pY5-13载体主链的TEF启动子切除)中,可获得“pY5-13GPD”。因此,pY5-13GPD含有GPD启动子∷XPR终止子表达组件。
将pY5-13GPD中位于启动子片段3’末端的Ncol位点转化为Notl位点,可获得“pY5-13GPDN”。对该转化而言,是通过利用具有Notl位点的GPD有义(SEQ ID NO55)和GPD反义(SEQ ID NO56)引物进行的PCR再次扩增GPD启动子。用Sall和Notl消化由上所获的启动子片段,将其克隆进pY5-13的Sall/Notl位点(从而除去TEF启动子),可获得pY5-13GPDN。
编码串珠镰孢菌株M-8114Δ15去饱和酶(SEQ ID NO57;参见共同待决的美国临时申请60/519191)的ORF是通过以含有全长cDNA的cDNA克隆ffm1c.pK001.g23(E.I.du Pont de Nemours and Co.,Inc.,Wilmington,DE)为模板和采用上和下引物P192(SEQ ID NO59)和P193(SEQ ID NO60)进行的PCR而得以扩增的。该PCR是利用Eppendorf Mastercycler Gradient Cycler和Pfu聚合酶,并遵照生产商的推荐方法进行的。扩增步骤如下95℃初始变性1分钟,接着进行30个循环,每个循环包括95℃变性30秒、58℃退火1分钟和72℃延伸1分钟。最终的延伸循环于72℃进行10分钟,接着于4℃终止反应。
利用Qiagen DNA纯化试剂盒从琼脂糖凝胶上纯化获得正确大小(约1240bp)的片段,用Notl消化后,将其克隆进质粒pY5-13GPDN中位于GPD启动子和XPR终止子之间的Notl位点。可生成含有GPD∷Fm1∷XPR嵌合基因的质粒“pY34”。
质粒pY34(GPD∷Fm1∷XPR)在解脂耶氏酵母内的表达采用实施例6所述转化方法,将pY5(载体克隆对照,获自实施例4)和pY34(GPDP∷Fm1∷XPR)分别地单独转化进野生型(WT)解脂耶氏酵母ATCC#76892中,并在Bio101 DOB/CSM-Leu平板上进行筛选。
于30℃条件下,在3mL基本培养基(配方/L20g葡萄糖、1.7g酵母氮源、1g L-脯氨酸、0.1g L-腺嘌呤、0.1g L-赖氨酸,pH6.1)中分别培养野生型和转化细胞的单菌落,直至OD600约1.0。收获细胞,用蒸馏水洗涤,真空离心蒸发浓缩干燥后,将其直接转酯化,并进行GC分析。具体而言,为了分析脂肪酸,是通过离心收集细胞,并如Bligh,E.G.&Dyer,W.J.所述方法提取脂质(Can.J.Biochem.Physiol.37911-917(1959))。脂肪酸甲基酯是通过用甲氧基钠使脂质提取物转酯(Roughan,G.和Nishida I.Arch Biochem Biophys.276(1)38-46(1990))而得以制备,接着用装配有30-m X 0.25mm(内径)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890GC对其进行分析。炉温以3.5℃/分钟的速度从170℃(保持25分钟)上升至185℃。
为了直接进行碱基转酯,先收获耶氏酵母培养物(3mL),在蒸馏水中洗涤一次,并在Speed-Vac内的真空条件下干燥5-10分钟。向样品中加入甲氧基钠(100μl,1%),接着涡旋并振摇样品20分钟。加入3滴1M NaCl和400μl己烷后,涡旋并离心样品。移出上层并如上所述通过GC对其进行分析。
野生型耶氏酵母和各转化体的脂肪酸分布图如下表2所示。对脂肪酸的鉴定结果为16:0(棕榈酸)、16:1(棕榈油酸)、18:0、18:1(油酸)、18:2(LA)和18:3(ALA);各脂肪酸组成均以在总脂肪酸中所占百分比的形式表示。
表2镰孢Δ15去饱和酶在解脂耶氏酵母内的表达
上述结果证实GPD启动子适合在耶氏酵母内驱动Δ15去饱和酶的表达,从而生成ALA。
序列表<110>E.I.duPont de Nemours&Co.,Inc.
<120>适合含油酵母内的基因表达的甘油醛-3-磷酸脱氢酶和磷酸甘油酸变位酶启动子<130>CL2299 PCT<160>60<170>PatentIn version 3.2<210>1<211>332<212>PRT<213>酿酒酵母(Genbank编号CAA24607)<400>1Met Val Arg Val Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu Val1 5 10 15Met Arg Ile Ala Leu Ser Arg Pro Asn Val Glu Val Val Ala Leu Asn20 25 30Asp Pro Phe Ile Thr Asn Asp Tyr Ala Ala Tyr Met Phe Lys Tyr Asp35 40 45Ser Thr His Gly Arg Tyr Ala Gly Glu Val Ser His Asp Asp Lys His50 55 60Ile Ile Val Asp Gly Lys Lys Ile Ala Thr Tyr Gln Glu Arg Asp Pro65 70 75 80Ala Asn Leu Pro Trp Gly Ser Ser Asn Val Asp Ile Ala Ile Asp Ser85 90 95Thr Gly Val Phe Lys Glu Leu Asp Thr Ala Gln Lys His Ile Asp Ala100 105 110Gly Ala Lys Lys Val Val Ile Thr Ala Pro Ser Ser Thr Ala Pro Met115 120 125Phe Val Met Gly Val Asn Glu Val Lys Tyr Thr Ser Asp Leu Lys Ile130 135 140Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys145 150 155 160
Val Ile Asn Asp Ala Phe Gly Ile Glu Glu Gly Leu Met Thr Thr Val165 170 175His Ser Leu Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser His Lys180 185 190Asp Trp Arg Gly Gly Arg Thr Ala Ser Gly Asn Ile Ile Pro Ser Ser195 200 205Thr Gly Ala Ala Lys Ala Val Gly Lys Val Leu Pro Glu Leu Gln Gly210 215 220Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Val Asp Val Ser Val225 230 235 240Val Asp Leu Thr Val Lys Leu Asp Lys Glu Thr Thr Tyr Asp Glu Ile245 250 255Lys Lys Val Val Lys Ala Ala Ala Glu Gly Lys Leu Lys Gly Val Leu260 265 270Gly Tyr Thr Glu Asp Ala Val Val Ser Ser Asp Phe Leu Gly Asp Ser275 280 285His Ser Ser Ile Phe Asp Ala Ser Ala Gly Ile Gln Leu Ser Pro Lys290 295 300Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Tyr Gly Tyr Ser Thr305 310 315 320Arg Val Val Asp Leu Val Glu His Ile Ala Lys Ala325 330<210>2<211>335<212>PRT<213>粟酒裂殖酵母(Genbank编号NP_595236)<400>2Met Ala Ile Pro Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg1 5 10 15Ile Val Leu Arg Asn Ala Ile Leu Thr Gly Lys Ile Gln Val Val Ala20 25 30
Val Asn Asp Pro Phe Ile Asp Leu Asp Tyr Met Ala Tyr Met Phe Lys35 40 45Tyr Asp Ser Thr His Gly Arg Phe Glu Gly Ser Val Glu Thr Lys Gly50 55 60Gly Lys Leu Val Ile Asp Gly His Ser Ile Asp Val His Asn Glu Arg65 70 75 80Asp Pro Ala Asn Ile Lys Trp Ser Ala Ser Gly Ala Glu Tyr Val Ile85 90 95Glu Ser Thr Gly Val Phe Thr Thr Lys Glu Thr Ala Ser Ala His Leu100 105 110Lys Gly Gly Ala Lys Arg Val Ile Ile Ser Ala Pro Ser Lys Asp Ala115 120 125Pro Met Phe Val Val Gly Val Asn Leu Glu Lys Phe Asn Pro Ser Glu130 135 140Lys Val Ile Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu145 150 155 160Ala Lys Val Ile Asn Asp Thr Phe Gly Ile Glu Glu Gly Leu Met Thr165 170 175Thr Val His Ala Thr Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser180 185 190Lys Lys Asp Trp Arg Gly Gly Arg Gly Ala Ser Ala Asn Ile Ile Pro195 200 205Ser Ser Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Ala Leu210 215 220Asn Gly Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asp Val225 230 235 240Ser Val Val Asp Leu Thr Val Lys Leu Ala Lys Pro Thr Asn Tyr Glu245 250 255
Asp Ile Lys Ala Ala Ile Lys Ala Ala Ser Glu Gly Pro Met Lys Gly260 265 270Val Leu Gly Tyr Thr Glu Asp Ser Val Val Ser Thr Asp Phe Cys Gly275 280 285Asp Asn His Ser Ser Ile Phe Asp Ala Ser Ala Gly Ile Gln Leu Ser290 295 300Pro Gln Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Trp Gly Tyr305 310 315 320Ser His Arg Val Val Asp Leu Val Ala Tyr Thr Ala Ser Lys Asp325 330 335<210>3<211>338<212>PRT<213>米曲霉(Genbank编号AAK08065)<400>3Met Ala Thr Pro Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg1 5 10 15Ile Val Phe Arg Asn Ala Ile Ala Ser Gly Asp Val Asp Val Val Ala20 25 30Val Asn Asp Pro Phe Ile Glu Thr His Tyr Ala Ala Tyr Met Leu Lys35 40 45Tyr Asp Ser Thr His Gly Arg Phe Gln Gly Thr Ile Glu Thr Tyr Asp50 55 60Glu Gly Leu Ile Val Asn Gly Lys Lys Ile Arg Phe Phe Ala Glu Arg65 70 75 80Asp Pro Ala Ala Ile Pro Trp Gly Ser Ala Gly Ala Ala Tyr Ile Val85 90 95Glu Ser Thr Gly Val Phe Thr Thr Thr Glu Lys Ala Ser Ala His Leu100 105 110Lys Gly Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Ala Asp Ala115 120 125
Pro Met Phe Val Met Gly Val Asn Asn Lys Glu Tyr Lys Thr Asp Ile130 135 140Asn Val Leu Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu145 150 155 160Ala Lys Val Ile Asn Asp Asn Phe Gly Leu Val Glu Gly Leu Met Thr165 170 175Thr Val His Ser Tyr Thr Ala Thr Gln Lys Thr Val Asp Ala Pro Ser180 185 190Ala Lys Asp Trp Arg Gly Gly Arg Thr Ala Ala Gln Asn Ile Ile Pro195 200 205Ser Ser Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Ser Leu210 215 220Asn Gly Lys Leu Thr Gly Met Ser Met Arg Val Pro Thr Ala Asn Val225 230 235 240Ser Val Val Asp Leu Thr Cys Arg Thr Glu Lys Ala Val Thr Tyr Glu245 250 255Asp Ile Lys Lys Thr Ile Lys Ala Ala Ser Glu Glu Gly Glu Leu Lys260 265 270Gly Ile Leu Gly Tyr Thr Glu Asp Asp Ile Val Ser Thr Asp Leu Ile275 280 285Gly Asp Ala His Ser Ser Ile Phe Asp Ala Lys Ala Gly Ile Ala Leu290 295 300Asn Glu His Phe Ile Lys Leu Val Ser Trp Tyr Asp Asn Glu Trp Gly305 310 315 320Tyr Ser Arg Arg Val Val Asp Leu Ile Ala Tyr Ile Ser Lys Val Asp325 330 335Gly Gln<210>4
<211>333<212>PRT<213>牙鲆(Genbank编号BAA88638)<400>4Met Val Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu Val1 5 10 15Thr Arg Ala Ala Phe Thr Ser Lys Lys Val Glu Ile Val Ala Ile Asn20 25 30Asp Pro Phe Ile Asp Leu Glu Tyr Met Val Tyr Met Phe Lys Tyr Asp35 40 45Ser Thr His Gly Arg Phe Lys Gly Glu Val Lys Ile Glu Gly Asp Lys50 55 60Leu Val Ile Asp Gly His Lys Ile Thr Val Phe His Glu Arg Asp Pro65 70 75 80Thr Asn Ile Lys Trp Gly Asp Ala Gly Ala His Tyr Val Val Glu Ser85 90 95Thr Gly Val Phe Thr Thr Ile Glu Lys Ala Ser Ala His Leu Lys Gly100 105 110Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Ala Asp Ala Pro Met115 120 125Phe Val Met Gly Val Asn His Glu Lys Tyr Asp Lys Ser Leu Gln Val130 135 140Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys145 150 155 160Val Ile Asn Asp Asn Phe Gly Ile Ile Glu Gly Leu Met Ser Thr Val165 170 175His Ala Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser Gly Lys180 185 190Leu Trp Arg Asp Gly Arg Gly Ala Ser Gln Asn Ile Ile Pro Ala Ser195 200 205
Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Glu Leu Asn Gly210 215 220Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val225 230 235 240Val Asp Leu Thr Val Arg Leu Glu Lys Pro Ala Ser Tyr Glu Asn Ile245 250 255Lys Lys Val Val Lys Ala Ala Ala Glu Gly Pro Met Lys Gly Tyr Leu260 265 270Ala Tyr Thr Glu His Gln Val Val Ser Thr Asp Phe Asn Gly Asp Thr275 280 285His Ser Ser Ile Phe Asp Ala Gly Ala Gly Ile Ala Leu Asn Asp His290 295 300Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Phe Ala Tyr Ser Asn305 310 315 320Arg Val Cys Asp Leu Met Ala His Met Ala Ser Lys Glu325 330<210>5<211>333<212>PRT<213>非洲爪蟾(Genbank编号P51469)<400>5Met Val Lys Val Gly Ile Asn Gly Phe Gly Cys Ile Gly Arg Leu Val1 5 10 15Thr Arg Ala Ala Phe Asp Ser Gly Lys Val Gln Val Val Ala Ile Asn20 25 30Asp Pro Phe Ile Asp Leu Asp Tyr Met Val Tyr Met Phe Lys Tyr Asp35 40 45Ser Thr His Gly Arg Phe Lys Gly Thr Val Lys Ala Glu Asn Gly Lys50 55 60Leu Ile Ile Asn Asp Gln Val Ile Thr Val Phe Gln Glu Arg Asp Pro65 70 75 80
Ser Ser Ile Lys Trp Gly Asp Ala Gly Ala Val Tyr Val Val Glu Ser85 90 95Thr Gly Val Phe Thr Thr Thr Glu Lys Ala Ser Leu His Leu Lys Gly100 105 110Gly Ala Lys Arg Val Val Ile Ser Ala Pro Ser Ala Asp Ala Pro Met115 120 125Phe Val Val Gly Val Asn His Glu Lys Tyr Glu Asn Ser Leu Lys Val130 135 140Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys145 150 155 160Val Ile Asn Asp Asn Phe Gly Ile Val Glu Gly Leu Met Thr Thr Val165 170 175His Ala Phe Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser Gly Lys180 185 190Leu Trp Arg Asp Gly Arg Gly Ala Gly Gln Asn Ile Ile Pro Ala Ser195 200 205Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Glu Leu Asn Gly210 215 220Lys Ile Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val225 230 235 240Val Asp Leu Thr Cys Arg Leu Gln Lys Pro Ala Lys Tyr Asp Asp Ile245 250 255Lys Ala Ala Ile Lys Thr Ala Ser Glu Gly Pro Met Lys Gly Ile Leu260 265 270Gly Tyr Thr Gln Asp Gln Val Val Ser Thr Asp Phe Asn Gly Asp Thr275 280 285His Ser Ser Ile Phe Asp Ala Asp Ala Gly Ile Ala Leu Asn Glu Asn290 295 300Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Cys Gly Tyr Ser Asn
305 310 315 320Arg Val Val Asp Leu Val Cys His Met Ala Ser Lys Glu325 330<210>6<211>333<212>PRT<213>原鸡(Genbank编号DECHG3)<400>6Met Val Lys Val Gly Val Asn Gly Phe Gly Arg Ile Gly Arg Leu Val1 5 10 15Thr Arg Ala Ala Val Leu Ser Gly Lys Val Gln Val Val Ala Ile Asn20 25 30Asp Pro Phe Ile Asp Leu Asn Tyr Met Val Tyr Met Phe Lys Tyr Asp35 40 45Ser Thr His Gly His Phe Lys Gly Thr Val Lys Ala Glu Asn Gly Lys50 55 60Leu Val Ile Asn Gly His Ala Ile Thr Ile Phe Gln Glu Arg Asp Pro65 70 75 80Ser Asn Ile Lys Trp Ala Asp Ala Gly Ala Glu Tyr Val Val Glu Ser85 90 95Thr Gly Val Phe Thr Thr Met Glu Lys Ala Gly Ala His Leu Lys Gly100 105 110Gly Ala Lys Arg Val Ile Ile Ser Ala Pro Ser Ala Asp Ala Pro Met115 120 125Phe Val Met Gly Val Asn His Glu Lys Tyr Asp Lys Ser Leu Lys Ile130 135 140Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys145 150 155 160Val Ile His Asp Asn Phe Gly Ile Val Glu Gly Leu Met Thr Thr Val165 170 175
His Ala Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser Gly Lys180 185 190Leu Trp Arg Asp Gly Arg Gly Ala Ala Gln Asn Ile Ile Pro Ala Ser195 200 205Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Glu Leu Asn Gly210 215 220Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val225 230 235 240Val Asp Leu Thr Cys Arg Leu Glu Lys Pro Ala Lys Tyr Asp Asp Ile245 250 255Lys Arg Val Val Lys Ala Ala Ala Asp Gly Pro Leu Lys Gly Ile Leu260 265 270Gly Tyr Thr Glu Asp Gln Val Val Ser Cys Asp Phe Asn Gly Asp Ser275 280 285His Ser Ser Thr Phe Asp Ala Gly Ala Gly Ile Ala Leu Asn Asp His290 295 300Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Phe Gly Tyr Ser Asn305 310 315 320Arg Val Val Asp Leu Met Val His Met Ala Ser Lys Glu325 330<210>7<211>7<212>PRT<213>人工序列<220>
<223>GPD中的保守蛋白基序<400>7Lys Tyr Asp Ser Thr His Gly1 5<210>8<211>7<212>PRT<213>人工序列
<220>
<223>GPD内的保守蛋白基序<400>8Thr Gly Ala Ala Lys Ala Val1 5<210>9<211>20<212>DNA<213>人工序列<220>
<223>简并引物YL193<400>9aagtacgayt cbacycaygg20<210>10<211>20<212>DNA<213>人工序列<220>
<223>简并引物YL194<400>10acrgccttrg crgcdccrgt20<210>11<211>507<212>DNA<213>解脂耶氏酵母<400>11aagtacgact ccacccacgg ccgattcaag ggcaaggtcg aggccaagga cggcggtctg60atcatcgacg gcaagcacat ccaggtcttc ggtgagcgag acccctccaa catcccctgg120ggtaaggccg gtgccgacta cgttgtcgag tccaccggtg tcttcaccgg caaggaggct180gcctccgccc acctcaaggg tggtgccaag aaggtcatca tctccgcccc ctccggtgac240gcccccatgt tcgttgtcgg tgtcaacctc gacgcctaca agcccgacat gaccgtcatc300tccaacgctt cttgtaccac caactgtctg gctccccttg ccaaggttgt caacgacaag360tacggaatca ttgagggtct catgaccacc gtccactcca tcaccgccac ccagaagacc420gttgacggtc cttcccacaa ggactggcga ggtggccgaa ccgcctctgg taacatcatc480ccctcttcca ccggagccgc caaggct507
<210>12<211>169<212>PRT<213>解脂耶氏酵母<400>12Lys Tyr Asp Ser Thr His Gly Arg Phe Lys Gly Lys Val Glu Ala Lys1 5 10 15Asp Gly Gly Leu Ile Ile Asp Gly Lys His Ile Gln Val Phe Gly Glu20 25 30Arg Asp Pro Ser Asn Ile Pro Trp Gly Lys Ala Gly Ala Asp Tyr Val35 40 45Val Glu Ser Thr Gly Val Phe Thr Gly Lys Glu Ala Ala Ser Ala His50 55 60Leu Lys Gly Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Gly Asp65 70 75 80Ala Pro Met Phe Val Val Gly Val Asn Leu Asp Ala Tyr Lys Pro Asp85 90 95Met Thr Val Ile Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro100 105 110Leu Ala Lys Val Val Asn Asp Lys Tyr Gly Ile Ile Glu Gly Leu Met115 120 125Thr Thr Val His Ser Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro130 135 140Ser His Lys Asp Trp Arg Gly Gly Arg Thr Ala Ser Gly Asn Ile Ile145 150 155 160Pro Ser Ser Thr Gly Ala Ala Lys Ala165<210>13<211>245<212>PRT<213>酿酒酵母(GenBank Accesssion No.NP_012770)<400>13
Met Pro Lys Leu Val Leu Val Arg His Gly Gln Ser Glu Trp Asn Glu1 5 10 15Lys Asn Leu Phe Thr Gly Trp Val Asp Val Lys Leu Ser Ala Lys Gly20 25 30Gln Gln Glu Ala Ala Arg Ala Gly Glu Leu Leu Lys Glu Lys Lys Val35 40 45Tyr Pro Asp Val Leu Tyr Thr Ser Lys Leu Ser Arg Ala Ile Gln Thr50 55 60Ala Asn Ile Ala Leu Glu Lys Ala Asp Arg Leu Trp Ile Pro Val Asn65 70 75 80Arg Ser Trp Arg Leu Asn Glu Arg His Tyr Gly Asp Leu Gln Gly Lys85 90 95Asp Lys Ala Glu Thr Leu Lys Lys Phe Gly Glu Glu Lys Phe Asn Thr100 105 110Tyr Arg Arg Ser Phe Asp Val Pro Pro Pro Pro Ile Asp Ala Ser Ser115 120 125Pro Phe Ser Gln Lys Gly Asp Glu Arg Tyr Lys Tyr Val Asp Pro Asn130 135 140Val Leu Pro Glu Thr Glu Ser Leu Ala Leu Val Ile Asp Arg Leu Leu145 150 155 160Pro Tyr Trp Gln Asp Val Ile Ala Lys Asp Leu Leu Ser Gly Lys Thr165 170 175Val Met Ile Ala Ala His Gly Asn Ser Leu Arg Gly Leu Val Lys His180 185 190Leu Glu Gly Ile Ser Asp Ala Asp Ile Ala Lys Leu Asn Ile Pro Thr195 200 205Gly Ile Pro Leu Val Phe Glu Leu Asp Glu Asn Leu Lys Pro Ser Lys210 215 220Pro Ser Tyr Tyr Leu Asp Pro Glu Ala Ala Ala Ala Gly Ala Ala Ala
225 230 235 240Val Ala Asn Gln Gly245<210>14<211>1049<212>DNA<213>解脂耶氏酵母<220>
<221>综合特征<222>(1020)..(1020)<223>n为a、c、g、或t<400>14caattgagtg cgagcgacac aattgggtgt cacgtgccyt aattgacctc ggatcgtgga60gyccccagtt atacagcaac cacgaggtgc atgagtagga gacgtcmcca gacaataggg120tttttttgga ctggagaggg tagggcaaaa gcgctcaacg ggctgtttgg ggagctatgg180gggaggaatt ggcgatattt gtgaggttga cggctccgat ttgcgtgttt tgtcgcttct240gcatctcccc atacccatat cttccctccc cacctctttc cacgataatt ttacggatca300gcaataaggt tccttctcct agtttccacg yccatatata tctatgctgc gtcgtccttt360tcgtgacatc accaaaacac atacaaaaat gcctaaactg attctgctgc gacacggcca420gtccgactgg aacgagaaga acctgttcac cggatgggtc gacgtcaagt ctccgagctc480ggccacaccg aggccaagcg agccggtact ctgctcaagg agtccggtct caagccccag540attctctaca cctccgagct ctctcgagcc atccagaccg ccaacattgc tctggatgag600gccgaccgac tgtggatccc caccaagcga tcgtggcgac tcaacgagcg acactacggc660gctctgcagg gcaaggacaa ggccgccact ctcgccgagt acggccccga gcagttccag720ctctggcgac gatcttttga cgtccctcct ccccctatcg ctgacgacga caagtggtct780cagtacaacg acgagcgata ccaggacatc cccaaggata ttctgcccaa gaccgagtct840ctgaagctcg tgattgaccg actccttcct tactacaact ccgacattgt ccccgacctt900aaggccggca agaccgtcct cattgctgcc cacggaaact ccctccgagc tctcgtcaag960cacctcgacg gtatctccga tgacgatatc gccgccctta acatccccac cggtatcccn1020ctcgtgctac gaccttgatg acaacctca 1049<210>15<211>651
<212>DNA<213>解脂耶氏酵母<220>
<221>综合特征<222>(633)..(633)<223>n为a、c、g、或t<400>15atgcctaaac tgattctgct gcgacacggc cagtccgact ggaacgagaa gaacctgttc60accggatggg tcgacgtcaa gctctccgag ctcggccaca ccgaggccaa gcgagccggt120actctgctca aggagtccgg tctcaagccc cagattctct acacctccga gctctctcga180gccatccaga ccgccaacat tgctctggat gaggccgacc gactgtggat ccccaccaag240cgatcgtggc gactcaacga gcgacactac ggcgctctgc agggcaagga caaggccgcc300actctcgccg agtacggccc cgagcagttc cagctctggc gacgatcttt tgacgtccct360cctcccccta tcgctgacga cgacaagtgg tctcagtaca acgacgagcg ataccaggac420atccccaagg atattctgcc caagaccgag tctctgaagc tcgtgattga ccgactcctt480ccttactaca actccgacat tgtccccgac cttaaggccg gcaagaccgt cctcattgct540gcccacggaa actccctccg agctctcgtc aagcacctcg acggtatctc cgatgacgat600atcgccgccc ttaacatccc caccggtatc ccnctcgtgc tacgaccttg a 651<210>16<211>216<212>PRT<213>解脂耶氏酵母<400>16Met Pro Lys Leu Ile Leu Leu Arg His Gly Gln Ser Asp Trp Asn Glu1 5 10 15Lys Asn Leu Phe Thr Gly Trp Val Asp Val Lys Leu Ser Glu Leu Gly20 25 30His Thr Glu Ala Lys Arg Ala Gly Thr Leu Leu Lys Glu Ser Gly Leu35 40 45Lys Pro Gln Ile Leu Tyr Thr Ser Glu Leu Ser Arg Ala Ile Gln Thr50 55 60Ala Asn Ile Ala Leu Asp Glu Ala Asp Arg Leu Trp Ile Pro Thr Lys65 70 75 80
Arg Ser Trp Arg Leu Asn Glu Arg His Tyr Gly Ala Leu Gln Gly Lys85 90 95Asp Lys Ala Ala Thr Leu Ala Glu Tyr Gly Pro Glu Gln Phe Gln Leu100 105 110Trp Arg Arg Ser Phe Asp Val Pro Pro Pro Pro Ile Ala Asp Asp Asp115 120 125Lys Trp Ser Gln Tyr Asn Asp Glu Arg Tyr Gln Asp Ile Pro Lys Asp130 135 140Ile Leu Pro Lys Thr Glu Ser Leu Lys Leu Val Ile Asp Arg Leu Leu145 150 155 160Pro Tyr Tyr Asn Ser Asp Ile Val Pro Asp Leu Lys Ala Gly Lys Thr165 170 175Val Leu Ile Ala Ala His Gly Asn Ser Leu Arg Ala Leu Val Lys His180 185 190Leu Asp Gly Ile Ser Asp Asp Asp Ile Ala Ala Leu Asn Ile Pro Thr195 200 205Gly Ile Pro Leu Val Leu Arg Pro210 215<210>17<211>26<212>DNA<213>人工序列<220>
<223>引物YL206<400>17ccttgccggt gaagacaccg gtggac 26<210>18<211>25<212>DNA<213>人工序列<220>
<223>引物YL196
<400>18gacgtcgacc catccggtga acagg 25<210>19<211>28<212>DNA<213>人工序列<220>
<223>引物YL207<400>19gaagacctgg atgtgcttgc cgtcgatg 28<210>20<211>23<212>DNA<213>人工序列<220>
<223>引物YL197<400>20gagcagagta ccggctcgct tgg23<210>21<211>24<212>DNA<213>人工序列<220>
<223>引物YL208<400>21gaccttgccc ttgaatcggc cgtg 24<210>22<211>25<212>DNA<213>人工序列<220>
<223>引物YL198<400>22gaatctgggg cttgagaccg gactc 25<210>23<211>1848<212>DNA<213>解脂耶氏酵母<400>23
gtgattgcct ctgaatactt tcaacaagtt acacccttcg cggcgacgat ctacagcccg60atcacatgaa ctttggccga gggatgatgt aatcgagtat cgtggtagtt caatacgtac120atgtacgatg ggtgcctcaa ttgtgcgata ctactacaag tgcagcacgc tcgtgcccgt180accctacttt gtcggacgtc cctgctccct cgttcaacat ctcaagctca acaatcagtg240ttggacactg caacgctagc agccggtacg tggctttagc cccatgctcc atgctccatg300ctccatgctc tgggcctatg agctagccgt ttggcgcaca tagcatagtg acatgtcgat360caagtcaaag tcgaggtgtg gaaaacgggc tgcgggtcgc caggggcctc acaagcgcct420ccaccgcaga cgcccacctc gttagcgtcc attgcgatcg tctcggtaca tttggttaca480ttttgcgaca ggttgaaatg aatcggccga cgctcggtag tcggaaagag ccgggaccgg540ccggcgagca taaaccggac gcagtaggat gtcctgcacg ggtctttttg tggggtgtgg600agaaaggggt gcttggagat ggaagccggt agaaccgggc tgcttgtgct tggagatgga660agccggtaga accgggctgc ttggggggat ttggggccgc tgggctccaa agaggggtag720gcatttcgtt ggggttacgt aattgcggca tttgggtcct gcgcgcatgt cccattggtc780agaattagtc cggataggag acttatcagc caatcacagc gccggatcca cctgtaggtt840gggttgggtg ggagcacccc tccacagagt agagtcaaac agcagcagca acatgatagt900tgggggtgtg cgtgttaaag gaaaaaaaag aagcttgggt tatattcccg ctctatttag960aggttgcggg atagacgccg acggagggca atggcgccat ggaaccttgc ggatatcgat1020acgccgcggc ggactgcgtc cgaaccagct ccagcagcgt tttttccggg ccattgagcc1080gactgcgacc ccgccaacgt gtcttggccc acgcactcat gtcatgttgg tgttgggagg1140ccacttttta agtagcacaa ggcacctagc tcgcagcaag gtgtccgaac caaagaagcg1200gctgcagtgg tgcaaacggg gcggaaacgg cgggaaaaag ccacgggggc acgaattgag1260gcacgccctc gaatttgaga cgagtcacgg ccccattcgc ccgcgcaatg gctcgccaac1320gcccggtctt ttgcaccaca tcaggttacc ccaagccaaa cctttgtgtt aaaaagctta1380acatattata ccgaacgtag gtttgggcgg gcttgctccg tctgtccaag gcaacattta1440tataagggtc tgcatcgccg gctcaattga atcttttttc ttcttctctt ctctatattc1500attcttgaat taaacacaca tcaacatggc catcaaagtc ggtattaacg gattcgggcg1560aatcggacga attgtgagta ccatagaagg tgatggaaac atgacccaac agaaacagat1620gacaagtgtc atcgacccac cagagcccaa ttgagctcat actaacagtc gacaacctgt1680cgaaccaatt gatgactccc cgacaatgta ctaacacagg tcctgcgaaa cgctctcaag1740
aaccctgagg tcgaggtcgt cgctgtgaac gaccccttca tcgacaccga gtacgctgct1800tacatgttca agtacgactc cacccacggc cgattcaagg gcaaggtc 1848<210>24<211>2316<212>DNA<213>解脂耶氏酵母<400>24gtgattgcct ctgaatactt tcaacaagtt acacccttcg cggcgacgat ctacagcccg60atcacatgaa ctttggccga gggatgatgt aatcgagtat cgtggtagtt caatacgtac120atgtacgatg ggtgcctcaa ttgtgcgata ctactacaag tgcagcacgc tcgtgcccgt180accctacttt gtcggacgtc cctgctccct cgttcaacat ctcaagctca acaatcagtg240ttggacactg caacgctagc agccggtacg tggctttagc cccatgctcc atgctccatg300ctccatgctc tgggcctatg agctagccgt ttggcgcaca tagcatagtg acatgtcgat360caagtcaaag tcgaggtgtg gaaaacgggc tgcgggtcgc caggggcctc acaagcgcct420ccaccgcaga cgcccacctc gttagcgtcc attgcgatcg tctcggtaca tttggttaca480ttttgcgaca ggttgaaatg aatcggccga cgctcggtag tcggaaagag ccgggaccgg540ccggcgagca taaaccggac gcagtaggat gtcctgcacg ggtctttttg tggggtgtgg600agaaaggggt gcttggagat ggaagccggt agaaccgggc tgcttgtgct tggagatgga660agccggtaga accgggctgc ttggggggat ttggggccgc tgggctccaa agaggggtag720gcatttcgtt ggggttacgt aattgcggca tttgggtcct gcgcgcatgt cccattggtc780agaattagtc cggataggag acttatcagc caatcacagc gccggatcca cctgtaggtt840gggttgggtg ggagcacccc tccacagagt agagtcaaac agcagcagca acatgatagt900tgggggtgtg cgtgttaaag gaaaaaaaag aagcttgggt tatattcccg ctctatttag960aggttgcggg atagacgccg acggagggca atggcgccat ggaaccttgc ggatatcgat1020acgccgcggc ggactgcgtc cgaaccagct ccagcagcgt tttttccggg ccattgagcc1080gactgcgacc ccgccaacgt gtcttggccc acgcactcat gtcatgttgg tgttgggagg1140ccacttttta agtagcacaa ggcacctagc tcgcagcaag gtgtccgaac caaagaagcg1200gctgcagtgg tgcaaacggg gcggaaacgg cgggaaaaag ccacgggggc acgaattgag1260gcacgccctc gaatttgaga cgagtcacgg ccccattcgc ccgcgcaatg gctcgccaac1320gcccggtctt ttgcaccaca tcaggttacc ccaagccaaa cctttgtgtt aaaaagctta1380acatattata ccgaacgtag gtttgggcgg gcttgctccg tctgtccaag gcaacattta1440
tataagggtc tgcatcgccg gctcaattga atcttttttc ttcttctctt ctctatattc1500attcttgaat taaacacaca tcaacatggc catcaaagtc ggtattaacg gattcgggcg1560aatcggacga attgtgagta ccatagaagg tgatggaaac atgacccaac agaaacagat1620gacaagtgtc atcgacccac cagagcccaa ttgagctcat actaacagtc gacaacctgt1680cgaaccaatt gatgactccc cgacaatgta ctaacacagg tcctgcgaaa cgctctcaag1740aaccctgagg tcgaggtcgt cgctgtgaac gaccccttca tcgacaccga gtacgctgct1800tacatgttca agtacgactc cacccacggc cgattcaagg gcaaggtcga ggccaaggac1860ggcggtctga tcatcgacgg caagcacatc caggtcttcg gtgagcgaga cccctccaac1920atcccctggg gtaaggccgg tgccgactac gttgtcgagt ccaccggtgt cttcaccggc1980aaggaggctg cctccgccca cctcaagggt ggtgccaaga aggtcatcat ctccgccccc2040tccggtgacg cccccatgtt cgttgtcggt gtcaacctcg acgcctacaa gcccgacatg2100accgtcatct ccaacgcttc ttgtaccacc aactgtctgg ctccccttgc caaggttgtc2160aacgacaagt acggaatcat tgagggtctc atgaccaccg tccactccat caccgccacc2220cagaagaccg ttgacggtcc ttcccacaag gactggcgag gtggccgaac cgcctctggt2280aacatcatcc cctcttccac cggagccgcc aaggct 2316<210>25<211>645<212>DNA<213>解脂耶氏酵母<400>25atggccatca aagtcggtat taacggattc gggcgaatcg gacgaattgt cctgcgaaac60gctctcaaga accctgaggt cgaggtcgtc gctgtgaacg accccttcat cgacaccgag120tacgctgctt acatgttcaa gtacgactcc acccacggcc gattcaaggg caaggtcgag180gccaaggacg gcggtctgat catcgacggc aagcacatcc aggtcttcgg tgagcgagac240ccctccaaca tcccctgggg taaggccggt gccgactacg ttgtcgagtc caccggtgtc300ttcaccggca aggaggctgc ctccgcccac ctcaagggtg gtgccaagaa ggtcatcatc360tccgccccct ccggtgacgc ccccatgttc gttgtcggtg tcaacctcga cgcctacaag420cccgacatga ccgtcatctc caacgcttct tgtaccacca actgtctggc tccccttgcc480aaggttgtca acgacaagta cggaatcatt gagggtctca tgaccaccgt ccactccatc540accgccaccc agaagaccgt tgacggtcct tcccacaagg actggcgagg tggccgaacc600
gcctctggta acatcatccc ctcttccacc ggagccgcca aggct645<210>26<211>215<212>PRT<213>解脂耶氏酵母<400>26Met Ala Ile Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg Ile1 5 10 15Val Leu Arg Asn Ala Leu Lys Asn Pro Glu Val Glu Val Val Ala Val20 25 30Asn Asp Pro Phe Ile Asp Thr Glu Tyr Ala Ala Tyr Met Phe Lys Tyr35 40 45Asp Ser Thr His Gly Arg Phe Lys Gly Lys Val Glu Ala Lys Asp Gly50 55 60Gly Leu Ile Ile Asp Gly Lys His Ile Gln Val Phe Gly Glu Arg Asp65 70 75 80Pro Ser Asn Ile Pro Trp Gly Lys Ala Gly Ala Asp Tyr Val Val Glu85 90 95Ser Thr Gly Val Phe Thr Gly Lys Glu Ala Ala Ser Ala His Leu Lys100 105 110Gly Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Gly Asp Ala Pro115 120 125Met Phe Val Val Gly Val Asn Leu Asp Ala Tyr Lys Pro Asp Met Thr130 135 140Val Ile Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala145 150 155 160Lys Val Val Asn Asp Lys Tyr Gly Ile Ile Glu Gly Leu Met Thr Thr165 170 175Val His Ser Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser His180 185 190
Lys Asp Trp Arg Gly Gly Arg Thr Ala Ser Gly Asn Ile Ile Pro Ser195 200 205Ser Thr Gly Ala Ala Lys Ala210 215<210>27<211>953<212>DNA<213>解脂耶氏酵母<400>27gcctctgaat actttcaaca agttacaccc ttcattaatt ctcacgtgac acagattatt60aacgtctcgt accaaccaca gattacgacc cattcgcagt cacagttcac tagggtttgg120gttgcatccg ttgagagcgg tttgttttta accttctcca tgtgctcact caggttttgg180gttcagatca aatcaaggcg tgaaccactt tgtttgagga caaatgtgac acaaccaacc240agtgtcaggg gcaagtccgt gacaaagggg aagatacaat gcaattactg acagttacag300actgcctcga tgccctaacc ttgccccaaa ataagacaac tgtcctcgtt taagcgcaac360cctattcagc gtcacgtcat aatagcgttt ggatagcact agtctatgag gagcgtttta420tgttgcggtg agggcgattg gtgctcatat gggttcaatt gaggtggcgg aacgagctta480gtcttcaatt gaggtgcgag cgacacaatt gggtgtcacg tggcctaatt gacctcgggt540cgtggagtcc ccagttatac agcaaccacg aggtgcatgg gtaggagacg tcaccagaca600atagggtttt ttttggactg gagagggttg ggcaaaagcg ctcaacgggc tgtttgggga660gctgtggggg aggaattggc gatatttgtg aggttaacgg ctccgatttg cgtgttttgt720cgctcctgca tctccccata cccatatctt ccctccccac ctctttccac gataatttta780cggatcagca ataaggttcc ttctcctagt ttccacgtcc atatatatct atgctgcgtc840gtccttttcg tgacatcacc aaaacacata caaaaatgcc taaactgatt ctgctgcgac900acggccagtc cgactggaac gagaagaacc tgttcaccgg atgggtcgac gtc 953<210>28<211>1537<212>DNA<213>解脂耶氏酵母<220>
<221>综合特征<222>(1507)..(1507)<223>n为a、c、g、或t
<400>28gcctctgaat actttcaaca agttacaccc ttcattaatt ctcacgtgac acagattatt60aacgtctcgt accaaccaca gattacgacc cattcgcagt cacagttcac tagggtttgg120gttgcatccg ttgagagcgg tttgttttta accttctcca tgtgctcact caggttttgg180gttcagatca aatcaaggcg tgaaccactt tgtttgagga caaatgtgac acaaccaacc240agtgtcaggg gcaagtccgt gacaaagggg aagatacaat gcaattactg acagttacag300actgcctcga tgccctaacc ttgccccaaa ataagacaac tgtcctcgtt taagcgcaac360cctattcagc gtcacgtcat aatagcgttt ggatagcact agtctatgag gagcgtttta420tgttgcggtg agggcgattg gtgctcatat gggttcaatt gaggtggcgg aacgagctta480gtcttcaatt gaggtgcgag cgacacaatt gggtgtcacg tggcctaatt gacctcgggt540cgtggagtcc ccagttatac agcaaccacg aggtgcatgg gtaggagacg tcaccagaca600atagggtttt ttttggactg gagagggttg ggcaaaagcg ctcaacgggc tgtttgggga660gctgtggggg aggaattggc gatatttgtg aggttaacgg ctccgatttg cgtgttttgt720cgctcctgca tctccccata cccatatctt ccctccccac ctctttccac gataatttta780cggatcagca ataaggttcc ttctcctagt ttccacgtcc atatatatct atgctgcgtc840gtccttttcg tgacatcacc aaaacacata caaaaatgcc taaactgatt ctgctgcgac900acggccagtc cgactggaac gagaagacct gttcaccgga tgggtcgacg tcaagctctc960cgagctcggc cacaccgagg ccaagcgagc cggtactctg ctcaaggagt ccggtctcaa1020gccccagatt ctctacacct ccgagctctc tcgagccatc cagaccgcca acattgctct1080ggatgaggcc gaccgactgt ggatccccac caagcgatcg tggcgactca acgagcgaca1140ctacggcgct ctgcagggca aggacaaggc cgccactctc gccgagtacg gccccgagca1200gttccagctc tggcgacgat cttttgacgt ccctcctccc cctatcgctg acgacgacaa1260gtggtctcag tacaacgacg agcgatacca ggacatcccc aaggatattc tgcccaagac1320cgagtctctg aagctcgtga ttgaccgact ccttccttac tacaactccg acattgtccc1380cgaccttaag gccggcaaga ccgtcctcat tgctgcccac ggaaactccc tccgagctct1440cgtcaagcac ctcgacggta tctccgatga cgatatcgcc gcccttaaca tccccaccgg1500tatcccnctc gtgctacgac cttgatgaca acctcaa 1537<210>29<211>33<212>DNA<213>人工序列
<220>
<223>引物YL33<400>29tttccatggt acgtcctgta gaaaccccaa ccc 33<210>30<211>36<212>DNA<213>人工序列<220>
<223>引物YL34<400>30cccttaatta atcattgttt gcctccctgc tgcggt 36<210>31<211>19<212>DNA<213>人工序列<220>
<223>引物TEF5’<400>31agagaccggg ttggcggcg 19<210>32<211>30<212>DNA<213>人工序列<220>
<223>引物TEF3’<400>32ttggatcctt tgaatgattc ttatactcag 30<210>33<211>29<212>DNA<213>人工序列<220>
<223>引物XPR5’<400>33tttccgcggc ccgagattcc ggcctcttc 29<210>34<211>31
<212>DNA<213>人工序列<220>
<223>引物XPR3’<400>34tttccgcgga cacaatatct ggtcaaattt c 31<210>35<211>30<212>DNA<213>人工序列<220>
<223>引物YL1<400>35cagtgccaaa agccaaggca ctgagctcgt 30<210>36<211>31<212>DNA<213>人工序列<220>
<223>引物YL2<400>36gacgagctca gtgccttggc ttttggcact g 31<210>37<211>36<212>DNA<213>人工序列<220>
<223>引物YL3<400>37gtataagaat cattcaccat ggatccacta gttcta 36<210>38<211>36<212>DNA<213>人工序列<220>
<223>引物YL4<400>38tagaactagt ggatccatgg tgaatgattc ttatac 36
<210>39<211>36<212>DNA<213>人工序列<220>
<223>引物YL23<400>39atggatccac tagttaatta actagagcgg ccgcca 36<210>40<211>36<212>DNA<213>人工序列<220>
<223>引物YL24<400>40tggcggccgc tctagttaat taactagtgg atccat 36<210>41<211>35<212>DNA<213>人工序列<220>
<223>引物YL9<400>41tggtaaataa atgatgtcga ctcaggcgac gacgg 35<210>42<211>35<212>DNA<213>人工序列<220>
<223>引物YL10<400>42ccgtcgtcgc ctgagtcgac atcatttatt tacca 35<210>43<211>971<212>DNA<213>解脂耶氏酵母<400>43gacgcagtag gatgtcctgc acgggtcttt ttgtggggtg tggagaaagg ggtgcttgga60gatggaagcc ggtagaaccg ggctgcttgt gcttggagat ggaagccggt agaaccgggc120
tgcttggggg gatttggggc cgctgggctc caaagagggg taggcatttc gttggggtta180cgtaattgcg gcatttgggt cctgcgcgca tgtcccattg gtcagaatta gtccggatag240gagacttatc agccaatcac agcgccggat ccacctgtag gttgggttgg gtgggagcac300ccctccacag agtagagtca aacagcagca gcaacatgat agttgggggt gtgcgtgtta360aaggaaaaaa aagaagcttg ggttatattc ccgctctatt tagaggttgc gggatagacg420ccgacggagg gcaatggcgc catggaacct tgcggatatc gatacgccgc ggcggactgc480gtccgaacca gctccagcag cgttttttcc gggccattga gccgactgcg accccgccaa540cgtgtcttgg cccacgcact catgtcatgt tggtgttggg aggccacttt ttaagtagca600caaggcacct agctcgcagc aaggtgtccg aaccaaagaa gcggctgcag tggtgcaaac660ggggcggaaa cggcgggaaa aagccacggg ggcacgaatt gaggcacgcc ctcgaatttg720agacgagtca cggccccatt cgcccgcgca atggctcgcc aacgcccggt cttttgcacc780acatcaggtt accccaagcc aaacctttgt gttaaaa gc ttaacatatt ataccgaacg840taggtttggg cgggcttgct ccgtctgtcc aaggcaacat ttatataagg gtctgcatcg900ccggctcaat tgaatctttt ttcttcttct cttctctata ttcattcttg aattaaacac960acatcaacat g 971<210>44<211>878<212>DNA<213>解脂耶氏酵母<400>44gcctctgaat actttcaaca agttacaccc ttcattaatt ctcacgtgac acagattatt60aacgtctcgt accaaccaca gattacgacc cattcgcagt cacagttcac tagggtttgg120gttgcatccg ttgagagcgg tttgttttta accttctcca tgtgctcact caggttttgg180gttcagatca aatcaaggcg tgaaccactt tgtttgagga caaatgtgac acaaccaacc240agtgtcaggg gcaagtccgt gacaaagggg aagatacaat gcaattactg acagttacag300actgcctcga tgccctaacc ttgccccaaa ataagacaac tgtcctcgtt taagcgcaac360cctattcagc gtcacgtcat aatagcgttt ggatagcact agtctatgag gagcgtttta420tgttgcggtg agggcgattg gtgctcatat gggttcaatt gaggtggcgg aacgagctta480gtcttcaatt gaggtgcgag cgacacaatt gggtgtcacg tggcctaatt gacctcgggt540cgtggagtcc ccagttatac agcaaccacg aggtgcatgg gtaggagacg tcaccagaca600atagggtttt ttttggactg gagagggttg ggcaaaagcg ctcaacgggc tgtttgggga660
gctgtggggg aggaattggc gatatttgtg aggttaacgg ctccgatttg cgtgttttgt720cgctcctgca tctccccata cccatatctt ccctccccac ctctttccac gataatttta780cggatcagca ataaggttcc ttctcctagt ttccacgtcc atatatatct atgctgcgtc840gtccttttcg tgacatcacc aaaacacata caaaaatg878<210>45<211>30<212>DNA<213>人工序列<220>
<223>引物YL211<400>45tttgtcgacg cagtaggatg tcctgcacgg 30<210>46<211>34<212>DNA<213>人工序列<220>
<223>引物YL212<400>46tttccatggt tgatgtgtgt ttaattcaag aatg34<210>47<211>33<212>DNA<213>人工序列<220>
<223>引物YL203<400>47tttccatggt tgtatgtgtt ttggtgatgt cac 33<210>48<211>33<212>DNA<213>人工序列<220>
<223>引物YL204<400>48tttgtcgacc gtttaagcgc aaccctattc agc 33
<210>49<211>39<212>DNA<213>人工序列<220>
<223>引物YL5<400>49cccccctcga ggtcgatggt gtcgataagc ttgatatcg 39<210>50<211>39<212>DNA<213>人工序列<220>
<223>引物YL6<400>50cgatatcaag cttatcgaca ccatcgacct cgagggggg 39<210>51<211>37<212>DNA<213>人工序列<220>
<223>引物YL7<400>51caaccgattt cgacagttaa ttaataattt gaatcga 37<210>52<211>37<212>DNA<213>人工序列<220>
<223>引物YL8<400>52tcgattcaaa ttattaatta actgtcgaaa tcggttg 37<210>53<211>33<212>DNA<213>人工序列<220>
<223>引物YL61<400>53acaattccac acaacgtacg agccggaagc ata 33
<210>54<211>33<212>DNA<213>人工序列<220>
<223>引物YL62<400>54tatgcttccg gctcgtacgt tgtgtggaat tgt 33<210>55<211>18<212>DNA<213>人工序列<220>
<223>引物GPD有义<400>55atacgagatc gtcaaggg 18<210>56<211>26<212>DNA<213>人工序列<220>
<223>引物GPD反义<400>56gcggccgcgg attgatgtgt gtttaa 26<210>57<211>1209<212>DNA<213>串珠镰孢<400>57atggcgactc gacagcgaac tgccaccact gttgtggtcg aggaccttcc caaggtcact60cttgaggcca agtctgaacc tgtgttcccc gatatcaaga ccatcaagga tgccattccc120gcgcactgct tccagccctc gctcgtcacc tcattctact acgtcttccg cgattttgcc180atggtctctg ccctcgtctg ggctgctctc acctacatcc ccagcatccc cgaccagacc240ctccgcgtcg cagcttggat ggtctacggc ttcgtccagg gtctgttctg caccggtgtc300tggattctcg gccatgagtg cggccacggt gctttctctc tccacggaaa ggtcaacaat360gtgaccggct ggttcctcca ctcgttcctc ctcgtcccct acttcagctg gaagtactct420
caccaccgcc accaccgctt caccggccac atggatctcg acatggcttt cgtccccaag480actgagccca agccctccaa gtcgctcatg attgctggca ttgacgtcgc cgagcttgtt540gaggacaccc ccgctgctca gatggtcaag ctcatcttcc accagctttt cggatggcag600gcgtacctct tcttcaacgc tagctctggc aagggcagca agcagtggga gcccaagact660ggcctctcca agtggttccg agtcagtcac ttcgagccta ccagcgctgt cttccgcccc720aacgaggcca tcttcatcct catctccgat atcggtcttg ctctaatggg aactgctctg780tactttgctt ccaagcaagt tggtgtttcg accattctct tcctctacct tgttccctac840ctgtgggttc accactggct cgttgccatt acctacctcc accaccacca caccgagctc900cctcactaca ccgctgaggg ctggacctac gtcaagggag ctctcgccac tgtcgaccgt960gagtttggct tcatcggaaa gcacctcttc cacggtatca ttgagaagca cgttgttcac1020catctcttcc ctaagatccc cttctacaag gctgacgagg ccaccgaggc catcaagccc1080gtcattggcg accactactg ccacgacgac cgaagcttcc tgggccagct gtggaccatc1140ttcggcacgc tcaagtacgt cgagcacgac cctgcccgac ccggtgccat gcgatggaac1200aaggactag1209<210>58<211>402<212>PRT<213>串珠镰孢<400>58Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Asp Leu1 5 10 15Pro Lys Val Thr Leu Glu Ala Lys Ser Glu Pro Val Phe Pro Asp Ile20 25 30Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser Leu35 40 45Val Thr Ser Phe Tyr Tyr Val Phe Arg Asp Phe Ala Met Val Ser Ala50 55 60Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Ser Ile Pro Asp Gln Thr65 70 75 80Leu Arg Val Ala Ala Trp Met Val Tyr Gly Phe Val Gln Gly Leu Phe85 90 95
Cys Thr Gly Val Trp Ile Leu Gly His Glu Cys Gly His Gly Ala Phe100 105 110Ser Leu His Gly Lys Val Asn Asn Val Thr Gly Trp Phe Leu His Ser115 120 125Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg His130 135 140His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro Lys145 150 155 160Thr Glu Pro Lys Pro Ser Lys Ser Leu Met Ile Ala Gly Ile Asp Val165 170 175Ala Glu Leu Val Glu Asp Thr Pro Ala Ala Gln Met Val Lys Leu Ile180 185 190Phe His Gln Leu Phe Gly Trp Gln Ala Tyr Leu Phe Phe Asn Ala Ser195 200 205Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Thr Gly Leu Ser Lys210 215 220Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg Pro225 230 235 240Asn Glu Ala Ile Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu Met245 250 255Gly Thr Ala Leu Tyr Phe Ala Ser Lys Gln Val Gly Val Ser Thr Ile260 265 270Leu Phe Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu Val275 280 285Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr Thr290 295 300Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp Arg305 310 315 320
Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu Lys325 330 335His Val Val His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala Asp340 345 350Glu Ala Thr Glu Ala Ile Lys Pro Val Ile Gly Asp His Tyr Cys His355 360 365Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Thr Leu370 375 380Lys Tyr Val Glu His Asp Pro Ala Arg Pro Gly Ala Met Arg Trp Asn385 390 395 400Lys Asp<210>59<211>36<212>DNA<213>人工序列<220>
<223>引物P192<400>59aaatatgcgg ccgcacaatg gcgactcgac agcgaa 36<210>60<211>34<212>DNA<213>人工序列<220>
<223>引物P193<400>60tttatagcgg ccgcctagtc cttgttccat cgca3权利要求
1.在转化的酵母细胞内表达目标编码区的方法,包括a)提供具有嵌合基因的转化的酵母细胞,该嵌合基因含有(i)选自gpm基因和gpd基因的耶氏酵母基因的启动子区;和(ii)可在该酵母细胞内表达的目标编码区;其中的启动子区与目标编码区可操作连接;并b)在表达步骤(a)所述的嵌合基因的条件下培养步骤(a)的转化的酵母细胞。
2.权利要求1的方法,其中耶氏酵母基因分离自解脂耶氏酵母。
3.权利要求1的方法,其中gpm基因的启动子区被包含在选自SEQ ID NO27、SEQ ID NO28和SEQ ID NO44的核酸片段内。
4.权利要求1的方法,其中gpd基因的启动子区被包含在选自SEQID NO23、SEQ ID NO24和SEQ ID NO43的核酸片段内。
5.权利要求3或4的方法,其中所述启动子区含有至少一个突变,该突变并未降低其启动子活性。
6.权利要求5的方法,其中所述启动子活性为野生型启动子活性的至少大约20%到至少大约400%。
7.权利要求1的方法,其中转化的酵母细胞为含油酵母。
8.权利要求7的方法,其中的含油酵母为选自耶氏酵母属、假丝酵母属、红酵母属、红冬孢属、隐球酵母属、丝孢酵母属和油脂酵母属的属的成员。
9.权利要求8的方法,其中的含油酵母选自解脂耶氏酵母ATCC#20362、解脂耶氏酵母ATCC#8862、解脂耶氏酵母ATCC#18944、解脂耶氏酵母ATCC#76982和解脂耶氏酵母LGAMS(7)1。
10.权利要求1的方法,其中所述目标编码区编码选自去饱和酶、延伸酶、氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡聚糖酶、β-葡糖苷酶、转化酶、漆酶、脂酶、甘露糖苷酶、齿斑葡聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶和木聚糖酶的多肽。
11.生成ω-3或ω-6脂肪酸的方法,包括a)提供具有嵌合基因的转化的含油酵母,该嵌合基因含有(i)选自gpm基因和gpd基因的耶氏酵母基因的启动子区;和(ii)编码ω-3/ω-6脂肪酸生物合成途径中的至少一种酶的编码区;其中的启动子区和编码区可操作连接;并b)在表达ω-3/ω-6脂肪生物合成途径的至少一种酶并生成ω-3或ω-6脂肪酸的条件下培养步骤(a)的转化的含油酵母;c)任选地回收ω-3或ω-6脂肪酸。
12.权利要求11的方法,其中的耶氏酵母基因分离自解脂耶氏酵母。
13.权利要求11的方法,其中gpm基因的启动子区被包含在选自SEQ ID NO27、SEQ ID NO28和SEQ ID NO44的核酸片段内。
14.权利要求11的方法,其中gpd基因的启动子区被包含在选自SEQ ID NO23、SEQ ID NO24和SEQ ID NO43的核酸片段内。
15.权利要求11的方法,其中所述目标编码区编码选自去饱和酶和延伸酶的多肽。
16.权利要求15的方法,其中所述去饱和酶选自Δ9去饱和酶、Δ12去饱和酶、Δ6去饱和酶、Δ5去饱和酶、Δ17去饱和酶、Δ15去饱和酶和Δ4去饱和酶。
17.权利要求11的方法,其中所述含油酵母是选自耶氏酵母属、假丝酵母属、红酵母属、红冬孢属、隐球酵母属、丝孢酵母属和油脂酵母属的属的成员。
18.权利要求17的方法,其中所述含油酵母为解脂耶氏酵母。
19.权利要求18的方法,其中所述解脂耶氏酵母为选自解脂耶氏酵母ATCC#20362、解脂耶氏酵母ATCC#8862、解脂耶氏酵母ATCC#18944、解脂耶氏酵母ATCC#76982和解脂耶氏酵母LGAMS(7)1的菌株。
20.权利要求11的方法,其中所述ω-3或ω-6脂肪酸选自亚油酸、α-亚麻酸、γ-亚麻酸、十八碳四烯酸、二同-γ-亚麻酸、二十碳四烯酸、花生四烯酸、二十碳五烯酸、二十二碳五烯酸和二十二碳六烯酸。
21.含有选自SEQ ID NO23、SEQ ID NO24和SEQ ID NO43的gpd启动子的分离核酸分子。
22.含有选自SEQ ID NO27、SEQ ID NO28和SEQ ID NO44的gpm启动子的分离核酸分子。
全文摘要
业已发现与解脂耶氏酵母甘油醛-3-磷酸脱氢酶(gpd)和磷酸甘油酸变位酶(gpm)基因相连的启动子区对含油酵母内的异源基因表达尤其有效。本发明所述启动子区已被证实可驱动参与生成ω-3和ω-6脂肪酸的基因的高水平表达。
文档编号C12N15/74GK1842598SQ200480024629
公开日2006年10月4日 申请日期2004年6月23日 优先权日2003年6月25日
发明者S·K·皮卡塔吉奥, Q·朱 申请人:纳幕尔杜邦公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1