用重组生物体生产1,3-丙二醇的方法

文档序号:550086阅读:689来源:国知局
专利名称:用重组生物体生产1,3-丙二醇的方法
技术领域
本发明涉及分子生物学领域和重组生物体生产所需化合物的用途。更具体地说,本发明描述了甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)的克隆的基因分别表达或一起表达,以提高1,3-丙二醇的产量。
背景1,3-丙二醇是一种在聚酯纤维生产和聚氨酯类和环状化合物的生产中具有潜在用途的单体。
已知有多种化学方法合成1,3-丙二醇。例如,在存在磷化氢、水、一氧化碳、氢和酸的情况下,通过丙烯醛的催化溶液相水合作用、再还原,在催化剂作用下环氧乙烷可以转化成为1,3-丙二醇;或者,在存在一氧化碳和氢的情况下,在含有元素周期表第VIII族原子的催化剂的作用下,由诸如甘油的碳氢化合物发生反应获得1,3-丙二醇。尽管用这些方法可以产生1,3-丙二醇,但是这些方法昂贵,并产生含有环境污染物的废物流。
一个多世纪以来,已知1,3-丙二醇可以由甘油发酵生产。例如在柠檬酸杆菌属(Citrobacter)、梭菌属(Clostridium)、肠杆菌属(Enterobacter)、泥杆菌属(Ilyobactor)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)和栉形杆菌属(Pelobactor)中已经发现能够产生1,3-丙二醇的细菌菌株。在研究的每种情况下,甘油以两步酶催化反应顺序转化为1,3-丙二醇。在第一步中,脱水酶催化甘油转化为3-羟基丙醛(3-HP)和水(反应式1)。在第二步中,通过NAD+联动氧化还原酶将3-HP还原为1,3-丙二醇(反应式2)。
(反应式1)(反应式2)1,3-丙二醇不被进一步代谢,结果1,3-丙二醇在培养基中高浓度累积。整个反应消耗协同因子形式的还原性相当物,即还原型β-烟酰胺腺嘌呤二核苷酸(NADH)一个,还原型β-烟酰胺腺嘌呤二核苷酸被氧化成烟酰胺腺嘌呤二核苷酸(NAD+)。
在厌氧条件下采用甘油作为唯一的碳源以及在缺乏其它外源还原性相当物受体的情况下,通常由甘油进行1,3-丙二醇的生产。在这些条件下,在诸如柠檬酸杆菌属、梭菌属和克雷伯氏菌属的菌株中,甘油的一个平行途径在发挥作用,该途径包括首先通过NAD+-(或NADP+-)联动甘油脱氢酶(反应式3)氧化甘油成为二羟丙酮(DHA)。DHA在通过DHA激酶磷酸化成为二羟丙酮磷酸(DHAP)(反应式4)之后,可用于生物合成和通过例如糖酵解支持ATP产生。
(反应式3)(反应式4)与上述1,3-丙二醇途径相比,该途径可以提供碳和能量给细胞,并产生而不是消耗NADH。
在肺炎克雷伯氏菌(Klebsiella pneumoniae)和弗氏柠檬酸杆菌(Citrobacter freundii)中,dha调节子包括编码甘油脱水酶(dhaB)、1,3-丙二醇氧化还原酶(dhaT)、甘油脱氢酶(dhaD)和二羟丙酮激酶(dhaK)的功能联动活性的基因。得自柠檬酸杆菌属和克雷伯氏菌属的dha调节子已经在大肠杆菌中表达,并显示可将甘油转化为1,3-丙二醇。
已知制备甘油的生物方法。绝大多数甘油生产者是酵母,但是也已知某些细菌、其它真菌和藻类可产生甘油。细菌和酵母均通过糖酵解中的果糖-1,6-二磷酸途径或通过糖酵解途径转化葡萄糖或其它糖类产生甘油,而某些藻类转化叶绿体中的溶解二氧化碳或碳酸氢盐成为卡尔文循环的3碳中间体。在一系列的步骤中,3碳中间体磷酸甘油酸转化成为容易与其酮异构体二羟丙酮磷酸相互转化的3-磷酸甘油醛、并最终转化成甘油。
具体地说,细菌地衣芽孢杆菌(Bacillus licheniformis)和番茄乳杆菌(Lactobacillus lycopersica)合成甘油,并且发现耐盐藻杜氏藻属(Dunaliella)种和Asteromonas gracilis产生甘油以保护免遭外界高盐浓度的损伤(Ben-Amotz等,Experientia 38,49-52,(1982))。同样,各种耐渗透酵母合成甘油作为保护性措施。许多酵母菌属(Saccharomyces)菌株在乙醇发酵期间产生一些甘油,并且通过施加渗透胁迫能够使该过程生理性增强(Albertyn等,Mol.Cell.Biol.,14,4135-4144,(1994))。本世纪初,通过采用加入诸如亚硫酸盐或碱的“导向剂(steering agent)”的酵母属培养物实现甘油工业生产。通过形成无活性复合物,上述导向剂阻断或抑制乙醛转化为乙醇;因此,过量的还原性相当物(NADH)可用来生产甘油或“导向”还原DHAP以生产甘油。该方法受限于亚硫酸盐引起的酵母生长的部分抑制。通过采用碱可以部分克服该限制,所述碱通过不同机制产生过量的NADH相当物。在该实践中,所述碱启动Cannizarro歧化反应以由两个当量的乙醛产生乙醇和乙酸。
已经由糖化酵母(S.diastaticus)克隆并测序了甘油-3-磷酸脱氢酶的编码基因(DAR1,GPD1)(Wang等,J.Bact.176,7091-7095,(1994))。将DAR1基因克隆入穿梭载体,用来转化大肠杆菌,并在大肠杆菌中表达产生活性酶。Wang等(同上)认为DAR1受细胞渗透环境的调节,但是并未提示该基因可以如何用来提高重组生物体中的1,3-丙二醇产量。
已经分离了其它甘油-3-磷酸脱氢酶例如已经由酿酒酵母(S.cereviae)克隆并测序了sn-甘油-3-磷酸脱氢酶(Larason等,Mol.Microbiol.10,1101,(1993));以及Albertyn等(Mol.Cell.Biol.14,4135,(1994))指出自酿酒酵母克隆编码甘油-3-磷酸脱氢酶的GPD1。像Wang等(同上)一样,Albertyn等和Larason等均发现该基因的渗透敏感性调节,但并未提示该基因可以如何用于重组生物体生产1,3-丙二醇。
正如G3PDH一样,已经自酿酒酵母分离甘油-3-磷酸酶,并鉴定该蛋白由GPP1和GPP2基因编码(Norbeck等,J.Biol.Chem.271,13875,(1996)。正如G3PDH编码基因一样,似乎GPP2是渗透敏感性的。
尽管已知生产甘油和1,3-丙二醇的生物学方法,但是从来还没有证实单一重组生物体可以完成整个过程。
无论上述生产1,3-丙二醇的化学方法还是生物学方法均不很适合工业规模生产,因为化学方法非常耗能,而生物学方法需要昂贵的原料甘油。需要低能量输入以及便宜原材料的方法是需要的。更理想的方法应该结合能够将基础碳源诸(如碳水化合物或糖)转化为所需要的1,3-丙二醇终产物的微生物。
虽然单一生物体将可发酵的碳源而不是甘油或二羟丙酮转化成为1,3-丙二醇是最理想的,但是文献资料已证明有些重要难点待努力克服。例如,Gottschalk等(EP 373 230)指出可用于生产1,3-丙二醇的大多数菌株(包括弗氏柠檬酸杆菌、Clostridium autobutylicum、丁酸梭菌(Clostridium butylicum)和肺炎克雷伯氏菌)的生长由于存在诸如果糖或葡萄糖的供氢体而受影响。在甘油和果糖或葡萄糖的共发酵中产生1,3-丙二醇的短乳杆菌(Lactobacillus brevis)和布氏乳杆菌(Lactobacillusbuchner)的菌株当提供甘油作为唯一碳源时不会生长,尽管已经表明静息细胞可以代谢葡萄糖或果糖,但是不产生1,3-丙二醇。(Veiga DACunha等,J.Bacteriol.174,1013,(1992))。同样,已经表明当提供甘油和乙酸时产生1,3-丙二醇的多养型泥杆菌(Ilyobactor polytropus)菌株,不能由非甘油碳底物(包括果糖和葡萄糖)产生1,3-丙二醇。(Steib等,Arch.Microbiol.140,139(1984))。最后,Tong等(Appl.Biochem.Biotech.34,149(1992))已经指出,用编码甘油脱水酶的dha调节子转化的重组大肠杆菌在缺乏外源甘油的情况下,不能由或葡萄糖或木酮糖产生1,3-丙二醇。
已经报道,试图提高由甘油生产1,3-丙二醇的产量,其中能够提供还原性相当物的共底物(通常为可发酵糖)包括在该方法中。已经要求保护共发酵甘油和葡萄糖的弗氏柠檬酸杆菌和肺炎克雷伯氏菌DSM4270静息细胞的产量提高(Gottschalk等,同上,以及Tran-Dinh等,DE 3734 764);但是未要求保护于共发酵甘油和葡萄糖、不产生1,3-丙二醇的肺炎克雷伯氏菌ATCC 25955的生长细胞(I-T.Tong,Ph.D.Thesis,University of Wisconsin-Madison(1992))。已经报道了用重组大肠杆菌共发酵甘油和葡萄糖或果糖使产量提高;然而,在缺乏甘油的情况下不产生1,3-丙二醇(Tong等,同上)。在这些系统中,单一生物体用糖类作为产生NADH的来源,同时为细胞维持和生长提供能量和碳。这些说明书提示,糖类不进入产生1,3-丙二醇的碳流。在缺乏外源性甘油的情况下绝不会产生1,3-丙二醇。这样,文献的对比清楚提示,用单一生物体自糖类源产生1,3-丙二醇是不可能的。
本发明将解决的问题是用单一重组生物体自诸如葡萄糖或其它糖类的便宜碳底物生物性生产1,3-丙二醇。生物性生产1,3-丙二醇需要甘油作为两步序贯反应的底物,在所述两步序贯反应中脱水酶(通常是辅酶B12依赖性脱水酶)转化甘油成为中间体3-羟基丙醛,之后再通过NADH(或NADPH)依赖性氧化还原酶还原为1,3-丙二醇。辅因子需要的复杂度迫使采用全细胞催化剂用于工业生产方法,所述工业方法利用该反应顺序以生产1,3-丙二醇。此外,为了使上述方法经济可行,需要比甘油或二羟丙酮便宜的原料。葡萄糖和其它糖类是合适底物,但是如上所讨论,已知它们干扰1,3-丙二醇产生。结果表明单一生物体不能使葡萄糖转化为1,3-丙二醇。
申请人已经解决了上述问题,并且本发明提供采用单一重组生物体直接使可发酵碳源生物转化为1,3-丙二醇。葡萄糖用作模式底物,该生物转化可用于任何现存微生物。含有甘油3-磷酸脱氢酶(G3PDH)、甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)的编码基因的微生物,能够通过甘油降解途径以良好产率和选择性转化葡萄糖和其它糖类成为1,3-丙二醇。而且,本发明一般可以用于容易转化为下列产物的任何碳底物,所述产物是1)甘油;2)二羟丙酮;或3)氧化态甘油的C3化合物(例如3-磷酸甘油)或4)氧化态二羟丙酮的C3化合物(例如二羟丙酮磷酸或3-磷酸甘油醛)。
发明概述本发明提供由重组生物体生产1,3-丙二醇的方法,包括(i)用包含至少一种下列基因的转化盒转化合适宿主生物体,所述基因是(a)编码甘油-3-磷酸脱氢酶活性的基因;(b)编码甘油-3-磷酸酶活性的基因;(c)编码脱水酶活性的基因;以及(d)编码1,3-丙二醇氧化还原酶活性的基因,条件是假如所述转化表达盒包含少于(a)-(d)全部基因,那么所述合适宿主生物体含有内源基因,由此产生的转化宿主生物体含有至少(a)-(d)基因每种一个;(ii)在合适条件、存在至少一种选自单糖、寡糖、多糖或一碳底物的碳源的情况下,培养转化宿主生物体,由此生产1,3-丙二醇;以及(iii)回收1,3-丙二醇。
本发明还提供包含表达盒的转化宿主,所述表达盒能够表达甘油-3-磷酸脱氢酶、甘油-3-磷酸酶、甘油脱水酶和1,3-丙二醇氧化还原酶活性以生产1,3-丙二醇。
用于本方法的合适宿主生物体选自细菌、酵母和丝状真菌。更具体地说,合适宿主生物体选自以下属柠檬酸杆菌属(Citrobacter)、肠杆菌属(Enterobacter)、梭菌属(Clostridium)、克雷伯氏菌属(Klebsiella)、气杆菌属(Aerobacter)、乳杆菌属(Lactobacillus)、曲霉属(Aspergillus)、酵母属、裂殖酵母属(Schizosaccharomyces)、接合酵母属(Zygosaccharomyces)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)、念珠菌属(Candida)、汉逊酵母(Hansenula)、德巴利酵母属(Debaryomyces)、毛霉属(Mucor)、球拟酵母属(Torulopsis)、甲基酵母属(Methylobacter)、埃希氏菌属(Escherichia)、沙门氏菌属(Salmonella)、芽孢杆菌属(Bacillus)、链霉菌属(Streptomyces)和假单胞菌属(Pseudomonas)。最具体地说,合适宿主生物体选自大肠杆菌、克雷伯氏菌属菌种(Klebsiella spp.)和酵母属菌种(Saccharomyces spp.)。用于所述方法的具体转化宿主生物体是1)用含基因dhaB1、dgaB2、dhaB3和dhaT的转化盒转化的种名待定的酵母(Saccharomyces spp.),其中所述基因稳定地整合到该酵母属菌种(Saccharomyces spp.)的基因组中;以及2)用含基因GPD1和GPD2的转化盒转化的种名待定的克雷伯氏菌(Klebsiella spp.)。
本发明的优选碳源是葡萄糖。
所述方法还采用选自相应于SEQ ID NO11、SEQ ID NO12以及SEQ ID NO13所示氨基酸序列的基因的甘油-3-磷酸脱氢酶的编码基因,所述氨基酸序列包含不引起甘油-3-磷酸脱氢酶功能改变的氨基酸取代、缺失或加入。所述方法也采用选自相应于SEQ ID NO33和SEQID NO17所示氨基酸序列的基因的甘油-3-磷酸酶的编码基因,所述氨基酸序列包含不引起甘油-3-磷酸酶功能改变的氨基酸取代、缺失或加入。本发明方法也采用相应于SEQ ID NO18所示氨基酸序列的甘油激酶的编码基因,所述氨基酸序列包含不引起甘油激酶功能改变的氨基酸取代、缺失或加入。本发明方法也采用脱水酶的编码基因(包括dhaB1、dhaB2以及dhaB3),所述基因分别对应于SEQ ID NO34、SEQID NO35以及SEQ ID NO36所示的氨基酸序列,所述氨基酸序列包含不引起脱水酶功能改变的氨基酸取代、缺失或加入。本发明方法也采用相应于SEQ ID NO37所示氨基酸序列的1,3-丙二醇氧化还原酶的编码基因,所述氨基酸序列包含不引起1,3-丙二醇氧化还原酶功能改变的氨基酸取代、缺失或加入。
本发明也具体体现在转化宿主细胞中,所述转化宿主细胞包括(a)一组基因,包括(1)相应于SEQ ID NO11所示氨基酸序列的甘油-3-磷酸脱氢酶的编码基因;(2)相应于SEQ ID NO17所示氨基酸序列的甘油-3-磷酸酶的编码基因;(3)相应于SEQ ID NO34所示氨基酸序列的甘油脱水酶α亚基的编码基因;(4)相应于SEQ ID NO35所示氨基酸序列的甘油脱水酶的β亚基的编码基因;(5)相应于SEQ ID NO36所示氨基酸序列的甘油脱水酶的γ亚基的编码基因;以及(6)相应于SEQ ID NO37所示氨基酸序列的1,3-丙二醇氧化还原酶的编码基因,(a)(1)-(6)的各个氨基酸序列包含不引起基因(1)-(6)的酶功能改变的氨基酸取代、缺失或加入,以及(b)用(a)组基因转化的宿主细胞,由此转化的宿主细胞由选自单糖、寡糖和多糖的至少一种底物或由一碳底物产生1,3-丙二醇。
简述生物保藏物和序列表含有甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)以及1,3-丙二醇氧化还原酶(dhaT)的编码基因的转化大肠杆菌W2042(包括大肠杆菌宿主W1485和质粒pDT20和pAH42)于1996年9月26日按照国际承认用于专利程序的微生物保存布达佩斯条约的条款保藏于ATCC,并命名为ATCC98188。
带有含甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)的质粒pMCK10、pMCK17、pMCK30和pMCK35的酿酒酵母YPH500于1996年9月26日按照国际承认用于专利程序的微生物保存布达佩斯条约的条款保藏于ATCC,并命名为ATCC 74392。
“ATCC”是指国际保藏单位——美国典型培养物保藏中心,位于12301 Parklawn Drive,Rockvill,MD 20852,美国。所述名称是指保藏材料的保藏号。
申请人已提供了的49个序列,其序列符合专利申请中标准典型核苷酸序列和氨基酸序列的规则(EPO局长的决定的附录I和II,发表于12/1992,OJ EPO的增补第二期),并符合37 C.F.R. 1.821-1.825以及附录A和B(含核苷酸序列和/或氨基酸序列的申请说明书的要求)。
发明详述本发明提供在单一重组生物体由可发酵碳源生物性生产1,3-丙二醇的方法。该方法包括含有甘油-3-磷酸脱氢酶(G3PDH)、甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)以及1,3-丙二醇氧化还原酶(dhaT)的编码基因的微生物。所述重组微生物与碳源接触,并由生长培养基分离1,3-丙二醇。
本发明方法提供可用于生产聚酯和其它聚合物的快速、便宜以及环境负责的1,3-丙二醇单体源。
下列定义用来解释权利要求书和说明书。
术语“甘油脱水酶”或“脱水酶”是指负责能够异构化或转化甘油分子成为3-羟基丙醛产物的酶活性的多肽。为了本发明目的,脱水酶包括优选底物分别为甘油和1,2-丙二醇的甘油脱水酶(GenBankU09771,U30903)和二元醇脱水酶(GenBank D45071)。肺炎克雷伯氏菌ATCC 25955甘油脱水酶由基因dhaB1、dhaB2和dhaB3编码,所述基因分别鉴定为SEQ ID NO1、2和3。dhaB1、dhaB2和dhaB3基因分别编码甘油脱水酶的α、β和γ亚基。
术语“氧化还原酶”或“1,3-丙二醇氧化还原酶”是指负责能够催化3-羟基丙醛还原为1,3-丙二醇的酶活性的多肽。1,3-丙二醇氧化还原酶包括例如dhaT基因(GenBank U09771,U30903)编码的多肽,并鉴定为SEQ ID NO4。
术语“甘油-3-磷酸脱氢酶”或“G3PDH”是指负责能够催化二羟丙酮磷酸(DHAP)转化为甘油-3-磷酸(G3P)的酶活性的多肽。体内G3PDH可以是NADH-、NADPH-或FAD依赖性的。该酶活性的实例包括以下由包括GPD1(GenBank Z74071x2)或GPD2(GenBank Z35169x1)或GPD3(GenBank G984182)或DAR1(GenBank Z74071x2)几种基因编码的NADH依赖性酶(EC 1.1.1.8);gpsA(GenBank U32164,G466746(cds 197911-196892),和L45246)编码的NADPH依赖性酶(EC 1.1.1.94);以及GUT2(GenBank Z47047x23)或glpD(GenBank G147838)或glpABC(GenBank M20938)编码的FAD依赖性酶(EC 1.1.99.5)。
术语“甘油-3-磷酸酶”或“sn-甘油-3-磷酸酶”或“d,l-甘油磷酸酶”或“G3P磷酸酶”是指负责能够催化甘油-3-磷酸转化为甘油的酶活性的多肽。G3P磷酸酶包括例如GPP1(GenBank Z47047x125)或GPP2(GenBank U18813x11)编码的多肽。
术语“甘油激酶”是指负责能够根据反应条件催化甘油转化为甘油-3-磷酸或甘油-3-磷酸转化为甘油的酶活性的多肽。甘油激酶包括例如GUT1(GenBank U11583x19)编码的多肽。
术语“GPD1”、“DAR1”、“OSG1”、“D2830”和“YDL022W”相互通用,是指编码胞质甘油-3-磷酸脱氢酶的基因,其特征为SEQ IDNO5所示碱基序列。
术语“GPD2”是指编码胞质甘油-3-磷酸脱氢酶的基因,其特征为SEQ ID NO6所示碱基序列。
术语“GUT2”和“YIL155C”相互通用,是指编码线粒体甘油-3-磷酸脱氢酶的基因,其特征为SEQ ID NO7所示碱基序列。
术语“GPP1”、“RHR2”和“YIL053W”相互通用,是指编码胞质甘油-3-磷酸酶的基因,其特征为SEQ ID NO8所示碱基序列。
术语“GPP2”、“HOR2”和“YER062C”彼此通用,是指编码胞质甘油-3-磷酸酶的基因,其特征为SEQ ID NO9所示碱基序列。
术语“GUT1”是指编码胞质甘油激酶的基因,其特征为SEQ IDNO10所示碱基序列。
术语“功能”或“酶功能”是指在改变进行特定化学反应需要的能量中的酶催化活性。当然这种活性可以用于平衡的反应,其中在合适条件下可以实现或者产物或底物的生产。
术语“多肽”和“蛋白质”相互通用。
术语“碳底物”和“碳源”是指能够被本发明宿主生物体代谢的碳源,具体来说碳源选自单糖、寡糖、多糖和一碳底物或它们的混合物。
术语“宿主细胞”或“宿主生物体”是指能够接受外源或异源基因并表达这些基因以产生活性基因产物的微生物。
术语“外源基因”、“外源DNA”、“异源基因”和“异源DNA”是指通过各种方式置入宿主生物体中的某种生物体的天然遗传物质。
术语“重组生物体”和“转化宿主”是指已经用异源或外源基因转化的任何生物体。本发明的重组生物体表达编码甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)以及1,3-丙二醇氧化还原酶(dhaT)的外源基因,以由合适碳底物产生1,3-丙二醇。
“基因”是指表达特定蛋白质的核酸片段,包括编码区之前(5’非编码区)和之后(3’非编码区)的调节序列。术语“天然”和“野生型”是指具有其自身调节序列的天然发现的基因。
术语“编码(encoding)”和“编码(coding)”是指基因通过其(通过转录或翻译机制)产生氨基酸序列的过程。不用说编码特定氨基酸序列的方法包括可能涉及不引起编码的氨基酸变化的碱基改变的DNA序列、或涉及可能改变一个或一个以上氨基酸的碱基变化但不影响该DNA序列编码的蛋白功能特性的DNA序列。所以不用说本发明包括特定典型序列以外的其它序列。也设想了基本上不影响所产生蛋白分子功能特性的序列修饰,诸如导致沉默变化的缺失、插入或置换。例如设想了反映遗传密码简并性、或在指定位点产生化学上相当氨基酸的基因序列的变化;因此,疏水氨基酸丙氨酸的密码子可以由编码另一疏水性较低的残基(诸如甘氨酸)或疏水性较高的残基(诸如缬氨酸、亮氨酸或异亮氨酸)的密码子代。同样,也可以预期导致一种带负电残基取代另一带负电残基(诸如天冬氨酸取代谷氨酸)或者一种带正电残基取代另一种带正电残基(诸如赖氨酸取代精氨酸)的变化产生生物学相当的产物。也可以预期,导致该蛋白分子N-末端和C-末端部分改变的核苷酸变化将不改变该蛋白活性。实际上在某些情况下,为了研究改变对该蛋白生物活性的影响,可能最好是制备该序列的突变体。以上提出的每种修饰与确定所编码产物生物活性的保留一样,完全是本领域常规技术。此外,该领域技术人员会认识到,本发明包括的序列也根据其与本文所列举的序列在严格杂交条件(0.1XSSC,0.1%SDS,65℃)下的杂交能力进行定义。
术语“表达”是指由编码基因产物序列的基因转录和翻译成基因产物。
术语“质粒”、“载体”和“盒”是指常常携带不是该细胞重要代谢部分的基因并且通常是环状双链DNA分子形式的染色体外元件。这类元件可以是自主复制序列、基因组整合序列、噬菌体或核苷酸序列,上述序列可以是得自任何来源的线性或环状的、单链或双链的DNA或RNA,在所述序列中已经有许多核苷酸序列加入或重组到独特构建物中,该构建物能够将启动子片段和选定基因产物的DNA序列以及合适3’端非翻译序列导入细胞。“转化盒”是指特定载体,该特定载体含有外源基因以及除了该外源基因外含有促进转化特定宿主细胞的元件。“表达盒”是指下述特定载体,该特定载体含有外源基因以及除了该外源基因外还含有允许在外源宿主中增强所述基因表达的元件。
术语“转化”和“转染”是指掺入核酸后细胞获得新基因。所述获得的基因可以整合到染色体DNA中或作为染色体外复制序列导入。术语“转化体”是指转化的产物。
术语“遗传性改变的”是指通过转化或突变改变遗传物质的方法。构建重组生物体可以采用本领域熟知的技术构建含有必需基因的重组生物体,所述必需基因编码转化碳底物为1,3-丙二醇的酶途径。在本发明中,由诸如克雷伯氏菌属或酵母属的天然宿主分离基因并用来转化宿主菌株,所述基因编码甘油-3-磷酸脱氢酶(G3PDH)、甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)以及1,3-丙二醇氧化还原酶(dhaT),所述宿主菌株诸如大肠杆菌DH5α、ECL707、AA200或W1485;酿酒酵母菌株YPH500;或肺炎克雷伯氏菌菌株ATCC 25955或ECL 2106。分离基因自细菌基因组获得需要基因的方法是普通的,并是分子生物学领域技术人员熟知的。例如,假如基因序列是已知的,则可以通过限制性内切酶消化制备合适的基因组文库,并可以用与所需要基因序列互补的探针进行筛选。一旦分离所述序列之后,则可以采用诸如聚合酶链式反应(PCR)(U.S. 4,683,202)的标准引物指引的扩增方法扩增所述DNA,以获得大量适用于采用合适载体转化的DNA。
另一方面,可以制备粘粒文库,其中大区段基因组DNA(35-45kb)可以装配到载体中,并用来转化合适宿主。在能够容纳大量DNA方面粘粒载体是独特的。一般来说,粘粒载体含有至少一个拷贝cos DNA序列,该序列是所述外源DNA的装配以及随后的循环所需要的。除了cos序列之外,这些载体也可以含有诸如ColE1的复制起点和诸如抗氨苄青霉素或新霉素的基因的药物抗性标记。采用粘粒载体转化合适细菌宿主的的方法详细描述于Sambrook等,分子克隆实验室手册,第二版(1989),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY(1989)。
通常,为了克隆粘粒,采用合适的限制性内切酶,分离外源DNA并连接到所述粘粒载体cos区附近。然后使含有线性化外源DNA的粘粒载体与诸如λ噬菌体的DNA包装载体反应。在装配过程中,切割所述cos位点并使外源DNA装配到细菌病毒颗粒的头部。然后用这些病毒颗粒来转染诸如大肠杆菌的合适宿主细胞。一旦注入到细胞后,在所述cos粘性末端影响下使外源DNA循环。按这种方式,大区段外源DNA可以导入并在重组宿主细胞表达。分离以及克隆甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)的编码基因在本发明中采用粘粒载体和粘粒转化方法,由细菌属克隆大区段基因组DNA,已知所述细菌属具有能够加工甘油成为1,3-丙二醇的基因。具体地说,采用本领域熟知的方法由肺炎克雷伯氏菌ATCC 25955分离基因组DNA,并用限制酶Sau3A消化以插入到粘粒载体Supercos 1中,再用GigapackII包装提取物包装。构建该载体后,用所述粘粒DNA转化大肠杆菌XL1-Blue MR细胞。通过使所述细胞在存在甘油的情况下生长并分析培养基中1,3-丙二醇的形成,根据转化甘油成为1,3-丙二醇的能力筛选转化体。
分析了其中两个1,3-丙二醇阳性转化体,并将其粘粒命名为pKP1和pKP2。DNA序列分析显示广泛同源于得自弗氏柠檬酸杆菌的甘油脱水酶基因(dhaB),证实这些转化体含有编码甘油脱水酶基因的DNA。分析了其它1,3-丙二醇阳性转化体,并将其粘粒命名为pKP4和pKP5。DNA序列分析揭示这些粘粒携带编码二元醇脱水酶基因的DNA。
尽管本发明采用自克雷伯氏杆菌属粘粒中分离的基因,但是脱水酶基因替代源包括但不限于柠檬酸杆菌属、梭菌属以及沙门氏菌属。编码G3PDH和G3P磷酸酶的基因本发明提供适合在宿主细胞表达G3PDH和G3P磷酸酶活性的基因。
编码G3PDH的基因是已知的。例如,已经自酵母属分离了GPD1,其碱基序列由SEQ ID NO5所示,编码SEQ ID NO11所示的氨基酸序列(Wang等,同上)。同样,也已经自酵母属分离了GPD2编码的G3PDH活性,GPD2的碱基序列见SEQ ID NO6,所编码的氨基酸序列见SEQID NO12(Eriksson等,Mol.Microbiol.17,95,(1995)。
设想编码负责G3PDH活性的多肽的任何基因均适合于本发明目的,其中所述活性能够催化二羟丙酮磷酸(DHAP)转化为甘油-3-磷酸。此外,设想编码G3PDH氨基酸序列的任何基因在本发明中是有功能的,所述G3PDH氨基酸序列如分别相应于基因GPD1、GPD2、GUT2、gpsA、glpD和glpABC的α亚单位的SEQ ID NO11、12、13、14、15和16中任何一种所示,其中所述氨基酸序列含有不引起该酶功能变化的氨基酸取代、缺失、或加入。技术人员会理解,从其它来源分离的G3PDH编码基因也适用于本发明。例如,从原核生物分离的基因包括GenBank登记号M34393、M20938、L06231、U12567、L45246、L45323、L45324、L45325、U32164和U39682;从真菌分离的基因包括GenBank登记号U30625、U30876和X56162;从昆虫分离的基因包括GenBank登记号X61223和X14179;从哺乳动物源分离的基因包括GenBank登记号U12424、M25558和X78593。
编码G3P磷酸酶的基因是已知的。例如,GPP2已经从酿酒酵母分离,其碱基序列由SEQ ID NO9所示,编码的氨基酸序列见SEQ IDNO17(Norbeck等,J.Biol.Chem.271,第13875页,1996)。
设想编码G3P磷酸酶活性的任何基因均适合本发明的目的,其中所述活性能够催化甘油-3-磷酸转化为甘油。此外,设想编码如SEQ IDNO33和17所示G3P磷酸酶氨基酸序列的任何基因在本发明中是有功能的,其中所述氨基酸序列含有不引起该酶功能变化的氨基酸取代、缺失或加入。技术人员会理解,从其它来源分离的G3P磷酸酶编码基因也适用于本发明。例如,采用一种或多种下列一般或特殊磷酸酶可以使甘油-3-磷酸脱磷酸产生甘油,所述磷酸酶为碱性磷酸酶(EC3.1.3.1)[GenBank M19159、M29663、U02550或M33965];酸性磷酸酶(EC 3.1.3.2)[GenBank U51210、U19789、U28658或L20566];甘油-3-磷酸酶(EC 3.1.3.-)[GenBank Z38060或U18813x11];葡萄糖-1-磷酸酶(EC 3.1.3.10)[GenBank M33807];葡萄糖-6-磷酸酶(EC3.1.3.9)[GenBank U00445];果糖-1,6-二磷酸酶(EC 3.1.3.11)[GenBankX12545或J03207]或磷脂酰(phosphotidyl)甘油磷酸磷酸酶(EC3.1.3.27)[GenBank M23546和M23628]。
编码甘油激酶的基因是已知的。例如,已经从酵母属分离并序列分析了编码甘油激酶的GUT1(Pavlik等,Curr.Genet.24,21,(1993)),其碱基序列见SEQ ID NO10,所编码的氨基酸序列见SEQ ID NO18。技术熟练人员会理解,尽管甘油激酶本质上催化甘油降解,但是同一种酶能够在合适反应能条件下、在转化甘油-3-磷酸成为甘油的甘油合成中发挥作用。存在通过甘油激酶生产甘油的证据。在厌氧或呼吸抑制条件下,布氏锥虫(Trypanosoma brucei)在存在甘油-3-磷酸和ADP的情况下产生甘油。该反应发生于酵解酶区室(D.Hammond,J.Biol.Chem.260,15646-15654,(1985))。宿主细胞通过表达G3PDH和G3P磷酸酶重组生产甘油的合适宿主细胞可以是或者原核生物或真核生物性的,并将只受其表达活性酶的能力的限制。优选宿主细胞是那些通常用于生产甘油或1,3-丙二醇的宿主,诸如柠檬酸杆菌属、肠杆菌属、梭菌属、克雷伯氏菌属、气杆菌属、乳杆菌属、曲霉属、酵母属、裂殖酵母属、接合酵母属、毕赤酵母属、克鲁维酵母属、念珠菌属、汉逊酵母、德巴利酵母属、毛霉属、球拟酵母属、甲基酵母属、埃希氏菌属、沙门氏菌属、芽孢杆菌属、链霉菌属和假单胞菌属。本发明最优选的是大肠杆菌、克雷伯氏杆菌属菌种和酵母属菌种。
腺苷-钴胺素(辅酶B12)是甘油脱水酶活性的必需辅因子。该辅酶是已知的最复杂的非聚合性天然产物,体内运用大约30个基因的产物指导其合成。辅酶B12的合成发现于原核生物,某些原核生物能够从头合成该化合物,而其它原核生物能够进行部分合成反应。例如,大肠杆菌不能制造咕啉环结构,但是能够催化咕啉醇酰胺转化为类咕啉,并能够引入5’-脱氧腺苷基。
真核生物不能从头合成辅酶B12,相反从细胞外环境转运维生素B12和随后通过细胞酶转化该化合物成为其功能形式。关于该系列反应,已经描述了三种酶活性。
1)水钴胺素(aquacobalamin)还原酶(EC 1.6.99.8)还原Co(III)成为Co(II);2)钴(II)胺素还原酶(EC 1.6.99.9)还原Co(II)成为Co(I);以及3)钴(I)胺素腺苷转移酶(EC 2.5.1.17)将5’脱氧腺苷部分从ATP转移至还原的类咕啉。最后一种酶活性是这三种酶中最充分特征鉴定的,由鼠伤寒沙门氏菌(S.typhimurium)中的cobA、大肠杆菌中的btuR和脱氮假单胞菌(P.denitrificans)中的cobO编码。已经克隆并序列分析了这三种钴(I)胺素腺苷转移酶基因。钴(I)胺素腺苷转移酶活性已经在人成纤维细胞和分离的大鼠线粒体中检测到(Fenton等,Biochem.Biophys.Res.Commun.98,283-9,(1981))。钴还原中涉及的两种酶特征性鉴定较少,并未得到基因序列。有得自Euglena gracilis的水钴胺素还原酶的报道(Watanabe等,Arch.Biochem.Biophys.305,421-7,(1993)),微粒体钴(III)胺素还原酶存在于得自大鼠成纤维细胞的微粒体和线粒体内壁部分(Pezacka,Biochim.Biophys.Acta,1157,167-77,(1993))。
含有维生素B12的补加培养基可以满足许多微生物对产生甘油脱水酶活性的辅酶B12的需要,但是在某些情况下可能不得不在体内加入或提高其它催化活性。增强真核生物辅酶B12的合成可能是特别需要的。已知钴(I)胺素腺苷转移酶编码基因的公开的序列,本领域技术人员可以完成该基因的克隆和表达。例如,设想可以构建诸如酵母属的酵母以便除了实现诸如葡萄糖的碳底物转化为1,3-丙二醇所必需的基因之外还含有钴(I)胺素腺苷转移酶编码基因。克隆和表达钴还原的基因需要不同的方法。这可能基于生长于作为唯一N2源的乙醇胺的大肠杆菌的选择。在存在辅酶B12的情况下,乙醇胺脱氨酶在缺乏其它N2源的情况下能使细胞生长。假如大肠杆菌细胞含有钴(I)胺素腺苷转移酶的克隆基因和含有得自另一种生物的随机克隆DNA,则在存在水钴胺素的情况下在乙醇胺上的生长应增强,并进行生长选择以确定所述随机克隆DNA是否编码钴还原特性以促进水钴胺素的腺苷化作用。
除了大肠杆菌和酵母属外,克雷伯氏杆菌属是特别优选的宿主。已知肺炎克雷伯氏菌菌株生长于作为唯一碳源的甘油时产生1,3-丙二醇。设想可以遗传性改变克雷伯氏杆菌属,以便由单糖、寡糖、多糖或一碳底物生产1,3-丙二醇。
为了工程改造这类菌株,最好提供给克雷伯氏杆菌属宿主以下述基因,在一种或多种组成型或诱导型启动子的转录控制下,所述基因分别或同时促进二羟丙酮磷酸转化为甘油以及甘油转化为1,3-丙二醇。引入分别编码甘油-3-磷酸脱氢酶和甘油-3-磷酸酶的DAR1和GPP2基因,将为克雷伯氏杆菌属细菌提供遗传机器以由合适碳源生产1,3-丙二醇。
上述基因(例如G3PDH、G3P磷酸酶、dhaB和/或dhaT)可以引入到能够在肺炎克雷伯氏菌中复制的任何质粒载体,或者它们可以整合到肺炎克雷伯氏菌基因组中。例如,已知肺炎克杆菌ATCC 25955和ECL2106是四环素或氯霉素敏感性的;因此既能在肺炎克雷伯氏菌复制又能编码这两种抗生素中之一或两者的抗性的质粒载体可以用来将这些基因导入肺炎克雷伯氏菌。用目的基因转化克雷伯氏杆菌属细菌的方法是普通的并是本领域熟知的,包括适宜载体和表达技术的适合方案可以在Sambrook(同上)的文献中发现。载体和表达盒本发明提供适合克隆、转化以及表达G3PDH和G3P磷酸酶到合适宿主细胞中的各种载体以及转化和表达盒。适宜载体是那些与所用细菌相容的载体。适宜载体可以得自例如细菌、病毒(诸如噬菌体T7或M-13衍生噬菌体)、粘粒、酵母或植物。获得和采用这些载体的方案是本领域已知的。(Sambrook等,分子克隆实验室手册-第1、2、3卷(ColdSpring Harbor Laboratory,Cold Spring Harbor,NY,(1989))。
通常,上述载体和盒含有下述序列,所述序列指导转录和翻译有关基因、选择标记以及允许自主复制或染色体整合的序列。合适的载体含有带有转录起始控制的所述基因的5’区,以及含有控制转录终止的所述DNA片段的3’区。尽管人们理解这类控制区不需要得自选作生产宿主的特定物种的天然基因,但是最优选的是两个控制区均得自与所述转化宿主细胞同源的基因。
可用于驱动所需要的宿主细胞中的G3PDH和G3P磷酸酶基因表达的起始控制区或启动子数量繁多并是本领域技术人员熟知的。实际上,能够驱动这些基因的任何启动子均适合于本发明,包括但不限于CYC1、HIS3、GAL1、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI(可用于在酵母菌属细菌中表达);AOX1(可用于毕赤酵母属细菌中表达);以及lac、trp、λPL、λPR、T7、tac和trc(可用于在大肠杆菌中表达)。
终止控制区也可以得自各种上述优选宿主的天然基因。可选择的是,终止位点是非必须的,然而,假如包括其中是最优选的。
为了有效表达上述(instant)酶,编码这些酶的DNA可通过起始密码子操作性连接到选择性表达控制区,这样表达导致合适信使RNA的形成。转化合适宿主以及表达基因以生产1,3-丙二醇一旦构建合适盒后,将它们用来转化合适的宿主细胞。通过已知方法诸如转化(例如采用钙透化细胞、电穿孔)或采用重组噬菌体病毒的转染,可以将含有甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)、以及1,3-丙二醇氧化还原酶(dhaT)的编码基因的盒分别或同时导入到宿主细胞中。(Sambrook等,同上)。
在本发明中,制备了含有甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)、以及1,3-丙二醇氧化还原酶(dhaT)的编码基因的大肠杆菌W2042(ATCC 98188)。此外,构建带有质粒pMCK10、pMCK17、pMCK30和pMCK35的酿酒酵母YPH500(ATCC 74392),所述质粒含有甘油-3-磷酸脱氢酶(G3PDH)和甘油-3-磷酸酶(G3P磷酸酶)、甘油脱水酶(dhaB)、以及1,3-丙二醇氧化还原酶(dhaT)的编码基因。上述转化大肠杆菌和酵母属菌均是本发明的优选实施方案。培养基和碳底物本发明的发酵培养基必须含有合适的碳底物。合适的碳底物可以包括但是不限于诸如葡萄糖和果糖的单糖、诸如乳果糖或蔗糖的寡糖、诸如淀粉或纤维素的多糖、或它们的混合物;以及得自可再生原料诸如干酪乳清渗透物、玉米浆、甜菜糖蜜以及大麦芽的非纯化混合物。另外,所述碳底物也可以是一碳底物,诸如二氧化碳或已经证实可代谢转化为重要生化中间体的甲醇。
已经报道在甲基营养酵母(Yamada等,Agric.Biol.Chem.,53(2),541-543,(1989))和在细菌(Hunter等,Biochemistry,24,4148-4155,(1985))中由一碳源(例如甲醇、甲醛或甲酸)生产甘油。这些生物体可以同化一碳化合物,范围从氧化态的甲烷到甲酸,并产生甘油。所述碳同化途径可以是通过核酮糖一磷酸、丝氨酸或木酮糖一磷酸的途径(Gottschalk,Bacterial Metabolism,第二版,Springer-Verlag纽约(1986))。核酮糖一磷酸途径包括甲酸与核酮糖-5-磷酸缩合生成果糖的6碳糖,最终形成3碳产物甘油醛-3-磷酸。同样,丝氨酸途径通过亚甲四氢叶酸将一碳化合物同化到糖酵解途径中。
甲基营养生物除了利用一碳和二碳底物外,也知道甲基营养生物利用许多其它含碳化合物,诸如甲胺、葡糖胺和用于代谢活动的各种氨基酸。例如,已知甲基营养酵母利用甲胺的碳以生成海藻糖或甘油(Bellion等,Microb.Growth Cl Compd.,[Int.Symp.],第七次(1993),415-32,编辑Murrell,J.Collin;Kelly,Don P.,出版商Intercept,Andover,UK)。同样,各种念珠菌属菌种可代谢丙氨酸或油酸(Sulter等,Arch.Microbiol.,153(5),485-9(1990))。因此,本发明中采用的碳源可以包括种类繁多的含碳底物,并只受宿主生物需要的限制。
尽管设想上述所有碳底物和它们的混合物均适合于本发明,但是优选的碳底物是单糖、寡糖、多糖以及一碳底物。更优选的是诸如葡萄糖、果糖、蔗糖的糖类以及诸如甲醇和二氧化碳的一碳底物。最优选的是葡萄糖。
除了合适的碳源之外,发酵培养基必须含有合适的矿物质、盐、辅因子、缓冲剂、以及其它本领域技术人员熟知的、适合上述培养物生长和促进甘油生产必需的酶途径的组分。需要特别注意的是Co(II)盐和/或维生素B12或它们的前体。培养条件细胞通常在合适培养基中生长于30℃。本发明优选的生长培养基为普通的工业制备的培养基,诸如Luria Bertani(LB)肉汤,SabouraudDextrose(SD)肉汤或Yeast Malt Extract(YM)肉汤。也可以采用其它已知成分或合成的生长培养基,而特定微生物生长的合适培养基是微生物学或发酵学领域技术人员已知的。也用已知直接或间接调节分解代谢物阻抑的化合物(例如环腺苷2’3’-一磷酸或环腺苷2’5’-一磷酸)加入反应培养基中。同样,用已知调节酶活性的化合物(例如亚硫酸盐、亚硫酸氢盐和碱)使得提高甘油产量,所述化合物的使用可以与遗传操作结合或用作遗传操作的替代方法。
发酵的合适pH范围为pH 5.0-9.0,其中pH 6.0-8.0优选作起始发酵条件范围。
反应可以在有氧或无氧条件下进行,其中优选无氧或微需氧条件。分批发酵和连续发酵本发明采用分批发酵法。经典分批发酵是密闭系统,其中在发酵的开始时设定培养基的组分,在发酵期间不进行人为改变。这样,在发酵开始时用所需要的一种或多种生物体接种到所述培养基,该系统中不加入任何物质以允许发生发酵。但是,通常分批发酵是指“分批”加入碳源,并常常试图控制诸如pH和氧浓度的因素。所述分批系统的代谢物和生物量组成不断地发生变化直到发酵终止时。在分批培养物中,细胞通过静态lag期到高生长对数期以及最终到稳定期进行调节,在此过程中生长率递减或停止。假如不进行处理,稳定期细胞最终发生死亡。一般对数期细胞产生大量终末产物或中间产物。
标准批系统的变体是也适用于本发明的补料分批发酵系统。在典型分批系统的该变体中,随着发酵的进行递增性加入所述底物。当分解代谢物阻抑易于抑制其细胞代谢和希望限制培养基中的底物量时,补料分批系统是适用的。测量补料分批系统中的实际底物浓度是困难的,所以根据可检测因子的变化估计底物浓度,所述因子诸如pH、溶解氧和诸如CO2的废气的分压力。分批发酵和补料分批发酵是普通的并是本领域人员熟知的,在Brock(同上)文献中可以发现这类实例。
也设想上述方法适用于连续发酵法。连续发酵是一种开放系统,在此系统中已知成分的发酵培养基持续不断地加入到生物反应器中,同时取出等量条件培养基进行加工。连续发酵一般保持培养物于恒定高密度,其中细胞主要处于对数生长期。
持续发酵允许调节一种或任何数目的影响细胞生长或终产物浓度的因子。例如,一种方法将保持有限营养,诸如固定率的碳源或氮水平,并允许调节所有其它参数。在其它系统中,影响生长的许多因子可能持续性变化,而细胞浓度保持恒定,所述细胞浓度是通过培养基混浊度检测的。连续系统努力保持稳态的生长条件,因此由于取出培养基引起的细胞数减少必须与发酵中的细胞生长速率保持平衡。调节连续发酵过程的营养物和生长因子的方法以及使产物生成速率最大化的技术是工业微生物学领域众所周知的,Brook(同上)详细描述了各种方法。
可以采用或者分批发酵、补料分批发酵或连续发酵法实践本发明,而任何已知的发酵模式均将是适合的。另外,设想可以将细胞作为全细胞催化剂固定于底物上,并将细胞置于生产1,3-丙二醇的发酵条件下。1,3-丙二醇生产途径中的变化典型酶途径。通过以下一系列步骤可以完成由葡萄糖生产1,3-丙二醇。该系列是本领域技术人员已知的无数途径的代表。葡萄糖以一系列糖酵解途径酶步骤转化为二羟丙酮磷酸(DHAP)和3-磷酸甘油醛(3-PG)。然后通过或者水解DHAP成为二羟丙酮然后还原;或者还原DHAP成为3-磷酸甘油(G3P)然后水解,从而形成甘油。所述水解步骤可以由任何数目的已知底物特异性或底物非特异性的细胞磷酸酶催化;或者其活性可以通过重组导入所述宿主。所述还原步骤可以由NAD+(或NADP+)联动宿主酶催化;或者其活性可以通过重组导入所述宿主。值得注意的是,所述dha调节子含有催化反应式3可逆反应的甘油脱氢酶(E.C. 1.1.1.6)。
(反应式1)(反应式2)(反应式3)正如前面已经详细描述的一样,甘油通过中间体3-羟基丙醛(3-HP)转化为1,3-丙二醇。中间体3-HP由甘油通过脱水酶产生(反应式1),该脱水酶可以由宿主编码或者可以通过重组导入宿主。该脱水酶可以是甘油脱水酶(E.C. 4.2.1.30)、二元醇脱水酶(E.C. 4.2.1.28)或能够催化该转化的任何其它酶。是甘油脱水酶而不是二元醇脱水酶由所述dha调节子编码。1,3-丙二醇由3-HP通过NAD+(或NADP+)联动宿主酶催化产生,或者所述活性可以通过重组导入宿主。1,3-丙二醇生产的最后反应可以由1,3-丙二醇脱氢酶(E.C. 1.1.1.202)或其它醇脱氢酶类催化。
影响碳通道的突变和转化包含1,3-丙二醇产生途径中的变异的各种突变生物将可用于本发明。导入丙糖磷酸异构酶突变(tpi-)到上述微生物中是采用一种突变改善碳通道性能的一个实例。另一方面,减少生产乙醇(adh)或乳酸(ldh)的突变将增加生产1,3-丙二醇的NADH有效性。甘油醛-3-磷酸之后的糖酵解步骤中的其它突变,例如磷酸甘油酸变位酶(pgm)突变,可用来增加流向上述1,3-丙二醇生产途径的碳流。影响葡萄糖转运的突变,诸如防止PEP损失的PTS,也可以证实是有用的。阻断1,3-丙二醇产生途径中间体的替代途径(诸如甘油分解代谢途径(glp))的突变也可用于本发明。上述突变可以导向列结构基因以便降低或提高酶活性,或者可以导向列调节基因以便调节酶活性的表达水平。
另一方面,可以联合转化和突变以控制提高1,3-丙二醇产量的特定酶活性。因此,对全细胞催化剂进行的使得1,3-丙二醇产量提高的预先修饰属于本发明范围。鉴定以及纯化1,3-丙二醇自发酵培养基纯化1,3-丙二醇的方法是本领域已知的。例如,通过对反应混合物用有机溶剂提取、蒸馏和柱层析,可以自细胞培养基获得丙二醇(U.S. 5,356,812)。用于该方法的特别优良的有机溶剂是环己烷(U.S. 5,008,473)。
通过对培养基进行高压液相层析(HPLC)分析,可以直接鉴定1,3-丙二醇。本发明优选的一种方法是采用无梯度形式的0.01N硫酸流动相,在分析性离子交换柱上分析发酵培养基。鉴定和纯化G3PDH和G3P磷酸酶用酶分析法检测蛋白G3PDH和G3P磷酸酶的表达水平,G3PDH活性分析依赖于DHAP转化为G-3-P中的共底物NADH的光谱特性。NADH具有固有UV/可见光吸收,并于340nm波长分光光度法监测其消耗。可以采用任何检测反应中释放的无机磷酸盐的方法检测G3P磷酸酶活性。最常用的检测方法利用可见光谱测定兰色磷钼酸铵复合物。
实施例一般方法磷酸化、连接和转化方法是本领域众所周知的。适合用于以下实施例的技术可以参见Sambrook,J等,分子克隆实验室手册,第二版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY(1989))。
适合细菌培养物保持和生长的材料和方法是本领域众所周知的。适合用于以下实施例的技术可以参见Manual of Methods for GeneralBacteriology (Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg和G.Briggs Phillips,编辑)中提出的技术,或者参见Thomas D.Brock编著的BiotechnologyATextbook of Industrial Microbiology,第二版,Sinauer Associates,Inc.,Sunderland,MA(1989)。用于细菌细胞生长和保持的所有试剂和材料得自于Aldrich Chemicals (Milwaukee,WI)、DIFCO Laboratories (Detroit,MI)、GIBCO/BRL (Gaithersburg,MD)或Sigma Chemical Company(St.Louis,MO),除非另有说明。
缩写的意思如下“h”代表小时,“min”代表分钟,“sec”代表秒,“d”代表天数,“mL”代表毫升,“L”代表升。酶分析法采用1,2-丙二醇作底物检测无细胞提取物中的甘油脱水酶活性。基于醛类和甲基苯并-2-噻唑酮腙反应的该分析法已经由Forage和Foster(Biochim.Biophys.Acta,569,249(1979))描述。正如也已描述的一样,采用1,3-丙二醇和NAD+作底物,测量溶液和平板凝胶中的1,3-丙二醇氧化还原酶的活性,1,3-丙二醇氧化还原酶有时称作1,3-丙二醇脱氢酶。Johnson和Lin,J.Bacteriol.,169,2050(1987)。正如已描述的一样,在NADH或NADPH消失后,分光光谱法检测NADH或NADPH依赖性甘油-3-磷酸脱氢酶(G3PDH)活性。(R.M.Bell和J.E.Cronan,Jr.Biol.Chem.2507153-8(1975))。检测甘油-3-磷酸酶GPP通过使所述提取物和pH6.5的bis-Tris或MES以及镁缓冲液中的有机磷酸盐底物温育,进行酶活性检测。所用的底物是l-α-甘油磷酸;d,l-α-甘油磷酸。该检测中试剂的终浓度是缓冲液(20mM,bis-Tris或50mM MES);MgCl2(10mM)以及底物(20mM)。假如所述样品中的总蛋白是低的并且用酸猝灭无可见沉淀发生,则该样品可方便地在比色杯中检测。该方法包括在含有20mM底物(50μl,200mM)、50mM MES、10mM MgCl2、pH6.5缓冲液的比色杯中温育酶样品。磷酸酶检测的终体积为0.5mL。将含酶样品加入到反应混合物中;混合比色杯中内容物,然后根据酶样品中的磷酸酶活性是否在2-0.2U/mL范围,将该比色杯置于T=37℃的循环水浴中5-120分钟。通过加入酸性钼酸盐试剂(0.5mL)猝灭该酶反应。在加入Fiske SubbaRow试剂(0.1mL)和蒸馏水(1.5mL)后,混合该溶液并让其显色。10分钟后采用Cary 219 UV/可见光分光光度计,在660nm处读所述样品的吸光度。将释放的无机磷酸盐量与标准曲线相比,该标准曲线是通过采用无机磷酸盐原液(0.65mM)并制备范围为0.026-0.130μmol/mL的无机磷酸盐终浓度的6个标准品而制作的。分离和鉴定1,3-丙二醇通过HPLC监测甘油转化为1,3-丙二醇。用层析领域技术人员可获得的标准技术和材料进行分析。一种合适方法使用采用UV(210nm)和RI检测的Waters Maxima 820 HPLC系统。将样品注射入采用流速为0.5mL/分钟的0.01N H2SO4作流动相、温度控制在50℃、装备有ShodexSH-1011P前置柱(6mm×50mm)的Shodex SH-1011柱(8mm×300mm,购自Waters,Milford,MA)。当需要定量分析时,用已知量的三甲基乙酸作外标准制备样品。通常,甘油(RI检测)、1,3-丙二醇(RI检测)和三甲基乙酸(UV和RI检测)的保留时间分别是20.67分钟、26.08分钟和35.03分钟。
用GC/MS证实1,3-丙二醇的产生。用GC/MS领域技术人员可获得的标准技术和材料进行分析。一种合适方法采用偶联到Hewlett Packard5971 Series质量选择检测器(EI)的Hewlett Packard 5890 Series II气相层析仪和HP-INNOWax柱(30m长,0.25mm i.d.,0.25微米膜厚度)。将产生的1,3-丙二醇的保留时间和质谱与真实1,3-丙二醇的保留时间和质谱相比(m/e57,58)。
GC/MS的替代方法涉及衍生所述样品。将30uL浓(70%v/v)高氯酸加到1.0mL样品(例如,培养上清液)中。混合之后,冷冻并冻干该样品。双(三甲基硅烷基)三氟乙酰胺∶吡啶的1∶1混合物(300uL)加到冻干物中,强力混合并置于65℃ 1小时。通过离心澄清该样品中的不溶物质。产生的液体分离成两相,其上相用于分析。上述样品在DB-5柱(48m,0.25mm I.D.,0.25um薄膜厚度;购自J & W Scientific)上进行层析分析,将由培养上清液获得的1,3-丙二醇衍生物的保留时间和质谱与自真正的标准品获得的数据相比。TMS衍生的1,3-丙二醇的质谱含有特征离子205、177、130和115 AMU。
实施例1用质粒DNA克隆以及转化大肠杆菌宿主细胞以表达1,3-丙二醇培养基S12合成培养基用于筛选细菌转化体产生1,3-丙二醇的能力。S12培养基含有10mM硫酸铵、50mM磷酸钾缓冲液,pH7.0、2mM MgCl2、0.7mM CaCl2、50uM MnCl2、1uM FeCl3、1uM ZnCl、1.72uM CuSO4、2.5uM CoCl2、2.4uM Na2MoO4以及2uM盐酸硫胺素。
用于生长和发酵的培养基A组成如下10mM硫酸铵;50mMMOPS/KOH缓冲液,pH7.5;5mM磷酸钾缓冲液,pH7.5;2mM MgCl2;0.7mM CaCl2;50uM MnCl2;1uM FeCl3;1uM ZnCl;1.72uM CuSO4;2.53uM CoCl2;2.42uM Na2MoO4;2uM盐酸硫胺素;0.01%酵母提取物;0.01%水解酪蛋白氨基酸;0.8ug/mL维生素B12;以及50ug/mL氨苄青霉素。培养基A按需要或者补加0.2%甘油或者补加0.2%甘油加上0.2%D-葡萄糖。细胞在文献中也称为产气克雷伯氏菌(K.Aerogenes)或产气气杆菌(Aerobacter aerogenes)的肺炎克雷伯氏菌ECL 2106(Ruch等,J.Bacteriol.,124,348(1975))得自E.C.C.Lin(Harvard Medical School,Cambridge,MA),并作为实验室培养物保持。
肺炎克雷伯氏菌ATCC 25955购自美国典型培养物保藏中心(Rockville,MD)。
大肠杆菌DH5α购自Gibco/BRL,并用从肺炎克雷伯氏菌ATCC25955分离的粘粒DNA转化,ATCC 25955不是含有甘油脱水酶的编码基因,就是含有二元醇脱水酶的编码基因。含甘油脱水酶的粘粒鉴定为pKP1和pKP2,含二元醇脱水酶的粘粒鉴定为pKP4。转化的DH5α细胞鉴定为DH5α-pKP1、DH5α-pKP2和DH5α-pKP4。
大肠杆菌ECL 707(Sprenger等,J.Gen.Microbiol.,135,1255(1989))得自E.C.C.Lin(Harvard Medical School,Cambridge,MA),并同样用得自肺炎克雷伯氏菌的粘粒DNA转化。这些含有甘油脱水酶基因的转化体鉴定为ECL 707-pKP1和ECL 707-pKP2,含有二元醇脱水酶基因的转化体鉴定为ECL 707-pKP4。
含有上述tpi基因突变的大肠杆菌AA200(Anderson等,J.Gen.Microbiol.,62,329(1970))购自the E.Coli Genetics Stock Center,YaleUniversity(New Haven,CT),并用克雷伯氏杆菌属细菌粘粒转化,产生重组生物AA200-pKP1和AA200-pKP2(含有甘油脱水酶基因)、以及AA200-pKP4(含有二元醇脱水酶基因)。DH5α用5mL LB培养基冲洗含有用肺炎克雷伯氏菌DNA转染的大约1,000个大肠杆菌XL1-Blue MR克隆的6块转化板并离心。离心沉淀上述细菌并再悬浮在5mL LB培养基+甘油中。将等分试样(50uL)接种到15mL试管中,该试管中含S12合成培养基和0.2%甘油+400ng/mL维生素B12+0.001%酵母提取液+50氨苄青霉素(50amp.)。该试管用上述培养基装至顶部并用parafilm封口,温育于30℃。48小时后观察到轻度混浊。如上所述在78小时和132小时,分析产物分布的等分试样是1,3-丙二醇阳性,后一时间点的1,3-丙二醇量升高。
连续稀释1,3-丙二醇产生实验阳性的细菌,并平板接种到LB-50amp平板以便分离单个菌落。分离48个单菌落,并再次核查1,3-丙二醇的产生。从6个独立克隆分离粘粒DNA并转化到大肠杆菌菌株DH5α中。再次核查该转化体1,3-丙二醇的产生。进一步特征鉴定两个转化体并命名为DH5α-pKP1和DH5α-pKP2。
序列分析得自亚克隆到pBIB31(IBI Biosystem,New Haven,CT)中的pKP1的12.1kb EcoRI-SalI片段,并命名为pHK28-26(SEQ IDNO19)。序列分析揭示编码甘油脱水酶的dha操纵子的有关可读框基因座和调节所需要基因的基因座。关于SEQ ID NO19,发现编码二羟丙酮激酶的dhaK的可读框片段位于碱基1-399;编码甘油脱氢酶的可读框dhaD位于碱基983-2107;编码阻抑物的可读框dhaR位于碱基2209-4134;编码1,3-丙二醇氧化还原酶的可读框dhaT位于碱基5017-6180;编码α亚基甘油脱水酶的可读框dhaB1位于碱基7044-8711;编码β亚基甘油脱水酶的可读框dhaB2位于碱基8724-9308;编码γ亚基甘油脱水酶的可读框dhaB3位于碱基9311-9736;以及编码未知功能蛋白的可读框dhaBX位于碱基9749-11572。
用包装的粘粒DNA转染的大肠杆菌XL1-Blue MR单个菌落接种到微量滴定孔中,所述粘粒DNA得自肺炎克雷伯氏菌,所述微量滴定孔含有200uL S15培养基(10mM硫酸铵;1mM磷酸钾缓冲液,pH7.0;50mM MOPS/KOH缓冲液,pH7.0;2mM MgCl2;0.7mM CaCl2;50uMMnCl2;1uM FeCl3;luM ZnCl;1.72uM CuSO4;2.53uM CoCl2;2.42uMNa2MoO4;以及2uM盐酸硫胺素)+0.2%甘油+400ng/mL维生素B12+0.001%酵母提取液+50ug/mL氨苄青霉素。除了上述微量滴定孔之外,也接种含LB-50amp的主平板。96小时后取出100uL并于含0.2微米尼龙滤膜的Rainin微量离心管中离心。细菌被阻留,处理滤液以进行HPLC分析。在筛选大约240个菌落后,鉴定了证实产生1,3-丙二醇的阳性克隆。所鉴定的3个阳性克隆中,其中两个已生长于LB-50amp上,而其中一个未生长。从生长于LB-50amp的两个阳性克隆中的一个分离并证实产生1,3-丙二醇的单个菌落被称为pKP4。从含pKP4的大肠杆菌菌株分离粘粒DNA,并转化大肠杆菌菌株DH5α。证实称作DH5α-pKP4的独立转化体产生1,3-丙二醇。ECL 707单独用相应于pKP1、pKP2、pKP4或Supercos载体中的一种的粘粒肺炎克雷伯氏菌DNA转化大肠杆菌菌株ECL 707,并分别命名为ECL707-pKP1、ECL707-pKP2、ECL707-pKP4和ECL707-sc。ECL707是glpK、gld和ptsD缺陷的,glpK、gld和ptsD分别编码ATP依赖性甘油激酶、NAD联动甘油脱氢酶和用于磷酸烯醇丙酮酸依赖性磷酸转移酶系统的二磷酸丙酮的酶II。
将从LB-50amp平板分离的、每种粘粒转化的20个单个菌落和5个Supercos载体单独(阴性对照)转化的菌落转移到LB-50amp主平板上。也测试这些分离物其将甘油转化为1,3-丙二醇的能力,以便确定它们是否具有脱水酶活性。用无菌牙签将这些转化体转移到微量滴定板,该滴定板含有200uL的补加或者0.2%甘油或0.2%甘油+0.2%D-葡萄糖的培养基A。于30℃温育48小时后,该微量滴定板各孔的内容物通过0.45微米尼龙滤膜过滤,并用HPLC进行层析。这些测试的结果见表1。
表1用转化的ECL707使甘油转化为1,3-丙二醇转化体 甘油*甘油+葡萄糖*ECL707-pKP1 19/20 19/20ECL707-pKP2 18/20 20/20ECL707-pKP4 0/20 20/20ECL707-sc 0/50/5*(阳性分离物数/测试分离物数)AA200单独用相应于pKP1、pKP2、pKP4和Supercos载体中的一种的粘粒肺炎克雷伯氏菌DNA转化大肠杆菌菌株AA200,并分别命名为AA200-pKP1、AA200-pKP2、AA200-pKP4和AA200-sc。菌株AA200是丙糖磷酸异构酶(tpi-)缺陷的。
分离每种粘粒转化的20个单个菌落和5个Supercos空白载体(阴性对照)转化菌落,并按用于大肠杆菌菌株ECL707的所述方法测试其将甘油转化为1,3-丙二醇的能力。这些测试的结果见表2。
表2用转化的AA200使甘油转化为1,3-丙二醇转化体 甘油*甘油+葡萄糖*AA200-pKP1 17/2017/20AA200-pKP2 17/2017/20AA200-pKP4 2/20 16/20AA200-sc 0/5 0/5*(阳性分离物数/测试分离物数)
实施例2采用DAR1、GPP2、dhaB和dhaT通过重组大肠杆菌使D-葡萄糖转化为1,3-丙二醇构建一般目的表达质粒用于转化大肠杆菌表达载体pTacIQ大肠杆菌表达载体pTacIQ含有插入pBR322的EcoRI(Sutcliffe等,Cold Spring Harb.Symp.Quant.Biol.43,77(1979))的lacIq基因(Farabaugh,Nature 274,5673(1978))和tac启动子(Amann等,Gene 25,167(1983))。一个多克隆位点和终止子序列(SEQ ID NO20)取代pBR322从EcoRI到SphI的序列。亚克隆甘油脱水酶基因(dhaB1,2,3)采用引物(SEQ ID NO21和22),通过PCR从pHK28-26扩增dhaB3基因的可读框(在3’末端加入XbaI位点和在5’末端加入EcoRI位点)。将该产物亚克隆入pLitmus29(New England Biolab,Inc.,Beverly,MA),产生含dhaB3的质粒pDHAB3。
采用限制酶KpnI和EcoRI将得自pHK28-26的dhaB操纵子的4个基因的完整编码区的区段克隆入pBluescriptII SK+(Stratagene,La Jolla,CA),产生质粒pM7。
通过用ApaI和XbaI消化含有dhaB(1,2,3,4)的质粒pM7,去除dhaBX基因(缺失部分dhaB3和所有dhaBX)。纯化所产生5.9kb片段,并将其与得自质粒pDHAB3的325-bp ApaI-XbaI片段连接(恢复dhaB3基因),产生含dhaB(1,2,3)的pM11。
采用引物(SEQ ID NO23和SEQ ID NO24),通过PCR从pHK28-26扩增dhaB1基因的可读框(在5’末端加入HindIII位点和共有RBS核糖体结合位点,以及在3’末端加入XbaI位点)。将上述产物亚克隆到pLitmus28(New England Biolab,Inc.)中,产生含dhaB1的质粒pDT1。
将得自pM11含dhaB1基因、dhaB2基因和ahaB3基因部分的NotI-XbaI片段插入pDT1,产生dhaB表达质粒pDT2。将含得自pDT2的dhaB(1,2,3)基因的HindIII-XbaI片段插入pTacIQ,产生pDT3。亚克隆1,3-丙二醇脱氢酶基因(dhaT)将含有完整1,3-丙二醇脱氢酶(dhaT)基因的pHK28-26的KpnI-SacI片段亚克隆入pBluescriptII SK+,产生质粒pAH1。采用合成引物(SEQID NO25和SEQ ID NO26),从作为模板DNA的pAH1通过PCR扩增dhaT基因(于5’末端加入XbaI位点和于3’末端加入BamHI位点)。将该产物亚克隆入pCR-Script(Stratagene)的SrfI位点,产生含有dhaT的质粒pAH4和pAH5。质粒pAH4含有从pCR-Script lac启动子表达的正确方向的dhaT基因,而pAH5含有相反方向的dhaT基因。将得自pAH4含有dhaT基因的XbaI-BamHI片段插入pTacIQ,产生质粒pAH8。将得自pAH8含有RBS和dhaT基因的HindIII-BamHI片段插入pBluescriptII SK+,产生pAH11。将得自pAH8含有RBS、dhaT基因和终止子的HindIII-SalI片段插入pBluescriptII SK+,产生pAH12。构建dhaB(1,2,3)和dhaT的表达盒用标准分子生物学方法,从上述各个dhaB(1,2,3)和dhaT亚克隆装配dhaB(1,2,3)和dhaT的表达盒。将得自pAH8含有RBS、dhaT基因和终止子的SpeI-KpnI片段插入pDT3的XbaI-KpnI位点,产生pAH23。去除pAH23的dhaB3和dhaT基因之间的SmaI-EcoRI片段,产生pAH26。使用含有得自pDT2的一个EcoRI位点的SpeI-NcotI片段替换pAH26的SpeI-NcotI片段,产生pAH27。构建dhaT和dhaB(1,2,3)的表达盒用标准分子生物学方法,从上述各个dhaB(1,2,3)和dhaT亚克隆装配dhaT和dhaB(1,2,3)的表达盒。将含有得自pDT3的dhaB(1,2,3)基因的SpeI-SacI片段插入pAH11的SpeI-SacI位点,产生pAH24。克隆和表达用于提高大肠杆菌甘油产量的甘油3-磷酸酶酿酒酵母染色体V的λ克隆6592(Gene Bank,登记号为U18813x11)得自ATCC。用合成引物(SEQ ID NO27和SEQ ID NO28)从作为靶DNA的λ克隆,通过PCR克隆甘油3-磷酸磷酸酶(GPP2)基因(于5’末端加入BamHI-RBS-XbaI位点和于3’末端加入SmaI位点)。将该产物亚克隆入pCR-Script(Stratagene)的SrfI位点,产生含有GPP2的质粒pAH15。质粒pAH15含有从pCR-Script SK+lac启动子表达的无活性方向的GPP2基因。将得自pAH15含有GPP2基因的BamHI-SmaI片段插入pBluescriptII SK+,产生质粒pAH19。pAH19含有从所述lac启动子表达的正确方向的GPP2基因。将得自pAH19含有GPP2基因的XbaI-PstI片段插入pPHOX2,产生质粒pAH21。用于表达dhaT、dhaB(1,2,3)和GPP2基因的质粒将SalI-EcoRI-XbaI接头(SEQ ID NO29和30)插入用限制性酶SalI-XbaI消化的pAH5,产生pDT16。该接头破坏了XbaI位点。然后将来自pDT16的1 kb SalI-MluI片段插入pAH24,替代已存在的SalI-MluI片段,产生pDT18。
将含有得自pDT18的dhaT和dhaB(1,2,3)的表达盒的4.1kb EcoRI-XbaI片段和含有得自pAH21的GPP2基因的1.0kb XbaI-SalI片段插入用限制性酶EcoRI和SalI消化的载体pMMB66EH(Füste等,GENE,48,119(1986)),产生pDT20。用于在大肠杆菌中超量表达DAR1的质粒用合成引物(SEQ ID NO46和SEQ ID NO47),通过PCR克隆从酿酒酵母基因组DNA分离DAR1。成功的PCR克隆将一个NcoI位点置于DAR1 5’末端,其中NcoI中的ATG是DAR1的起始密码子甲硫氨酸。在DAR1 3’末端将一个BamHI位点导入翻译终止子之后。上述PCR片段用NcoI+BamHI消化并克隆入表达质粒pTrc99A(Pharmacia,Piscataway,New Jersey)中的相同位点,产生pDAR1A。
为了在DAR1的5’末端产生更好的核糖体结合位点,将通过使合成引物(SEQ ID NO48和SEQ ID NO49)退火获得的SpeI-RBS-NcoI接头插入pDAR1A的NcoI位点,产生pAH40。质粒pAH40含有从Trc99A(Pharmacia)trc启动子表达的正确方向的新RBS和DAR1基因。将得自pDAR1A的NcoI-BamHI片段和通过使合成引物(SEQ ID NO31和SEQID NO32)退火获得的第二组SpeI-RBS-NcoI接头插入pBluescript II-SK+(Stratagene)的SepI-BamHI位点,产生pAH41。构建物pAH41含有氨苄青霉素抗性基因。将得自pDAR1A的NcoI-BamHI片段和通过使合成引物(SEQ ID NO31和SEQ ID NO32)退火获得的第二组SpeI-RBS-NcoI接头插入pBC-SK+(Stratagene)的SepI-BamHI位点,产生pAH42。构建物pAH42含有氯霉素抗性基因。构建DAR1和GPP2的表达盒用标准分子生物学方法,从上述各个DAR1和GPP2亚克隆装配DAR1和GPP2的表达盒。将得自pAH19含有RBS和GPP2基因的BamHI-PstI片段插入pAH40,产生pAH43。将得自pAH19含有RBS和GPP2基因的BamHI-PstI片段插入pAH41,产生pAH44。也将得自pAH19含有RBS和GPP2基因的相同BamHI-PstI片段插入pAH42,产生pAH45。构建大肠杆菌菌株大肠杆菌W1485是野生型K-12菌株(ATCC 12435)。用质粒pDT20和pAH42转化该菌株,并在补加50μg/mL羧苄青霉素和10μg/mL氯霉素的LA(Luria Agar,Difco)平板上进行选择。由葡萄糖生产1,3-丙二醇将大肠杆菌W1485/pDT20/pAH42从平板转移到50mL培养基,每升培养基含有22.5g萄萄糖、6.85g K2HPO4、6.3g(NH4)2SO4、0.5gNaHCO3、2.5g NaCl、8g酵母提取物、8g胰蛋白胨、2.5mg维生素B12、2.5mL改良Balch’s微量元素溶液、50mg羧苄青霉素和10mg氯霉素,终pH为6.8(HCl),然后过滤除菌。改良Balch’s微量元素溶液的组成可以见于Methods for General and Molecular Bacteriology(P.Gerhardt等编辑,第158页,American Society for Microbiology,Washington,DC,(1994))。于37℃、以300rpm震摇培养6小时后,加入0.5g葡萄糖和IPTG(终浓度=0.2mM)并将震摇速率降低为100rpm。用GC/MS分析样品。24小时后,W1485/pDT20/pAH42产生1.1g/L甘油和195mg/L 1,3-丙二醇。
实施例3在酿酒酵母中克隆和表达dhaB和dhaT构建可用于上述4个dha基因的每一个的表达质粒,所述表达质粒可以作为复制附加型元件存在。对于所有表达质粒,均存在一个酵母ADH1启动子,并由DNA片段将其与酵母ADH1转录终止子分开,所述DNA片段含有一个或多个限制性内切酶的识别位点。每个表达质粒也含有用于在含氨苄青霉素的培养基上选择大肠杆菌的β-内酰胺酶基因、用于将质粒保持于大肠杆菌的复制起点和保持于酿酒酵母的2μm复制起点。用于酵母并存在于表达质粒上的选择性营养标记为以下中的一种编码咪唑甘油磷酸酯脱水酶的HIS3基因、编码乳清酸核苷5’-磷酸脱羧酶的URA3基因、编码N-(5’-磷酸核糖)-邻氨基苯甲酸异构酶的TRP1基因和编码β-异丙基苹果酸脱氢酶的LEU2基因。
用引物(SEQ ID NO38和SEQ ID NO39、SEQ ID NO40和SEQID NO41、SEQ ID NO42和SEQ ID NO43、SEQ ID NO44和SEQ IDNO45分别是dhaT、dhaB3、dhaB2、dhaB1的引物对)于5’末端掺入EcoRI位点,通过PCR从pHK28-26(SEQ ID NO19)扩增dhaT、dhaB3、dhaB2和dhaB1的可读框(10mM Tris pH8.3、50mM KCl、1.5mM MgCl2、0.0001%明胶、200μm dATP、200μm dCTP、200μm dGTP、200μm dTTP、每种引物各1μM、1-10ng靶DNA、25单位/mL AmplitaqTMDNA聚合酶(Perkin-Elmer Cetus,Norwalk CT))。PCR参数为于94℃1分钟、于55℃1分钟、于72℃1分钟,进行35个循环。将上述产物亚克隆入pHIL-D4(Phillips Petroleum,Bartlesville,OK)的EcoRI位点,产生分别含有dhaT、dhaB3、dhaB2和dhaB1的质粒pMP13、pMP14、pMP20和pMP15。构建dhaB1表达质粒pMCK107.8kb的复制型质粒pGADGH(Clontech,Palo Alto,CA)用HindIII消化,去磷酸化并连接至来自pMP15的dhaB1 HindIII片段。产生的质粒(pMCK10)具有从ADH1启动子转录的正确方向的dhaB1,并含有LEU2标记。构建dhaB2表达质粒pMCK17质粒pGADGH(Clontech,Palo Alto,CA)用HindIII消化,其单链末端通过与HindIII-XmnI和EcoRI-XmnI连接物(New England Biolabs,Beverly,MA)连接,转化为EcoRI末端。通过连接至得自质粒pUC4K(Pharmacia Biotech,Uppsala)的EcoRI片段上的卡那霉素抗性基因、转化入大肠杆菌菌株DH5α并在含25ug/mL卡那霉素的LB平板上选择,完成选择具有正确EcoRI末端的质粒。所产生的质粒(pGAD/KAN2)用SnaBI和EcoRI消化,分离具有ADH1启动子的1.8kb片段。质粒pGBT9(Clontech,Palo Alto,CA)用SnaBI和EcoRI消化,并用通过以SnaBI和EcoRI消化从pGAD/KAN2分离的1.8kb ADH1启动子片段取代1.5kbADH1/GAL4片段。产生的载体(pMCK11)是具有ADH1启动子和终止子和TRP1标记的酵母复制型质粒。质粒pMCK11用EcoRI消化,脱磷酸化并连接至来自pMP20的dhaB2 EcoRI片段。产生的质粒(pMCK17)具有从ADH1启动子转录的正确方向的dhaB2,并含有TRP1标记。构建dhaB3表达质粒pMCK30用NaeI和PvuII消化质粒pGBT9(Clontech),从该载体去除1kb的TRP1基因。该TRP1基因由得自质粒pRS406(Stratagene)的1.7kbAatII/NaeI片段提供的URA3基因取代,产生中间载体pMCK32。去除存在于pMCK32的1.5kb SnaBI/EcoRI片段上的截短的ADH1启动子,并用得自质粒pGAD/KAN2的1.8kb SnaBI/EcoRI片段上的全长ADH1启动子取代,产生载体pMCK26。利用pMCK26上的唯一EcoRI位点插入具有得自质粒pMP14的dhaB3的EcoRI片段,产生pMCK30。该pMCK30复制型表达质粒具有从ADH1启动子表达的有效方向的dhaB3,并含有URA3标记。构建dhaT表达质粒pMCK35质粒pGBT9(Clontech)用NaeI和PvuII消化,从该载体去除1kb TRP1基因。该TRP1基因由得自质粒pRS403(Stratagene)的XmnI/NaeI片段提供的HIS3基因取代,产生中间载体pMCK33。去除存在于pMCK33的1.5kb SnaBI/EcoRI片段上的截短的ADH1启动子,并用得自质粒pGAD/KAN2的1.8kb SnaBI/EcoRI片段上的全长ADH1启动子取代,产生载体pMCK31。利用pMCK31上的唯一EcoRI位点插入具有得自质粒pMP13的dhaT的EcoRI片段,产生pMCK35。该pMCK35复制型表达质粒具有从ADH1启动子表达的有效方向的dhaT,并含有HIS3标记。用dha表达质粒转化酿酒酵母采用Frozen-EZ酵母转化试剂盒(分类号T2001)(Zymo Research,Orange,CA),使用1-2μg质粒DNA转化购自Stratagene(La Jolla,CA)的酿酒酵母菌株YPH500(ura3-52 lys2-801 ade2-101 trpl-Δ63 his3-Δ200leu2-Δ1)(Sikorski R.S.和Hieter P.,Genetics 122,19-27,(1989))。菌落在补加基本培养基(SMM-0.67%无氨基酸的酵母氮碱,2%葡萄糖)上于29℃生长3-4天,所述补加培养基含有一种或多种以下补加成分腺嘌呤硫酸盐(20mg/L)、尿嘧啶(20mg/L)、L-色氨酸(20mg/L)、L-组氨酸(20mg/L)、L-亮氨酸(30mg/L)、L-赖氨酸(30mg/L)。在选择性平板上划线接种菌落并用来接种液体培养基。筛选dha基因的酿酒酵母转化体用每个基因(SEQ ID NOS38-45)的特异性引物通过PCR分析URA+、HIS+、TRP+、LEU+转化体的染色体DNA。证实存在所有4个可读框。在转化的酿酒酵母中表达dhaB和dhaT活性用体外酶测定法证实存在活性甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)。另外,蛋白质印迹分析证实蛋白表达自所有4个可读框。
用一组质粒pMCK10、pMCK17、pMCK30和pMCK35转化的菌株YPH500生长于补充基本培养基,所述补充培养基含有0.67%无氨基酸的酵母氮碱、2%葡萄糖、20mg/L腺苷硫酸盐和30mg/L L-赖氨酸。匀浆细胞,并检测其提取物的dhaB活性。获得的甘油脱水酶比活为0.12单位/mg蛋白;1,3-丙二醇氧化还原酶比活为0.024单位/mg蛋白。
实施例4用重组酿酒酵母由D-葡萄糖生产1,3-丙二醇含有质粒pMCK10、pMCK17、pMCK30和pMCK35的酿酒酵母YPH500生长于BiostatB发酵罐中的1.0L基本培养基,所述基本培养基初始时含有22%葡萄糖、6.7%无氨基酸的酵母氮碱、40mg/L腺苷硫酸盐和60mg/L L-赖氨酸盐酸盐。在生长过程中加入另一相当量的酵母氮碱、腺嘌呤和赖氨酸。发酵罐通过加入10%磷酸和2M NaOH将pH控制于5.5、温度控制于30℃、通过搅拌控制使溶解氧张力为40%。38小时后,通过离心收集细胞(OD600=5.8AU),并重悬浮于基础培养基(6.7g/L无氨基酸的酵母氮碱、20mg/L腺苷硫酸盐、30mg/L L-赖氨酸盐酸盐和50mM磷酸钾缓冲液,pH7.0)。
在无光和缺氧(喷射氮)的情况下,在10mL卷曲密封(crimp sealed)血清瓶中制备总体积为4mL的基本培养基中含有细胞(OD600=20AU)的反应混合物并于30℃震摇培养,所述基本培养基补加0.5%葡萄糖、5ug/mL辅酶B12和0、10、20和40mM氯奎。30小时后,取出等分试样并用HPLC分析。结果显示于表3。
表3用重组酿酒酵母生产1,3-丙二醇氯奎 1,3-丙二醇反应 (mM) (Mm)1 00.22 10 0.23 20 0.34 40 0.7
实施例5使用dhaB和dhaT整合入基因组的酿酒酵母双转化体由D-葡萄糖生产1,3-丙二醇实施例5预示性证实了用dhaB1、dhaB2、dhaB3和dhaT转化的酿酒酵母,以及这些基因稳定整合入酵母基因组以由葡萄糖生产1,3-丙二醇。构建表达盒构建4种表达盒(dhaB1、dhaB2、dhaB3和dhaT)用于在酿酒酵母中由葡萄糖诱导并高水平组成型地表达这些基因。这些表达盒由以下组成(i)得自酿酒酵母菌株S288C的磷酸甘油激酶(PGK)启动子;(ii)dhaB1、dhaB2、dhaB3或dhaT中的一个基因;(iii)得自酵母菌株S228C的PGK终止子。使用由重叠延伸剪接的基因的基于PCR的技术(Horton等,BioTechniques,8528-535,(1990))来重组DNA序列,产生具有无缝连接、最佳表达每个基因的上述表达盒。将这些表达盒各自克隆入具有合适限制性位点的合适载体(pLITMUS 30),所述限制性位点适合于在酵母表达质粒进行多表达盒克隆。构建酵母整合载体构建用来实现表达盒整合入酵母基因组的载体。这些载体含有下列元件(i)表达盒亚克隆入其中的多克隆区;(ii)用来选择稳定酵母转化体的独特标记;(iii)复制起点和在转化酵母前允许在大肠杆菌中进行基因操作的选择标记。一种整合载体含有URA3营养缺陷型标记(YIp352b),而第二种整合载体含有LYS2营养缺陷型标记(pKP7)。构建酵母表达质粒将dhaB1和dhaB2的表达盒亚克隆入YIp352b的多克隆区(表达质粒#1),以及将dhaB3和dhaT的表达盒亚克隆入pKP7的多克隆区(表达质粒#2)。用表达质粒转化酵母利用Frozen-EZ酵母转化试剂盒(Zymo Research,Orange,CA),用表达质粒#1转化酿酒酵母(ura3,lys2),在缺乏尿嘧啶的平板上选择转化体。通过PCR分析染色体DNA证实整合了dhaB1和dhaB2的表达盒。利用Frozen-EZ酵母转化试剂盒,用表达质粒#2再转化选择的转化体,并在缺乏赖氨酸的平板上选择双转化体。通过PCR分析染色体DNA证实整合了dhaB3和dhaT的表达盒。通过PCR分析染色体DNA证实在双转化体中存在所有4个表达盒(dhaB1、dhaB2、dhaB3和dhaT)。由双转化的酵母生产蛋白蛋白印迹分析证实,双转化酵母生产dhaB1、dhaB2、dhaB3和dhaT编码的蛋白。双转化酵母的酶活性用在上述一般方法中描述的酶检测法证实,双转化的酵母产生活性甘油脱水酶和活性1,3-丙二醇脱氢酶。由双转化的酵母生产1,3-丙二醇基本上如实施例4描述一样,证实双转化的酵母利用葡萄糖生产1,3-丙二醇。
实施例6构建含DAR1/GPP2或dhaT/dhaB1-3的质粒并将其转化入克雷伯氏杆菌属菌种肺炎克雷伯氏菌(ATCC 25955)、肺炎克雷伯氏菌(ECL 2106)和产酸克雷伯氏菌(K.oxytoca)(ATCC 8724)天然抗氨苄青霉素(高达150ug/mL)和卡那霉素(高达50ug/mL),但是对四环素(10ug/Ml)和氯霉素(25ug/Ml)敏感。结果,编码后两种抗生素抗性的复制型质粒可潜在性用作上述克雷伯氏杆菌菌株的克隆载体。通过用中等拷贝数质粒pBR322(New England Biolabs,Beverly,MA)进行电穿孔,野生型肺炎克雷伯氏杆菌(ATCC 25955)、葡萄糖去阻抑的肺炎克雷伯氏杆菌(ECL2106)和产酸克雷伯氏菌(ATCC 8724)成功转化为四环素抗性。通过以下程序完成该过程将10mL过夜培养物接种入1L LB(1%(w/v)细菌培养用胰蛋白胨(Difco,Detroit,MI)、0.5%细菌培养用酵母提取物(Difco)和0.5%(w/v)NaCl(Sigma,St.Louis,MO)),该培养物于37℃培养至OD600为0.5-0.7。在冰上冷却上述细胞,4000xg离心15分钟收获细胞,并重悬浮于1L冰冷无菌10%甘油中。离心重复收获细胞,并依次重悬浮于500mL、20mL、最后为2mL的冰冷无菌10%甘油中。为了进行电穿孔,在冰冷的0.2cm杯中将40uL细胞与1-2uL DNA混合,并用BioRad基因脉冲仪(BioRad,Richmond,CA)于200Ω、2.5kV脉冲处理4-5毫秒。将1uL SOC培养基(2%(w/v)细菌培养用胰蛋白胨(Difco)、0.5%细菌培养用酵母提取物(Difco)、10μM NaCl、10μM MgCl2、10μM MgSO4、2.5μM KCl和20uM葡萄糖)加入细胞,在悬浮物转移到17×100mm无菌聚丙稀管后,该培养物于37℃、225rpm震摇培养1小时。如所指定的,将等份试样平板接种于选择培养基。分析来自独立的四环素抗性转化体的质粒DNA,显示典型的pBR322的限制性内切酶消化图型,表明在含四环素(10ug/mL)的LB培养基中于37℃培养过夜后仍然稳定保持所述载体。因此,该载体和诸如编码氨苄青霉素、四环素和氯霉素抗性的pBR329(ATCC 37264)的衍生物可以用来将DAR1/GPP2和dhaT/dhaB1-3表达盒导入肺炎克雷伯氏菌和产酸克雷伯氏菌。
在已知DAR1和GPP2基因的DNA序列的基础上,通过PCR介导的扩增由酿酒酵母基因组获得DAR1和GPP2基因。然后将在一种或多种启动子控制下所述基因转化入肺炎克雷伯氏菌或产酸克雷伯氏菌,所述启动子可以用来指导所述基因在含葡萄糖的培养基中表达。为了方便,在通过用PvuII限制性内切酶消化质粒pAH44获得的2.4kb DNA片段上获得所述基因,由此所述基因已经在表达盒中置于大肠杆菌lac启动子控制下。将该DNA片段连接至PvuII消化的pBR329,导致其氯霉素抗性基因插入失活。该连接的DNA用来转化大肠杆菌DH5α(Gibco,Gaithersberg,MD)。通过其四环素抗性(10ug/mL)选择转化体,并根据其氯霉素(25ug/mL)敏感性筛选。分析来自四环素抗性、氯霉素敏感性转化体的质粒DNA证实存在预期的质粒,其中Plac-dar1-gpp2表达盒以任一方向亚克隆入pBR329 PvuII位点。如上所述,通过电穿孔分别将命名为pJSP1A(顺时针方向)和pJSP1B(逆时针方向)质粒转化入肺炎克雷伯氏菌菌株ATCC 25955)、肺炎克雷伯氏菌(ECL 2106)和产酸克雷伯氏菌(ATCC 8724)。通过四环素抗性(10ug/mL)选择转化体,并根据其氯霉素(25ug/mL)敏感性筛选。限制性分析从独立转化体分离的质粒显示只有预期的消化图型,并证实于37℃用抗生素选择该质粒稳定保持。通过将IPTG(0.2-2.0mM)加入生长培养基,可以增强表达DAR1和GPP2基因。
在已知dhaB(1-33)和dhaT基因的DNA序列的基础上,通过PCR介导的扩增从肺炎克雷伯氏菌基因组获得四种肺炎克雷伯氏菌dhaB(1-3)和dhaT基因。然后将在一种或多种启动子控制下的这些基因转化入肺炎克雷伯氏菌,所述启动子可以用来指导所述基因在含葡萄糖的培养基中表达。为了方便,在通过用KpnI/SacI限制性内切酶消化质粒pAH24获得的大约4.0kb DNA片段上获得上述基因,由此这些基因已经在表达盒中置于大肠杆菌lac启动子控制下。将该DNA片段连接至同样消化的pBC-KS+(Stratagene,LaJolla,CA),并用来转化大肠杆菌DH5α。通过其氯霉素(25ug/mL)抗性选择转化体,并在含X-gal的LB琼脂上筛选白色菌落表型。限制性分析来自氯霉素抗性转化体(显示白色菌落表型)的质粒DNA,证实存在称作pJSP2的预期质粒,在大肠杆菌lac启动子控制下的dhaT-dhaB(1-3)基因亚克隆入所述质粒。
为了增强葡萄糖转化为3G,该质粒通过电穿孔分别转化入已经含有Plac-dar1-gpp2表达盒的肺炎克雷伯氏菌(ATCC 25955)(pJSP1A)、肺炎克雷伯氏菌(ECL 2106)(pJSP1A)和产酸克雷伯氏菌(ATCC8724)(pJSP1A)。通过其四环素(10ug/mL)和氯霉素(25ug/mL)两者的抗性选择共转化体。限制性分析从独立的共转化体分离的质粒显示预期的pJSP2和pJSP1A消化图型。通过加入IPTH(0.2-2.0mM)至培养基中可以增强表达DAR1、GPP2、dhaB(1-3)和dhaT基因。
实施例7肺炎克雷伯氏菌利用葡萄糖生产1,3-丙二醇用pJSP1A转化的肺炎克雷伯氏菌菌株ECL 2106和2106-47和用pJSP1A和pJSP2转化的ATCC 25955均生长于各种用于由葡萄糖生产1,3-丙二醇的条件(参见表4)下的5L Applikon发酵罐中。菌株2106-47是ECL 2106的耐氟乙酸衍生物,该衍生物如Bauer等,Appl.Environ.Microbiol.56,1296(1990)中所述从氟乙酸/乳酸选择平板获得。在各种情况中,所用培养基均含有50-100mM磷酸钾缓冲液,pH7.5、40mM(NH4)2SO4、0.1%(w/v)酵母提取物、10μM CoCl2、6.5μM CuCl2、100μMFeCl3、18μM FeSO4、5μM H3BO3、50μM MnCl2、0.1μM Na2MoO4、25μM ZnCl2、0.82mM MgSO4、0.9mM CaCl2和10-20g/L葡萄糖。补充额外的葡萄糖,使残余葡萄糖保持过量。温度控制于37℃,用5N KOH或NaOH将pH控制于7.5。包含合适抗生素用于保持质粒;也以指定浓度加入IPTG(异丙基-β-D-硫代半乳糖苷)。对于厌氧发酵,通过反应器喷射0.1vvm氮气;当dO设定点为5%时,通过反应器喷射1vvm空气,并将用维生素B12补充培养基。终浓度和总产率(g/g)示于表4。
表4肺炎克雷伯氏菌利用葡萄糖生产1,3-丙二醇
<p>实施例8含dar1、gpp2、dhaB和dhaT的重组肺炎克雷伯氏菌将多种碳底物转化为1,3-丙二醇A.各种肺炎克雷伯氏菌重组菌株将D-果糖转化为1,3-丙二醇从琼脂平板转移单个菌落的肺炎克雷伯氏菌(ATCC 25955pJSP1A)、肺炎克雷伯氏菌(ATCC 25955 pJSP1A/pJSP2)、肺炎克雷伯氏菌(ATCC 2106 pJSP1A)和肺炎克雷伯氏菌(ATCC 2106 pJSP1A/pJSP2),并在分开培养管的含合适抗生素的Luria-Bertani(LB)肉汤中传代培养过夜。50mL瓶中装有45mL称为LLMM/F的过滤除菌的基本培养基,每升所述培养基含有10g果糖;1g酵母提取物;50毫摩尔磷酸钾,pH7.5;40毫摩尔(NH4)2SO4;0.09毫摩尔CaCl2;2.38mg CoCl2·6H2O;0.88mg CuCl2·2H2O;27mg FeCl3·6H2O;5mg FeSO4·7H2O;0.31mgH3BO3;10mg MnCl2·4H2O;0.023mg Na2MoO4·2H2O;3.4mg ZnCl2;0.2mg MgSO4·7H2O。以10ug/mL将四环素加入培养基用于使用两个单个质粒重组体中的任何一个的反应;10ug/mL四环素和25ug/mL氯霉素用于使用两个双质粒重组体中任何一个的反应。用2mL传代培养物接种前,用氮气彻底喷射上述培养基。向部分瓶中加入终浓度为0.5mM的IPTG(I)。盖上培养瓶,然后于37℃、100rpm在New Brunswick Series25培养相/震摇器中培养。反应至少进行24小时或者直到大多数碳底物转化为产物。通过HPLC分析样品。表5描述了各种克雷伯氏菌重组体由果糖生产1,3-丙二醇的产率。
表5用重组克雷伯氏属菌由D-果糖生产1,3-丙二醇[3G]碳产率(%)克雷伯氏菌菌株 培养基 转化率 (g/L)2106 pBR329 LLMM/F 1000 02106 pJSP1A LLMM/F 50 0.66 15.52106 pJSP1A LLMM/F+I 1000.11 1.42106 pJSP1A/pJSP2LLMM/F 58 0.26 525955 pBR329 LLMM/F 1000 025955 pJSP1A LLMM/F 1000.3425955 pJSP1A LLMM/F+I 1000.15 225955 pJSP1A/pJSP2 LLMM/F 1000.91125955 pJSP1A/pJSP2 LLMM/F+I 62 1.020B.肺炎克雷伯氏菌(ATCC 25955 pJSP1A/pJSP2)将各种碳底物转化为1,3-丙二醇将1等份(0.1mL)的肺炎克雷伯氏菌(ATCC 25955 pJSP1A/pJSP2)冻藏培养物转移至具有档板的250mL瓶中的50mL种子培养基。每升种子培养基含有0.1M NaK/PO4缓冲液,pH7.0;3g(NH4)2SO4;5g葡萄糖;0.15g MgSO4·7H2O;10mL 100X微量元素溶液;25mg氯霉素;10mg四环素和1g酵母提取物。每升100X微量元素溶液含有10g柠檬酸1.5g CaCl2·2H2O;2.8g FeSO4·7H2O;0.39g ZnSO4·7H2O;0.38gCuSO4·5H2O;0.2g CoCl2·6H2O和0.3g MnCl2·4H2O。产生的溶液用KOH或者H2SO4滴定至pH7.0。所述葡萄糖、微量元素、抗生素和酵母提取物分别灭菌。所述种子接种物于35℃、250rpm培养过夜。
上述反应设计为半有氧。该系统由125mL密封瓶中的130mL反应培养基组成,所述密封瓶用铝箔条留有部分开口。每升反应培养基含有3g(NH4)2SO4;20g碳底物;0.15M NaK/PO4缓冲液,pH7.5;1g酵母提取物;0.15g MgSO4·7H2O;0.5毫摩尔IPTG;10mL 100X微量元素液;25mg氯霉素和10mg四环素。产生的溶液用KOH或H2SO4滴定至pH7.5。所述碳源为D-葡萄糖(Glc);D-果糖(Frc);D-乳糖(Lac);D-蔗糖(Suc);D-麦芽糖(Mal)和D-甘露醇(Man)。在所述培养基中含有几粒玻璃珠以增强混合。通过加入种子接种物起始该反应,使得细胞悬液光密度开始时于λ600nm检测为0.1AU。培养瓶于35℃、250rpm培养。24小时后通过HPLC测定3G产量。表6描述了由各种碳底物生产1,3-丙二醇的产率。
表6使用重组克雷伯氏菌25955 pJSP1A/pJSP2由各种碳底物生产1,3-丙二醇1,3-丙二醇(g/L)碳底物 实验1 实验2 实验3Glc 0.8911.6Frc 0.190.23 0.24Lac 0.150.58 0.56Suc 0.880.62Mal 0.050.03 0.02Man 0.030.05 0.04
序列表(1)一般资料(i) 申请人(A)收信人E.I.DU PONT DE NEMOUS AND COMPANY(B)街道1007 MARKET STREET(C)城市WILMINGTON(D)州DELAWARE(E)国家美国(F)邮政编码19898(G)电话302-892-8112(H)传真302-773-0164(I)用户电报6717325(A)收信人GENENCOR INTERNATIONAL,INC.
(B)街道4 CAMBRIDGE PLACE1870 SOUTH WINTON ROAD(C)城市ROCHESTER(D)州纽约州(E)国家美国(F)邮政编码14618(ii)发明名称关于重组生物体生产1,3-丙二醇的方法(iii)序列数49(iv)计算机可读形式(A) 媒体类型3.50英寸软盘(B) 计算机IBM PC兼容机(C) 操作系统MICROSOFT WORD FOR WINDOWS 95(D) 软件MICROSOFT WORD VERSION 7.0A(v)当前申请数据(A) 申请号(B) 提交日期(C) 分类(vi)在先申请数据(A) 申请号60/030,601(B) 提交日期1996年11月13日(vii)代理律师/代理人资料(A) 姓名FLORD,LINDA AXAMETHY(B) 注册号33,692(C) 参考/档案号CR-9982(2)SEQ ID NO1的信息(i)序列特征(A)长度1668个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假说否(iv)反义否(vi)原始来源(A)生物体DHAB1(xi)序列描述SEQ ID NO1ATGAAAAGAT CAAAACGATT TGCAGTACTG GCCCAGCGCC CCGTCAATCA GGACGGGCTG60ATTGGCGAGT GGCCTGAAGA GGGGCTGATC GCCATGGACA GCCCCTTTGA CCCGGTCTCT 120TCAGTAAAAG TGGACAACGG TCTGATCGTC GAACTGGACG GCAAACGCCG GGACCAGTTT 180GACATGATCG ACCGATTTAT CGCCGATTAC GCGATCAACG TTGAGCGCAC AGAGCAGGCA 240ATGCGCCTGG AGGCGGTGGA AATAGCCCGT ATGCTGGTGG ATATTCACGT CAGCCGGGAG 300GAGATCATTG CCATCACTAC CGCCATCACG CCGGCCAAAG CGGTCGAGGT GATGGCGCAG 360ATGAACGTGG TGGAGATGAT GATGGCGCTG CAGAAGATGC GTGCCCGCCG GACCCCCTCC 420AACCAGTGCC ACGTCACCAA TCTCAAAGAT AATCCGGTGC AGATTGCCGC TGACGCCGCC 480GAGGCCGGGA TCCGCGGCTT CTCAGAACAG GAGACCACGG TCGGTATCGC GCGCTACGCG 540CCGTTTAACG CCCTGGCGCT GTTGGTCGGT TCGCAGTGCG GCCGCCCCGG CGTGTTGACG 600CAGTGCTCGG TGGAAGAGGC CACCGAGCTG GAGCTGGGCA TGCGTGGCTT AACCAGCTAC 660GCCGAGACGG TGTCGGTCTA CGGCACCGAA GCGGTATTTA CCGACGGCGA TGATACGCCG 720TGGTCAAAGG CGTTCCTCGC CTCGGCCTAC GCCTCCCGCG GGTTGAAAAT GCGCTACACC 780TCCGGCACCG GATCCGAAGC GCTGATGGGC TATTCGGAGA GCAAGTCGAT GCTCTACCTC 840GAATCGCGCT GCATCTTCAT TACTAAAGGC GCCGGGGTTC AGGGACTGCA AAACGGCGCG 900GTGAGCTGTA TCGGCATGAC CGGCGCTGTG CCGTCGGGCA TTCGGGCGGT GCTGGCGGAA 960AACCTGATCG CCTCTATGCT CGACCTCGAA GTGGCGTCCG CCAACGACCA GACTTTCTCC 1020CACTCGGATA TTCGCCGCAC CGCGCGCACC CTGATGCAGA TGCTGCCGGG CACCGACTTT 1080ATTTTCTCCG GCTACAGCGC GGTGCCGAAC TACGACAACA TGTTCGCCGG CTCGAACTTC 1140GATGCGGAAG ATTTTGATGA TTACAACATC CTGCAGCGTG ACCTGATGGT TGACGGCGGC 1200CTGCGTCCGG TGACCGAGGC GGAAACCATT GCCATTCGCC AGAAAGCGGC GCGGGCGATC 1260CAGGCGGTTT TCCGCGAGCT GGGGCTGCCG CCAATCGCCG ACGAGGAGGT GGAGGCCGCC 1320ACCTACGCGC ACGGCAGCAA CGAGATGCCG CCGCGTAACG TGGTGGAGGA TCTGAGTGCG 1380GTGGAAGAGA TGATGAAGCG CAACATCACC GGCCTCGATA TTGTCGGCGC GCTGAGCCGC 1440AGCGGCTTTG AGGATATCGC CAGCAATATT CTCAATATGC TGCGCCAGCG GGTCACCGGC 1500GATTACCTGC AGACCTCGGC CATTCTCGAT CGGCAGTTCG AGGTGGTGAG TGCGGTCAAC 1560GACATCAATG ACTATCAGGG GCCGGGCACC GGCTATCGCA TCTCTGCCGA ACGCTGGGCG 1620GAGATCAAAA ATATTCCGGG CGTGGTTCAG CCCGACACCA TTGAATAA 1668(2)SEQ ID NO2的信息(i)序列特征(A)长度585个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体DHAB2(xi)序列描述SEQ ID NO2GTGCAACAGA CAACCCAAAT TCAGCCCTCT TTTACCCTGA AAACCCGCGA GGGCGGGGTA60GCTTCTGCCG ATGAACGCGC CGATGAAGTG GTGATCGGCG TCGGCCCTGC CTTCGATAAA 120CACCAGCATC ACACTCTGAT CGATATGCCC CATGGCGCGA TCCTCAAAGA GCTGATTGCC 180GGGGTGGAAG AAGAGGGGCT TCACGCCCGG GTGGTGCGCA TTCTGCGCAC GTCCGACGTC 240TCCTTTATGG CCTGGGATGC GGCCAACCTG AGCGGCTCGG GGATCGGCAT CGGTATCCAG 300TCGAAGGGGA CCACGGTCAT CCATCAGCGC GATCTGCTGC CGCTCAGCAA CCTGGAGCTG 360TTCTCCCAGG CGCCGCTGCT GACGCTGGAG ACCTACCGGC AGATTGGCAA AAACGCTGCG 420CGCTATGCGC GCAAAGAGTC ACCTTCGCCG GTGCCGGTGG TGAACGATCA GATGGTGCGG 480CCGAAATTTA TGGCCAAAGC CGCGCTATTT CATATCAAAG AGACCAAACA TGTGGTGCAG 540GACGCCGAGC CCGTCACCCT GCACATCGAC TTAGTAAGGG AGTGA 585(2)SEQ ID NO3的信息(i)序列特征(A)长度426个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体DHAB3(xi)序列描述SEQ ID NO3ATGAGCGAGA AAACCATGCG CGTGCAGGAT TATCCGTTAG CCACCCGCTG CCCGGAGCAT60ATCCTGACGC CTACCGGCAA ACCATTGACC GATATTACCC TCGAGAAGGT GCTCTCTGGC 120GAGGTGGGCC CGCAGGATGT GCGGATCTCC CGCCAGACCC TTGAGTACCA GGCGCAGATT 180GCCGAGCAGA TGCAGCGCCA TGCGGTGGCG CGCAATTTCC GCCGCGCGGC GGAGCTTATC 240GCCATTCCTG ACGAGCGCAT TCTGGCTATC TATAACGCGC TGCGCCCGTT CCGCTCCTCG 300CAGGCGGAGC TGCTGGCGAT CGCCGACGAG CTGGAGCACA CCTGGCATGC GACAGTGAAT 360GCCGCCTTTG TCCGGGAGTC GGCGGAAGTG TATCAGCAGC GGCATAAGCT GCGTAAAGGA 420AGCTAA 426(2)SEQ ID NO4的信息(i)序列特征(A)长度1164个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体DHAT(xi)序列描述SEQ ID NO4ATGAGCTATC GTATGTTTGA TTATCTGGTG CCAAACGTTA ACTTTTTTGG CCCCAACGCC60ATTTCCGTAG TCGGCGAACG CTGCCAGCTG CTGGGGGGGA AAAAAGCCCT GCTGGTCACC 120GACAAAGGCC TGCGGGCAAT TAAAGATGGC GCGGTGGACA AAACCCTGCA TTATCTGCGG 180GAGGCCGGGA TCGAGGTGGC GATCTTTGAC GGCGTCGAGC CGAACCCGAA AGACACCAAC 240GTGCGCGACG GCCTCGCCGT GTTTCGCCGC GAACAGTGCG ACATCATCGT CACCGTGGGC 300GGCGGCAGCC CGCACGATTG CGGCAAAGGC ATCGGCATCG CCGCCACCCA TGAGGGCGAT 360CTGTACCAGT ATGCCGGAAT CGAGACCCTG ACCAACCCGC TGCCGCCTAT CGTCGCGGTC 420AATACCACCG CCGGCACCGC CAGCGAGGTC ACCCGCCACT GCGTCCTGAC CAACACCGAA 480ACCAAAGTGA AGTTTGTGAT CGTCAGCTGG CGCAAACTGC CGTCGGTCTC TATCAACGAT 540CCACTGCTGA TGATCGGTAA ACCGGCCGCC CTGACCGCGG CGACCGGGAT GGATGCCCTG 600ACCCACGCCG TAGAGGCCTA TATCTCCAAA GACGCTAACC CGGTGACGGA CGCCGCCGCC 660ATGCAGGCGA TCCGCCTCAT CGCCCGCAAC CTGCGCCAGG CCGTGGCCCT CGGCAGCAAT 720CTGCAGGCGC GGGAAAACAT GGCCTATGCT TCTCTGCTGG CCGGGATGGC TTTCAATAAC 780GCCAACCTCG GCTACGTGCA CGCCATGGCG CACCAGCTGG GCGGCCTGTA CGACATGCCG 840CACGGCGTGG CCAACGCTGT CCTGCTGCCG CATGTGGCGC GCTACAACCT GATCGCCAAC 900CCGGAGAAAT TCGCCGATAT CGCTGAACTG ATGGGCGAAA ATATCACCGG ACTGTCCACT 960CTCGACGCGG CGGAAAAAGC CATCGCCGCT ATCACGCGTC TGTCGATGGA TATCGGTATT 1020CCGCAGCATC TGCGCGATCT GGGGGTAAAA GAGGCCGACT TCCCCTACAT GGCGGAGATG 1080GCTCTAAAAG ACGGCAATGC GTTCTCGAAC CCGCGTAAAG GCAACGAGCA GGAGATTGCC 1140GCGATTTTCC GCCAGGCATT CTGA 1164(2)SEQ ID NO5的信息(i)序列特征(A)长度1380个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体GPD1(xi)序列描述SEQ ID NO5CTTTAATTTT CTTTTATCTT ACTCTCCTAC ATAAGACATC AAGAAACAAT TGTATATTGT60ACACCCCCCC CCTCCACAAA CACAAATATT GATAATATAA AGATGTCTGC TGCTGCTGAT 120AGATTAAACT TAACTTCCGG CCACTTGAAT GCTGGTAGAA AGAGAAGTTC CTCTTCTGTT 180TCTTTGAAGG CTGCCGAAAA GCCTTTCAAG GTTACTGTGA TTGGATCTGG TAACTGGGGT 240ACTACTATTG CCAAGGTGGT TGCCGAAAAT TGTAAGGGAT ACCCAGAAGT TTTCGCTCCA 300ATAGTACAAA TGTGGGTGTT CGAAGAAGAG ATCAATGGTG AAAAATTGAC TGAAATCATA 360AATACTAGAC ATCAAAACGT GAAATACTTG CCTGGCATCA CTCTACCCGA CAATTTGGTT 420GCTAATCCAG ACTTGATTGA TTCAGTCAAG GATGTCGACA TCATCGTTTT CAACATTCCA 480CATCAATTTT TGCCCCGTAT CTGTAGCCAA TTGAAAGGTC ATGTTGATTC ACACGTCAGA 540GCTATCTCCT GTCTAAAGGG TTTTGAAGTT GGTGCTAAAG GTGTCCAATT GCTATCCTCT 600TACATCACTG AGGAACTAGG TATTCAATGT GGTGCTCTAT CTGGTGCTAA CATTGCCACC 660GAAGTCGCTC AAGAACACTG GTCTGAAACA ACAGTTGCTT ACCACATTCC AAAGGATTTC 720AGAGGCGAGG GCAAGGACGT CGACCATAAG GTTCTAAAGG CCTTGTTCCA CAGACCTTAC 780TTCCACGTTA GTGTCATCGA AGATGTTGCT GGTATCTCCA TCTGTGGTGC TTTGAAGAAC 840GTTGTTGCCT TAGGTTGTGG TTTCGTCGAA GGTCTAGGCT GGGGTAACAA CGCTTCTGCT 900GCCATCCAAA GAGTCGGTTT GGGTGAGATC ATCAGATTCG GTCAAATGTT TTTCCCAGAA 960TCTAGAGAAG AAACATACTA CCAAGAGTCT GCTGGTGTTG CTGATTTGAT CACCACCTGC 1020GCTGGTGGTA GAAACGTCAA GGTTGCTAGG CTAATGGCTA CTTCTGGTAA GGACGCCTGG 1080GAATGTGAAA AGGAGTTGTT GAATGGCCAA TCCGCTCAAG GTTTAATTAC CTGCAAAGAA 1140GTTCACGAAT GGTTGGAAAC ATGTGGCTCT GTCGAAGACT TCCCATTATT TGAAGCCGTA 1200TACCAAATCG TTTACAACAA CTACCCAATG AAGAACCTGC CGGACATGAT TGAAGAATTA 1260GATCTACATG AAGATTAGAT TTATTGGAGA AAGATAACAT ATCATACTTC CCCCACTTTT 1320TTCGAGGCTC TTCTATATCA TATTCATAAA TTAGCATTAT GTCATTTCTC ATAACTACTT 1380(2)SEQ ID NO6的信息(i)序列特征(A)长度2946个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构 线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体GPD2(xi)序列描述SEQ ID NO6GAATTCGAGC CTGAAGTGCT GATTACCTTC AGGTAGACTT CATCTTGACC CATCAACCCC60AGCGTCAATC CTGCAAATAC ACCACCCAGC AGCACTAGGA TGATAGAGAT AATATAGTAC 120GTGGTAACGC TTGCCTCATC ACCTACGCTA TGGCCGGAAT CGGCAACATC CCTAGAATTG 180AGTACGTGTG ATCCGGATAA CAACGGCAGT GAATATATCT TCGGTATCGT AAAGATGTGA 240TATAAGATGA TGTATACCCA ATGAGGAGCG CCTGATCGTG ACCTAGACCT TAGTGGCAAA 300AACGACATAT CTATTATAGT GGGGAGAGTT TCGTGCAAAT AACAGACGCA GCAGCAAGTA 360ACTGTGACGA TATCAACTCT TTTTTTATTA TGTAATAAGC AAACAAGCAC GAATGGGGAA 420AGCCTATGTG CAATCACCAA GGTCGTCCCT TTTTTCCCAT TTGCTAATTT AGAATTTAAA 480GAAACCAAAA GAATGAAGAA AGAAAACAAA TACTAGCCCT AACCCTGACT TCGTTTCTAT 540GATAATACCC TGCTTTAATG AACGGTATGC CCTAGGGTAT ATCTCACTCT GTACGTTACA 600AACTCCGGTT ATTTTATCGG AACATCCGAG CACCCGCGCC TTCCTCAACC CAGGCACCGC 660CCCAGGTAAC CGTGCGCGAT GAGCTAATCC TGAGCCATCA CCCACCCCAC CCGTTGATGA 720CAGCAATTCG GGAGGGCGAA AATAAAACTG GAGCAAGGAA TTACCATCAC CGTCACCATC 780ACCATCATAT CGCCTTAGCC TCTAGCCATA GCCATCATGC AAGCGTGTAT CTTCTAAGAT 840TCAGTCATCA TCATTACCGA GTTTGTTTTC CTTCACATGA TGAAGAAGGT TTGAGTATGC 900TCGAAACAAT AAGACGACGA TGGCTCTGCC ATTGGTTATA TTACGCTTTT GCGGCGAGGT 960GCCGATGGGT TGCTGAGGGG AAGAGTGTTT AGCTTACGGA CCTATTGCCA TTGTTATTCC 1020GATTAATCTA TTGTTCAGCA GCTCTTCTCT ACCCTGTCAT TCTAGTATTT TTTTTTTTTT 1080TTTTTGGTTT TACTTTTTTT TCTTCTTGCC TTTTTTTCTT GTTACTTTTT TTCTAGTTTT 1140TTTTCCTTCC ACTAAGCTTT TTCCTTGATT TATCCTTGGG TTCTTCTTTC TACTCCTTTA 1200GATTTTTTTT TTATATATTA ATTTTTAAGT TTATGTATTT TGGTAGATTC AATTCTCTTT 1260CCCTTTCCTT TTCCTTCGCT CCCCTTCCTT ATCAATGCTT GCTGTCAGAA GATTAACAAG 1320ATACACATTC CTTAAGCGAA CGCATCCGGT GTTATATACT CGTCGTGCAT ATAAAATTTT 1380GCCTTCAAGA TCTACTTTCC TAAGAAGATC ATTATTACAA ACACAACTGC ACTCAAAGAT 1440GACTGCTCAT ACTAATATCA AACAGCACAA ACACTGTCAT GAGGACCATC CTATCAGAAG 1500ATCGGACTCT GCCGTGTCAA TTGTACATTT GAAACGTGCG CCCTTCAAGG TTACAGTGAT 1560TGGTTCTGGT AACTGGGGGA CCACCATCGC CAAAGTCATT GCGGAAAACA CAGAATTGCA 1620TTCCCATATC TTCGAGCCAG AGGTGAGAAT GTGGGTTTTT GATGAAAAGA TCGGCGACGA 1680AAATCTGACG GATATCATAA ATACAAGACA CCAGAACGTT AAATATCTAC CCAATATTGA 1740CCTGCCCCAT AATCTAGTGG CCGATCCTGA TCTTTTACAC TCCATCAAGG GTGCTGACAT 1800CCTTGTTTTC AACATCCCTC ATCAATTTTT ACCAAACATA GTCAAACAAT TGCAAGGCCA 1860CGTGGCCCCT CATGTAAGGG CCATCTCGTG TCTAAAAGGG TTCGAGTTGG GCTCCAAGGG 1920TGTGCAATTG CTATCCTCCT ATGTTACTGA TGAGTTAGGA ATCCAATGTG GCGCACTATC 1980TGGTGCAAAC TTGGCACCGG AAGTGGCCAA GGAGCATTGC TCCGAAACCA CCGTGGCTTA 2040CCAACTACCA AAGGATTATC AAGGTGATGG CAAGGATGTA GATCATAAGA TTTTGAAATT 2100GCTGTTCCAC AGACCTTACT TCCACGTCAA TGTCATCGAT GATGTTGCTG GTATATCCAT 2160TGCCGGTGCC TTGAAGAACG TCGTGGCACT TGCATGTGGT TTCGTAGAAG GTATGGGATG 2220GGGTAACAAT GCCTCCGCAG CCATTCAAAG GCTGGGTTTA GGTGAAATTA TCAAGTTCGG 2280TAGAATGTTT TTCCCAGAAT CCAAAGTCGA GACCTACTAT CAAGAATCCG CTGGTGTTGC 2340AGATCTGATC ACCACCTGCT CAGGCGGTAG AAACGTCAAG GTTGCCACAT ACATGGCCAA 2400GACCGGTAAG TCAGCCTTGG AAGCAGAAAA GGAATTGCTT AACGGTCAAT CCGCCCAAGG 2460GATAATCACA TGCAGAGAAG TTCACGAGTG GCTACAAACA TGTGAGTTGA CCCAAGAATT 2520CCCAATTATT CGAGGCAGTC TACCAGATAG TCTACAACAA CGTCCGCATG GAAGACCTAC 2580CGGAGATGAT TGAAGAGCTA GACATCGATG ACGAATAGAC ACTCTCCCCC CCCCTCCCCC 2640TCTGATCTTT CCTGTTGCCT CTTTTTCCCC CAACCAATTT ATCATTATAC ACAAGTTCTA 2700CAACTACTAC TAGTAACATT ACTACAGTTA TTATAATTTT CTATTCTCTT TTTCTTTAAG 2760AATCTATCAT TAACGTTAAT TTCTATATAT ACATAACTAC CATTATACAC GCTATTATCG 2820TTTACATATC ACATCACCGT TAATGAAAGA TACGACACCC TGTACACTAA CACAATTAAA 2880TAATCGCCAT AACCTTTTCT GTTATCTATA GCCCTTAAAG CTGTTTCTTC GAGCTTTTCA 2940CTGCAG 2946(2)SEQ ID NO7的信息(i)序列特征(A)长度3178个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体GUT2(xi)序列描述SEQ ID NO7CTGCAGAACT TCGTCTGCTC TGTGCCCATC CTCGCGGTTA GAAAGAAGCT GAATTGTTTC60ATGCGCAAGG GCATCAGCGA GTGACCAATA ATCACTGCAC TAATTCCTTT TTAGCAACAC 120ATACTTATAT ACAGCACCAG ACCTTATGTC TTTTCTCTGC TCCGATACGT TATCCCACCC 180AACTTTTATT TCAGTTTTGG CAGGGGAAAT TTCACAACCC CGCACGCTAA AAATCGTATT 240TAAACTTAAA AGAGAACAGC CACAAATAGG GAACTTTGGT CTAAACGAAG GACTCTCCCT 300CCCTTATCTT GACCGTGCTA TTGCCATCAC TGCTACAAGA CTAAATACGT ACTAATATAT 360GTTTTCGGTA ACGAGAAGAA GAGCTGCCGG TGCAGCTGCT GCCATGGCCA CAGCCACGGG 420GACGCTGTAC TGGATGACTA GCCAAGGTGA TAGGCCGTTA GTGCACAATG ACCCGAGCTA 480CATGGTGCAA TTCCCCACCG CCGCTCCACC GGCAGGTCTC TAGACGAGAC CTGCTGGACC 540GTCTGGACAA GACGCATCAA TTCGACGTGT TGATCATCGG TGGCGGGGCC ACGGGGACAG 600GATGTGCCCT AGATGCTGCG ACCAGGGGAC TCAATGTGGC CCTTGTTGAA AAGGGGGATT 660TTGCCTCGGG AACGTCGTCC AAATCTACCA AGATGATTCA CGGTGGGGTG CGGTACTTAG 720AGAAGGCCTT CTGGGAGTTC TCCAAGGCAC AACTGGATCT GGTCATCGAG GCACTCAACG 780AGCGTAAACA TCTTATCAAC ACTGCCCCTC ACCTGTGCAC GGTGCTACCA ATTCTGATCC 840CCATCTACAG CACCTGGCAG GTCCCGTACA TCTATATGGG CTGTAAATTC TACGATTTCT 900TTGGCGGTTC CCAAAACTTG AAAAAATCAT ACCTACTGTC CAAATCCGCC ACCGTGGAGA 960AGGCTCCCAT GCTTACCACA GACAATTTAA AGGCCTCGCT TGTGTACCAT GATGGGTCCT 1020TTAACGACTC GCGTTTGAAC GCCACTTTAG CCATCACGGG TGTGGAGAAC GGCGCTACCG 1080TCTTGATCTA TGTCGAGGTA CAAAAATTGA TCAAAGACCC AACTTCTGGT AAGGTTATCG 1140GTGCCGAGGC CCGGGACGTT GAGACTAATG AGCTTGTCAG AATCAACGCT AAATGTGTGG 1200TCAATGCCAC GGGCCCATAC AGTGACGCCA TTTTGCAAAT GGACCGCAAC CCATCCGGTC 1260TGCCGGACTC CCCGCTAAAC GACAACTCCA AGATCAAGTC GACTTTCAAT CAAATCTCCG 1320TCATGGACCC GAAAATGGTC ATCCCATCTA TTGGCGTTCA CATCGTATTG CCCTCTTTTT 1380ACTCCCCGAA GGATATGGGT TTGTTGGACG TCAGAACCTC TGATGGCAGA GTGATGTTCT 1440TTTTACCTTG GCAGGGCAAA GTCCTTGCCG GCACCACAGA CATCCCACTA AAGCAAGTCC 1500CAGAAAACCC TATGCCTACA GAGGCTGATA TTCAAGATAT CTTGAAAGAA CTACAGCACT 1560ATATCGAATT CCCCGTGAAA AGAGAAGACG TGCTAAGTGC ATGGGCTGGT GTCAGACCTT 1620TGGTCAGAGA TCCACGTACA ATCCCCGCAG ACGGGAAGAA GGGCTCTGCC ACTCAGGGCG 1680TGGTAAGATC CCACTTCTTG TTCACTTCGG ATAATGGCCT AATTACTATT GCAGGTGGTA 1740AATGGACTAC TTACAGACAA ATGGCTGAGG AAACAGTCGA CAAAGTTGTC GAAGTTGGCG 1800GATTCCACAA CCTGAAACCT TGTCACACAA GAGATATTAA GCTTGCTGGT GCAGAAGAAT 1860GGACGCAAAA CTATGTGGCT TTATTGGCTC AAAACTACCA TTTATCATCA AAAATGTCCA 1920ACTACTTGGT TCAAAACTAC GGAACCCGTT CCTCTATCAT TTGCGAATTT TTCAAAGAAT 1980CCATGGAAAA TAAACTGCCT TTGTCCTTAG CCGACAAGGA AAATAACGTA ATCTACTCTA 2040GCGAGGAGAA CAACTTGGTC AATTTTGATA CTTTCAGATA TCCATTCACA ATCGGTGAGT 2100TAAAGTATTC CATGCAGTAC GAATATTGTA GAACTCCCTT GGACTTCCTT TTAAGAAGAA 2160CAAGATTCGC CTTCTTGGAC GCCAAGGAAG CTTTGAATGC CGTGCATGCC ACCGTCAAAG 2220TTATGGGTGA TGAGTTCAAT TGGTCGGAGA AAAAGAGGCA GTGGGAACTT GAAAAAACTG 2280TGAACTTCAT CCAAGGACGT TTCGGTGTCT AAATCGATCA TGATAGTTAA GGGTGACAAA 2340GATAACATTC ACAAGAGTAA TAATAATGGT AATGATGATA ATAATAATAA TGATAGTAAT 2400AACAATAATA ATAATGGTGG TAATGGCAAT GAAATCGCTA TTATTACCTA TTTTCCTTAA 2460TGGAAGAGTT AAAGTAAACT AAAAAAACTA CAAAAATATA TGAAGAAAAA AAAAAAAAGA 2520GGTAATAGAC TCTACTACTA CAATTGATCT TCAAATTATG ACCTTCCTAG TGTTTATATT 2580CTATTTCCAA TACATAATAT AATCTATATA ATCATTGCTG GTAGACTTCC GTTTTAATAT 2640CGTTTTAATT ATCCCCTTTA TCTCTAGTCT AGTTTTATCA TAAAATATAG AAACACTAAA 2700TAATATTCTT CAAACGGTCC TGGTGCATAC GCAATACATA TTTATGGTGC AAAAAAAAAA 2760ATGGAAAATT TTGCTAGTCA TAAACCCTTT CATAAAACAA TACGTAGACA TCGCTACTTG 2820AAATTTTCAA GTTTTTATCA GATCCATGTT TCCTATCTGC CTTGACAACC TCATCGTCGA 2880AATAGTACCA TTTAGAACGC CCAATATTCA CATTGTGTTC AAGGTCTTTA TTCACCAGTG 2940ACGTGTAATG GCCATGATTA ATGTGCCTGT ATGGTTAACC ACTCCAAATA GCTTATATTT 3000CATAGTGTCA TTGTTTTTCA ATATAATGTT TAGTATCAAT GGATATGTTA CGACGGTGTT 3060ATTTTTCTTG GTCAAATCGT AATAAAATCT CGATAAATGG ATGACTAAGA TTTTTGGTAA 3120AGTTACAAAA TTTATCGTTT TCACTGTTGT CAATTTTTTG TTCTTGTAAT CACTCGAG3178(2)SEQ ID NO8的信息(i)序列特征(A)长度816个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体GPP1(xi)序列描述SEQ ID NO8ATGAAACGTT TCAATGTTTT AAAATATATC AGAACAACAA AAGCAAATAT ACAAACCATC60GCAATGCCTT TGACCACAAA ACCTTTATCT TTGAAAATCA ACGCCGCTCT ATTCGATGTT 120GACGGTACCA TCATCATCTC TCAACCAGCC ATTGCTGCTT TCTGGAGAGA TTTCGGTAAA 180GACAAGCCTT ACTTCGATGC CGAACACGTT ATTCACATCT CTCACGGTTG GAGAACTTAC 240GATGCCATTG CCAAGTTCGC TCCAGACTTT GCTGATGAAG AATACGTTAA CAAGCTAGAA 300GGTGAAATCC CAGAAAAGTA CGGTGAACAC TCCATCGAAG TTCCAGGTGC TGTCAAGTTG 360TGTAATGCTT TGAACGCCTT GCCAAAGGAA AAATGGGCTG TCGCCACCTC TGGTACCCGT 420GACATGGCCA AGAAATGGTT CGACATTTTG AAGATCAAGA GACCAGAATA CTTCATCACC 480GCCAATGATG TCAAGCAAGG TAAGCCTCAC CCAGAACCAT ACTTAAAGGG TAGAAACGGT 540TTGGGTTTCC CAATTAATGA ACAAGACCCA TCCAAATCTA AGGTTGTTGT CTTTGAAGAC 600GCACCAGCTG GTATTGCTGC TGGTAAGGCT GCTGGCTGTA AAATCGTTGG TATTGCTACC 660ACTTTCGATT TGGACTTCTT GAAGGAAAAG GGTTGTGACA TCATTGTCAA GAACCACGAA 720TCTATCAGAG TCGGTGAATA CAACGCTGAA ACCGATGAAG TCGAATTGAT CTTTGATGAC 780TACTTATACG CTAAGGATGA CTTGTTGAAA TGGTAA 816(2)SEQ ID NO9的信息(i)序列特征(A)长度753个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体GPP2(xi)序列描述SEQ ID NO9ATGGGATTGA CTACTAAACC TCTATCTTTG AAAGTTAACG CCGCTTTGTT CGACGTCGAC 60GGTACCATTA TCATCTCTCA ACCAGCCATT GCTGCATTCT GGAGGGATTT CGGTAAGGAC 120AAACCTTATT TCGATGCTGA ACACGTTATC CAAGTCTCGC ATGGTTGGAG AACGTTTGAT 180GCCATTGCTA AGTTCGCTCC AGACTTTGCC AATGAAGAGT ATGTTAACAA ATTAGAAGCT 240GAAATTCCGG TCAAGTACGG TGAAAAATCC ATTGAAGTCC CAGGTGCAGT TAAGCTGTGC 300AACGCTTTGA ACGCTCTACC AAAAGAGAAA TGGGCTGTGG CAACTTCCGG TACCCGTGAT 360ATGGCACAAA AATGGTTCGA GCATCTGGGA ATCAGGAGAC CAAAGTACTT CATTACCGCT 420AATGATGTCA AACAGGGTAA GCCTCATCCA GAACCATATC TGAAGGGCAG GAATGGCTTA 480GGATATCCGA TCAATGAGCA AGACCCTTCC AAATCTAAGG TAGTAGTATT TGAAGACGCT 540CCAGCAGGTA TTGCCGCCGG AAAAGCCGCC GGTTGTAAGA TCATTGGTAT TGCCACTACT 600TTCGACTTGG ACTTCCTAAA GGAAAAAGGC TGTGACATCA TTGTCAAAAA CCACGAATCC 660ATCAGAGTTG GCGGCTACAA TGCCGAAACA GACGAAGTTG AATTCATTTT TGACGACTAC 720TTATATGCTA AGGACGATCT GTTGAAATGG TAA 753(2)SEQ ID NO10的信息(i)序列特征(A)长度2520个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体GUT1(xi)序列描述SEQ ID NO10TGTATTGGCC ACGATAACCA CCCTTTGTAT ACTGTTTTTG TTTTTCACAT GGTAAATAAC60GACTTTTATT AAACAACGTA TGTAAAAACA TAACAAGAAT CTACCCATAC AGGCCATTTC 120GTAATTCTTC TCTTCTAATT GGAGTAAAAC CATCAATTAA AGGGTGTGGA GTAGCATAGT 180GAGGGGCTGA CTGCATTGAC AAAAAAATTG AAAAAAAAAA AGGAAAAGGA AAGGAAAAAA 240AGACAGCCAA GACTTTTAGA ACGGATAAGG TGTAATAAAA TGTGGGGGGA TGCCTGTTCT 300CGAACCATAT AAAATATACC ATGTGGTTTG AGTTGTGGCC GGAACTATAC AAATAGTTAT 360ATGTTTCCCT CTCTCTTCCG ACTTGTAGTA TTCTCCAAAC GTTACATATT CCGATCAAGC 420CAGCGCCTTT ACACTAGTTT AAAACAAGAA CAGAGCCGTA TGTCCAAAAT AATGGAAGAT 480TTACGAAGTG ACTACGTCCC GCTTATCGCC AGTATTGATG TAGGAACGAC CTCATCCAGA 540TGCATTCTGT TCAACAGATG GGGCCAGGAC GTTTCAAAAC ACCAAATTGA ATATTCAACT 600TCAGCATCGA AGGGCAAGAT TGGGGTGTCT GGCCTAAGGA GACCCTCTAC AGCCCCAGCT 660CGTGAAACAC CAAACGCCGG TGACATCAAA ACCAGCGGAA AGCCCATCTT TTCTGCAGAA 720GGCTATGCCA TTCAAGAAAC CAAATTCCTA AAAATCGAGG AATTGGACTT GGACTTCCAT 780AACGAACCCA CGTTGAAGTT CCCCAAACCG GGTTGGGTTG AGTGCCATCC GCAGAAATTA 840CTGGTGAACG TCGTCCAATG CCTTGCCTCA AGTTTGCTCT CTCTGCAGAC TATCAACAGC 900GAACGTGTAG CAAACGGTCT CCCACCTTAC AAGGTAATAT GCATGGGTAT AGCAAACATG 960AGAGAAACCA CAATTCTGTG GTCCCGCCGC ACAGGAAAAC CAATTGTTAA CTACGGTATT 1020GTTTGGAACG ACACCAGAAC GATCAAAATC GTTAGAGACA AATGGCAAAA CACTAGCGTC 1080GATAGGCAAC TGCAGCTTAG ACAGAAGACT GGATTGCCAT TGCTCTCCAC GTATTTCTCC 1140TGTTCCAAGC TGCGCTGGTT CCTCGACAAT GAGCCTCTGT GTACCAAGGC GTATGAGGAG 1200AACGACCTGA TGTTCGGCAC TGTGGACACA TGGCTGATTT ACCAATTAAC TAAACAAAAG 1260GCGTTCGTTT CTGACGTAAC CAACGCTTCC AGAACTGGAT TTATGAACCT CTCCACTTTA 1320AAGTACGACA ACGAGTTGCT GGAATTTTGG GGTATTGACA AGAACCTGAT TCACATGCCC 1380GAAATTGTGT CCTCATCTCA ATACTACGGT GACTTTGGCA TTCCTGATTG GATAATGGAA 1440AAGCTACACG ATTCGCCAAA AACAGTACTG CGAGATCTAG TCAAGAGAAA CCTGCCCATA 1500CAGGGCTGTC TGGGCGACCA AAGCGCATCC ATGGTGGGGC AACTCGCTTA CAAACCCGGT 1560GCTGCAAAAT GTACTTATGG TACCGGTTGC TTTTTACTGT ACAATACGGG GACCAAAAAA 1620TTGATCTCCC AACATGGCGC ACTGACGACT CTAGCATTTT GGTTCCCACA TTTGCAAGAG 1680TACGGTGGCC AAAAACCAGA ATTGAGCAAG CCACATTTTG CATTAGAGGG TTCCGTCGCT 1740GTGGCTGGTG CTGTGGTCCA ATGGCTACGT GATAATTTAC GATTGATCGA TAAATCAGAG 1800GATGTCGGAC CGATTGCATC TACGGTTCCT GATTCTGGTG GCGTAGTTTT CGTCCCCGCA 1860TTTAGTGGCC TATTCGCTCC CTATTGGGAC CCAGATGCCA GAGCCACCAT AATGGGGATG 1920TCTCAATTCA CTACTGCCTC CCACATCGCC AGAGCTGCCG TGGAAGGTGT TTGCTTTCAA 1980GCCAGGGCTA TCTTGAAGGC AATGAGTTCT GACGCGTTTG GTGAAGGTTC CAAAGACAGG 2040GACTTTTTAG AGGAAATTTC CGACGTCACA TATGAAAAGT CGCCCCTGTC GGTTCTGGCA 2100GTGGATGGCG GGATGTCGAG GTCTAATGAA GTCATGCAAA TTCAAGCCGA TATCCTAGGT 2160CCCTGTGTCA AAGTCAGAAG GTCTCCGACA GCGGAATGTA CCGCATTGGG GGCAGCCATT 2220GCAGCCAATA TGGCTTTCAA GGATGTGAAC GAGCGCCCAT TATGGAAGGA CCTACACGAT 2280GTTAAGAAAT GGGTCTTTTA CAATGGAATG GAGAAAAACG AACAAATATC ACCAGAGGCT 2340CATCCAAACC TTAAGATATT CAGAAGTGAA TCCGACGATG CTGAAAGGAG AAAGCATTGG 2400AAGTATTGGG AAGTTGCCGT GGAAAGATCC AAAGGTTGGC TGAAGGACAT AGAAGGTGAA 2460CACGAACAGG TTCTAGAAAA CTTCCAATAA CAACATAAAT AATTTCTATT AACAATGTAA 2520(2)SEQ ID NO11的信息(i)序列特征(A)长度391个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体GPD1(xi)序列描述SEQ ID NO11Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn1 5 10 15Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu20 25 30Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr35 40 45Ile Ala Lys Val Val Ala Glu Asn Cys Lys Gly Tyr Pro Glu Val Phe50 55 60Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu65 70 75 80Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu85 90 95Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile100 105 110Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln115 120 125Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His130 135 140Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly145 150 155 160Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys165 170 175Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu His180 185 190Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly195 200 205Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg210 215 220Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile225 230 235 240Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu245 250 255Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly260 265 270Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg275 280 285Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr290 295 300Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr305 310 315 320Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln325 330 335Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu340 345 350Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln355 360 365Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu370 375 380Glu Leu Asp Leu His Glu Asp385 390(2)SEQ ID NO12的信息(i)序列特征(A)长度384个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A) 生物体GPD2(xi)序列描述SEQ ID NO12Met Thr Ala His Thr Asn Ile Lys Gln His Lys His Cys His Glu Asp1 5 10 15His Pro Ile Arg Arg Ser Asp Ser Ala Val Ser Ile Val His Leu Lys20 25 30Arg Ala Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr35 40 45Thr Ile Ala Lys Val Ile Ala Glu Asn Thr Glu Leu His Ser His Ile50 55 60Phe Glu Pro Glu Val Arg Met Trp Val Phe Asp Glu Lys Ile Gly Asp65 70 75 80Glu Asn Leu Thr Asp Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr85 90 95Leu Pro Asn Ile Asp Leu Pro His Asn Leu Val Ala Asp Pro Asp Leu100 105 110Leu His Ser Ile Lys Gly Ala Asp Ile Leu Val Phe Asn Ile Pro His115 120 125Gln Phe Leu Pro Asn Ile Val Lys Gln Leu Gln Gly His Val Ala Pro130 135 140His Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Leu Gly Ser Lys145 150 155 160Gly Val Gln Leu Leu Ser Ser Tyr Val Thr Asp Glu Leu Gly Ile Gln165 170 175Cys Gly Ala Leu Ser Gly Ala Asn Leu Ala Pro Glu Val Ala Lys Glu180 185 190His Trp Ser Glu Thr Thr Val Ala Tyr Gln Leu Pro Lys Asp Tyr Gln195 200 205Gly Asp Gly Lys Asp Val Asp His Lys Ile Leu Lys Leu Leu Phe His210 215 220Arg Pro Tyr Phe His Val Asn Val Ile Asp Asp Val Ala Gly Ile Ser225 230 235 240Ile Ala Gly Ala Leu Lys Asn Val Val Ala Leu Ala Cys Gly Phe Val245 250 255Glu Gly Met Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Leu260 265 270Gly Leu Gly Glu Ile Ile Lys Phe Gly Arg Met Phe Phe Pro Glu Ser275 280 285Lys Val Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile290 295 300Thr Thr Cys Ser Gly Gly Arg Asn Val Lys Val Ala Thr Tyr Met Ala305 310 315 320Lys Thr Gly Lys Ser Ala Leu Glu Ala Glu Lys Glu Leu Leu Asn Gly325 330 335Gln Ser Ala Gln Gly Ile Ile Thr Cys Arg Glu Val His Glu Trp Leu340 345 350Gln Thr Cys Glu Leu Thr Gln Glu Phe Pro Ile Ile Arg Gly Ser Leu355 360 365Pro Asp Ser Leu Gln Gln Arg Pro His Gly Arg Pro Thr Gly Asp Asp370 375 380(2)SEQ ID NO13的信息(i)序列特征(A)长度614个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体GUT2(xi)序列描述SEQ ID NO13Met Thr Arg Ala Thr Trp Cys Asn Ser Pro Pro Pro Leu His Arg Gln1 5 10 15Val Ser Arg Arg Asp Leu Leu Asp Arg Leu Asp Lys Thr His Gln Phe20 25 30Asp Val Leu Ile Ile Gly Gly Gly Ala Thr Gly Thr Gly Cys Ala Leu35 40 45Asp Ala Ala Thr Arg Gly Leu Asn Val Ala Leu Val Glu Lys Gly Asp50 55 60Phe Ala Ser Gly Thr Ser Ser Lys Ser Thr Lys Met Ile His Gly Gly65 70 75 80Val Arg Tyr Leu Glu Lys Ala Phe Trp Glu Phe Ser Lys Ala Gln Leu85 90 95Asp Leu Val Ile Glu Ala Leu Asn Glu Arg Lys His Leu Ile Asn Thr100 105 110Ala Pro His Leu Cys Thr Val Leu Pro Ile Leu Ile Pro Ile Tyr Ser115 120 125Thr Trp Gln Val Pro Tyr Ile Tyr Met Gly Cys Lys Phe Tyr Asp Phe130 135 140Phe Gly Gly Ser Gln Asn Leu Lys Lys Ser Tyr Leu Leu Ser Lys Ser145 150 155 160Ala Thr Val Glu Lys Ala Pro Met Leu Thr Thr Asp Asn Leu Lys Ala165 170 175Ser Leu Val Tyr His Asp Gly Ser Phe Asn Asp Ser Arg Leu Asn Ala180 185 190Thr Leu Ala Ile Thr Gly Val Glu Asn Gly Ala Thr Val Leu Ile Tyr195 200 205Val Glu Val Gln Lys Leu Ile Lys Asp Pro Thr Ser Gly Lys Val Ile210 215 220Gly Ala Glu Ala Arg Asp Val Glu Thr Asn Glu Leu Val Arg Ile Asn225 230 235 240Ala Lys Cys Val Val Asn Ala Thr Gly Pro Tyr Ser Asp Ala Ile Leu245 250 255Gln Met Asp Arg Asn Pro Ser Gly Leu Pro Asp Ser Pro Leu Asn Asp260 265 270Asn Ser Lys Ile Lys Ser Thr Phe Asn Gln Ile Ser Val Met Asp Pro275 280 285Lys Met Val Ile Pro Ser Ile Gly Val His Ile Val Leu Pro Ser Phe290 295 300Tyr Ser Pro Lys Asp Met Gly Leu Leu Asp Val Arg Thr Ser Asp Gly305 310 315 320Arg Val Met Phe Phe Leu Pro Trp Gln Gly Lys Val Leu Ala Gly Thr325 330 335Thr Asp Ile Pro Leu Lys Gln Val Pro Glu Asn Pro Met Pro Thr Glu340 345 350Ala Asp Ile Gln Asp Ile Leu Lys Glu Leu Gln His Tyr Ile Glu Phe355 360 365Pro Val Lys Arg Glu Asp Val Leu Ser Ala Trp Ala Gly Val Arg Pro370 375 380Leu Val Arg Asp Pro Arg Thr Ile Pro Ala Asp Gly Lys Lys Gly Ser385 390 395 400Ala Thr Gln Gly Val Val Arg Ser His Phe Leu Phe Thr Ser Asp Asn405 410 415Gly Leu Ile Thr Ile Ala Gly Gly Lys Trp Thr Thr Tyr Arg Gln Met420 425 430Ala Glu Glu Thr Val Asp Lys Val Val Glu Val Gly Gly Phe His Asn435 440 445Leu Lys Pro Cys His Thr Arg Asp Ile Lys Leu Ala Gly Ala Glu Glu450 455 460Trp Thr Gln Asn Tyr Val Ala Leu Leu Ala Gln Asn Tyr His Leu Ser465 470 475 480Ser Lys Met Ser Asn Tyr Leu Val Gln Asn Tyr Gly Thr Arg Ser Ser485 490 495Ile Ile Cys Glu Phe Phe Lys Glu Ser Met Glu Asn Lys Leu Pro Leu500 505 510Ser Leu Ala Asp Lys Glu Asn Asn Val Ile Tyr Ser Ser Glu Glu Asn515 520 525Asn Leu Val Asn Phe Asp Thr Phe Arg Tyr Pro Phe Thr Ile Gly Glu530 535 540Leu Lys Tyr Ser Met Gln Tyr Glu Tyr Cys Arg Thr Pro Leu Asp Phe545 550 555 560Leu Leu Arg Arg Thr Arg Phe Ala Phe Leu Asp Ala Lys Glu Ala Leu565 570 575Asn Ala Val His Ala Thr Val Lys Val Met Gly Asp Glu Phe Asn Trp580 585 590Ser Glu Lys Lys Arg Gln Trp Glu Leu Glu Lys Thr Val Asn Phe Ile595 600 605Gln Gly Arg Phe Gly Val610(2)SEQ ID NO14的信息(i)序列特征(A)长度339个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体GPSA(xi)序列描述SEQ ID NO14Met Asn Gln Arg Asn Ala Ser Met Thr Val Ile Gly Ala Gly Ser Tyr1 5 10 15Gly Thr Ala Leu Ala Ile Thr Leu Ala Arg Asn Gly His Glu Val Val20 25 30Leu Trp Gly His Asp Pro Glu His Ile Ala Thr Leu Glu Arg Asp Arg35 40 45Cys Asn Ala Ala Phe Leu Pro Asp Val Pro Phe Pro Asp Thr Leu His50 55 60Leu Glu Ser Asp Leu Ala Thr Ala Leu Ala Ala Ser Arg Asn Ile Leu65 70 75 80Val Val Val Pro Ser His Val Phe Gly Glu Val Leu Arg Gln Ile Lys85 90 95Pro Leu Met Arg Pro Asp Ala Arg Leu Val Trp Ala Thr Lys Gly Leu100 105 110Glu Ala Glu Thr Gly Arg Leu Leu Gln Asp Val Ala Arg Glu Ala Leu115 120 125Gly Asp Gln Ile Pro Leu Ala Val Ile Ser Gly Pro Thr Phe Ala Lys130 135 140Glu Leu Ala Ala Gly Leu Pro Thr Ala Ile Ser Leu Ala Ser Thr Asp145 150 155 160Gln Thr Phe Ala Asp Asp Leu Gln Gln Leu Leu His Cys Gly Lys Ser165 170 175Phe Arg Val Tyr Ser Asn Pro Asp Phe Ile Gly Val Gln Leu Gly Gly180 185 190Ala Val Lys Asn Val Ile Ala Ile Gly Ala Gly Met Ser Asp Gly Ile195 200 205Gly Phe Gly Ala Asn Ala Arg Thr Ala Leu Ile Thr Arg Gly Leu Ala210 215 220Glu Met Ser Arg Leu Gly Ala Ala Leu Gly Ala Asp Pro Ala Thr Phe225 230 235 240Met Gly Met Ala Gly Leu Gly Asp Leu Val Leu Thr Cys Thr Asp Asn245 250 255Gln Ser Arg Asn Arg Arg Phe Gly Met Met Leu Gly Gln Gly Met Asp260 265 270Val Gln Ser Ala Gln Glu Lys Ile Gly Gln Val Val Glu Gly Tyr Arg275 280 285Asn Thr Lys Glu Val Arg Glu Leu Ala His Arg Phe Gly Val Glu Met290 295 300Pro Ile Thr Glu Glu Ile Tyr Gln Val Leu Tyr Cys Gly Lys Asn Ala305 310 315 320Arg Glu Ala Ala Leu Thr Leu Leu Gly Arg Ala Arg Lys Asp Glu Arg325 330 335Ser Ser His(2)SEQ ID NO15的信息(i)序列特征(A)长度501个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体GLPD(xi)序列描述SEQ ID NO15Met Glu Thr Lys Asp Leu Ile Val Ile Gly Gly Gly Ile Asn Gly Ala1 5 10 15Gly Ile Ala Ala Asp Ala Ala Gly Arg Gly Leu Ser Val Leu Met Leu20 25 30Glu Ala Gln Asp Leu Ala Cys Ala Thr Ser Ser Ala Ser Ser Lys Leu35 40 45Ile His Gly Gly Leu Arg Tyr Leu Glu His Tyr Glu Phe Arg Leu Val50 55 60Ser Glu Ala Leu Ala Glu Arg Glu Val Leu Leu Lys Met Ala Pro His65 70 75 80Ile Ala Phe Pro Met Arg Phe Arg Leu Pro His Arg Pro His Leu Arg85 90 95Pro Ala Trp Met Ile Arg Ile Gly Leu Phe Met Tyr Asp His Leu Gly100 105 110Lys Arg Thr Ser Leu Pro Gly Ser Thr Gly Leu Arg Phe Gly Ala Asn115 120 125Ser Val Leu Lys Pro Glu Ile Lys Arg Gly Phe Glu Tyr Ser Asp Cys130 135 140Trp Val Asp Asp Ala Arg Leu Val Leu Ala Asn Ala Gln Met Val Val145 150 155 160Arg Lys Gly Gly Glu Val Leu Thr Arg Thr Arg Ala Thr Ser Ala Arg165 170 175Arg Glu Asn Gly Leu Trp Ile Val Glu Ala Glu Asp Ile Asp Thr Gly180 185 190Lys Lys Tyr Ser Trp Gln Ala Arg Gly Leu Val Asn Ala Thr Gly Pro195 200 205Trp Val Lys Gln Phe Phe Asp Asp Gly Met His Leu Pro Ser Pro Tyr210 215 220Gly Ile Arg Leu Ile Lys Gly Ser His Ile Val Val Pro Arg Val His225 230 235 240Thr Gln Lys Gln Ala Tyr Ile Leu Gln Asn Glu Asp Lys Arg Ile Val245 250 255Phe Val Ile Pro Trp Met Asp Glu Phe Ser Ile Ile Gly Thr Thr Asp260 265 270Val Glu Tyr Lys Gly Asp Pro Lys Ala Val Lys Ile Glu Glu Ser Glu275 280 285Ile Asn Tyr Leu Leu Asn Val Tyr Asn Thr His Phe Lys Lys Gln Leu290 295 300Ser Arg Asp Asp Ile Val Trp Thr Tyr Ser Gly Val Arg Pro Leu Cys305 310 315 320Asp Asp Glu Ser Asp Ser Pro Gln Ala Ile Thr Arg Asp Tyr Thr Leu325 330 335Asp Ile His Asp Glu Asn Gly Lys Ala Pro Leu Leu Ser Val Phe Gly340 345 350Gly Lys Leu Thr Thr Tyr Arg Lys Leu Ala Glu His Ala Leu Glu Lys355 360 365Leu Thr Pro Tyr Tyr Gln Gly Ile Gly Pro Ala Trp Thr Lys Glu Ser370 375 380Val Leu Pro Gly Gly Ala Ile Glu Gly Asp Arg Asp Asp Tyr Ala Ala385 390 395 400Arg Leu Arg Arg Arg Tyr Pro Phe Leu Thr Glu Ser Leu Ala Arg His405 410 415Tyr Ala Arg Thr Tyr Gly Ser Asn Ser Glu Leu Leu Leu Gly Asn Ala420 425 430Gly Thr Val Ser Asp Leu Gly Glu Asp Phe Gly His Glu Phe Tyr Glu435 440 445Ala Glu Leu Lys Tyr Leu Val Asp His Glu Trp Val Arg Arg Ala Asp450 455 460Asp Ala Leu Trp Arg Arg Thr Lys Gln Gly Met Trp Leu Asn Ala Asp465 470 475 480Gln Gln Ser Arg Val Ser Gln Trp Leu Val Glu Tyr Thr Gln Gln Arg485 490 495Leu Ser Leu Ala Ser500(2)SEQ ID NO16的信息(i)序列特征(A)长度542个氨基酸(B)类型氨基酸
(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体GLPABC(xi)序列描述SEQ ID NO16Met Lys Thr Arg Asp Ser Gln Ser Ser Asp Val Ile Ile Ile Gly Gly1 5 10 15Gly Ala Thr Gly Ala Gly Ile Ala Arg Asp Cys Ala Leu Arg Gly Leu20 25 30Arg Val Ile Leu Val Glu Arg His Asp Ile Ala Thr Gly Ala Thr Gly35 40 45Arg Asn His Gly Leu Leu His Ser Gly Ala Arg Tyr Ala Val Thr Asp50 55 60Ala Glu Ser Ala Arg Glu Cys Ile Ser Glu Asn Gln Ile Leu Lys Arg65 70 75 80Ile Ala Arg His Cys Val Glu Pro Thr Asn Gly Leu Phe Ile Thr Leu85 90 95Pro Glu Asp Asp Leu Ser Phe Gln Ala Thr Phe Ile Arg Ala Cys Glu100 105 110Glu Ala Gly Ile Ser Ala Glu Ala Ile Asp Pro Gln Gln Ala Arg Ile115 120 125Ile Glu Pro Ala Val Asn Pro Ala Leu Ile Gly Ala Val Lys Val Pro130 135 140Asp Gly Thr Val Asp Pro Phe Arg Leu Thr Ala Ala Asn Met Leu Asp145 150 155 160Ala Lys Glu His Gly Ala Val Ile Leu Thr Ala His Glu Val Thr Gly165 170 175Leu Ile Arg Glu Gly Ala Thr Val Cys Gly Val Arg Val Arg Asn His180 185 190Leu Thr Gly Glu Thr Gln Ala Leu His Ala Pro Val Val Val Asn Ala195 200 205Ala Gly Ile Trp Gly Gln His Ile Ala Glu Tyr Ala Asp Leu Arg Ile210 215 220Arg Met Phe Pro Ala Lys Gly Ser Leu Leu Ile Met Asp His Arg Ile225 230 235 240Asn Gln His Val Ile Asn Arg Cys Arg Lys Pro Ser Asp Ala Asp Ile245 250 255Leu Val Pro Gly Asp Thr Ile Ser Leu Ile Gly Thr Thr Ser Leu Arg260 265 270Ile Asp Tyr Asn Glu Ile Asp Asp Asn Arg Val Thr Ala Glu Glu Val275 280 285Asp Ile Leu Leu Arg Glu Gly Glu Lys Leu Ala Pro Val Met Ala Lys290 295 300Thr Arg Ile Leu Arg Ala Tyr Ser Gly Val Arg Pro Leu Val Ala Ser305 310 315 320Asp Asp Asp Pro Ser Gly Arg Asn Leu Ser Arg Gly Ile Val Leu Leu325 330 335Asp His Ala Glu Arg Asp Gly Leu Asp Gly Phe Ile Thr Ile Thr Gly340 345 350Gly Lys Leu Met Thr Tyr Arg Leu Met Ala Glu Trp Ala Thr Asp Ala355 360 365Val Cys Arg Lys Leu Gly Asn Thr Arg Pro Cys Thr Thr Ala Asp Leu370 375 380Ala Leu Pro Gly Ser Gln Glu Pro Ala Glu Val Thr Leu Arg Lys Val385 390 395 400Ile Ser Leu Pro Ala Pro Leu Arg Gly Ser Ala Val Tyr Arg His Gly405 410 415Asp Arg Thr Pro Ala Trp Leu Ser Glu Gly Arg Leu His Arg Ser Leu420 425 430Val Cys Glu Cys Glu Ala Val Thr Ala Gly Glu Val Gln Tyr Ala Val435 440 445Glu Asn Leu Asn Val Asn Ser Leu Leu Asp Leu Arg Arg Arg Thr Arg450 455 460Val Gly Met Gly Thr Cys Gln Gly Glu Leu Cys Ala Cys Arg Ala Ala465 470 475 480Gly Leu Leu Gln Arg Phe Asn Val Thr Thr Ser Ala Gln Ser Ile Glu485 490 495Gln Leu Ser Thr Phe Leu Asn Glu Arg Trp Lys Gly Val Gln Pro Ile500 505 510Ala Trp Gly Asp Ala Leu Arg Glu Ser Glu Phe Thr Arg Trp Val Tyr515 520 525Gln Gly Leu Cys Gly Leu Glu Lys Glu Gln Lys Asp Ala Leu530 535 540(2)SEQ ID NO17的信息(i)序列特征(A)长度250个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体GPP2(xi)序列描述SEQ ID NO17Met Gly Leu Thr Thr Lys Pro Leu Ser Leu Lys Val Asn Ala Ala Leu1 5 10 15Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln Pro Ala Ile Ala Ala20 25 30Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr Phe Asp Ala Glu His35 40 45Val Ile Gln Val Ser His Gly Trp Arg Thr Phe Asp Ala Ile Ala Lys50 55 60Phe Ala Pro Asp Phe Ala Asn Glu Glu Tyr Val Asn Lys Leu Glu Ala65 70 75 80Glu Ile Pro Val Lys Tyr Gly Glu Lys Ser Ile Glu Val Pro Gly Ala85 90 95Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro Lys Glu Lys Trp Ala100 105 110Val Ala Thr Ser Gly Thr Arg Asp Met Ala Gln Lys Trp Phe Glu His115 120 125Leu Gly Ile Arg Arg Pro Lys Tyr Phe Ile Thr Ala Asn Asp Val Lys130 135 140Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys Gly Arg Asn Gly Leu145 150 155 160Gly Tyr Pro Ile Asn Glu Gln Asp Pro Ser Lys Ser Lys Val Val Val165 170 175Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly Lys Ala Ala Gly Cys180 185 190Lys Ile Ile Gly Ile Ala Thr Thr Phe Asp Leu Asp Phe Leu Lys Glu195 200 205Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu Ser Ile Arg Val Gly210 215 220Gly Tyr Asn Ala Glu Thr Asp GIn Val Glu Phe Ile Phe Asp Asp Tyr225 230 235 240Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp245 250(2)SEQ ID NO18的信息(i)序列特征(A)长度709个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体GUT1(xi)序列描述SEQ ID NO18Met Phe Pro Ser Leu Phe Arg Leu Val Val Phe Ser Lys Arg Tyr Ile1 5 10 15Phe Arg Ser Ser Gln Arg Leu Tyr Thr Ser Leu Lys Gln Glu Gln Ser20 25 30Arg Met Ser Lys Ile Met Glu Asp Leu Arg Ser Asp Tyr Val Pro Leu35 40 45Ile Ala Ser Ile Asp Val Gly Thr Thr Ser Ser Arg Cys Ile Leu Phe50 55 60Asn Arg Trp Gly Gln Asp Val Ser Lys His Gln Ile Glu Tyr Ser Thr65 70 75 80Ser Ala Ser Lys Gly Lys Ile Gly Val Ser Gly Leu Arg Arg Pro Ser85 90 95Thr Ala Pro Ala Arg Glu Thr Pro Asn Ala Gly Asp Ile Lys Thr Ser100 105 110Gly Lys Pro Ile Phe Ser Ala Glu Gly Tyr Ala Ile Gln Glu Thr Lys115 120 125Phe Leu Lys Ile Glu Glu Leu Asp Leu Asp Phe His Asn Glu Pro Thr130 135 140Leu Lys Phe Pro Lys Pro Gly Trp Val Glu Cys His Pro Gln Lys Leu145 150 155 160Leu Val Asn Val Val Gln Cys Leu Ala Ser Ser Leu Leu Ser Leu Gln165 170 175Thr Ile Asn Ser Glu Arg Val Ala Asn Gly Leu Pro Pro Tyr Lys Val180 185 190Ile Cys Met Gly Ile Ala Asn Met Arg Glu Thr Thr Ile Leu Trp Ser195 200 205Arg Arg Thr Gly Lys Pro Ile Val Asn Tyr Gly Ile Val Trp Asn Asp210 215 220Thr Arg Thr Ile Lys Ile Val Arg Asp Lys Trp Gln Asn Thr Ser Val225 230 235 240Asp Arg Gln Leu Gln Leu Arg Gln Lys Thr Gly Leu Pro Leu Leu Ser245 250 255Thr Tyr Phe Ser Cys Ser Lys Leu Arg Trp Phe Leu Asp Asn Glu Pro260 265 270Leu Cys Thr Lys Ala Tyr Glu Glu Asn Asp Leu Met Phe Gly Thr Val275 280 285Asp Thr Trp Leu Ile Tyr Gln Leu Thr Lys Gln Lys Ala Phe Val Ser290 295 300Asp Val Thr Asn Ala Ser Arg Thr Gly Phe Met Asn Leu Ser Thr Leu305 310 315 320Lys Tyr Asp Asn Glu Leu Leu Glu Phe Trp Gly Ile Asp Lys Asn Leu325 330 335Ile His Met Pro Glu Ile Val Ser Ser Ser Gln Tyr Tyr Gly Asp Phe340 345 350Gly Ile Pro Asp Trp lle Met Glu Lys Leu His Asp Ser Pro Lys Thr355 360 365Val Leu Arg Asp Leu Val Lys Arg Asn Leu Pro Ile Gln Gly Cys Leu370 375 380Gly Asp Gln Ser Ala Ser Met Val Gly Gln Leu Ala Tyr Lys Pro Gly385 390 395 400Ala Ala Lys Cys Thr Tyr Gly Thr Gly Cys Phe Leu Leu Tyr Asn Thr405 410 415Gly Thr Lys Lys Leu Ile Ser Gln His Gly Ala Leu Thr Thr Leu Ala420 425 430Phe Trp Phe Pro His Leu Gln Glu Tyr Gly Gly Gln Lys Pro Glu Leu435 440 445Ser Lys Pro His Phe Ala Leu Glu Gly Ser Val Ala Val Ala Gly Ala450 455 460Val Val Gln Trp Leu Arg Asp Asn Leu Arg Leu Ile Asp Lys Ser Glu465 470 475 480Asp Val Gly Pro Ile Ala Ser Thr Val Pro Asp Ser Gly Gly Val Val485 490 495Phe Val Pro Ala Phe Ser Gly Leu Phe Ala Pro Tyr Trp Asp Pro Asp500 505 510Ala Arg Ala Thr Ile Met Gly Met Ser Gln Phe Thr Thr Ala Ser His515 520 525Ile Ala Arg Ala Ala Val Glu Gly Val Cys Phe Gln Ala Arg Ala Ile530 535 540Leu Lys Ala Met Ser Ser Asp Ala Phe Gly Glu Gly Ser Lys Asp Arg545 550 555 560Asp Phe Leu Glu Glu Ile Ser Asp Val Thr Tyr Glu Lys Ser Pro Leu565 570 575Ser Val Leu Ala Val Asp Gly Gly Met Ser Arg Ser Asn Glu Val Met580 585 590Gln Ile Gln Ala Asp Ile Leu Gly Pro Cys Val Lys Val Arg Arg Ser595 600 605Pro Thr Ala Glu Cys Thr Ala Leu Gly Ala Ala Ile Ala Ala Asn Met610 615 620Ala Phe Lys Asp Val Asn Glu Arg Pro Leu Trp Lys Asp Leu His Asp625 630 635 640Val Lys Lys Trp Val Phe Tyr Asn Gly Met Glu Lys Asn Glu Gln Ile645 650 655Ser Pro Glu Ala His Pro Asn Leu Lys Ile Phe Arg Ser Glu Ser Asp660 665 670Asp Ala Glu Arg Arg Lys His Trp Lys Tyr Trp Glu Val Ala Val Glu675 680 685Arg Ser Lys Gly Trp Leu Lys Asp Ile Glu Gly Glu His Glu Gln Val690 695 700Leu Glu Asn Phe Gln705(2)SEQ ID NO19的信息(i)序列特征(A)长度12145个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)生物体PHK28-26(xi)序列描述SEQ ID NO19GTCGACCACC ACGGTGGTGA CTTTAATGCC GCTCTCATGC AGCAGCTCGG TGGCGGTCTC 60AAAATTCAGG ATGTCGCCGG TATAGTTTTT GATAATCAGC AAGACGCCTT CGCCGCCGTC120AATTTGCATC GCGCATTCAA ACATTTTGTC CGGCGTCGGC GAGGTGAATA TTTCCCCCGG180ACAGGCGCCG GAGAGCATGC CCTGGCCGAT ATAGCCGCAG TGCATCGGTT CATGTCCGCT240GCCGCCGCCG GAGAGCAGGG CCACCTTGCC AGCCACCGGC GCGTCGGTGC GGGTCACATA300CAGCGGGTCC TGATGCAGGG TCAGCTGCGG ATGGGCTTTA GCCAGCCCCT GTAATTGTTC360ATTCAGTACA TCTTCAACAC GGTTAATCAG CTTTTTCATT ATTCAGTGCT CCGTTGGAGA420AGGTTCGATG CCGCCTCTCT GCTGGCGGAG GCGGTCATCG CGTAGGGGTA TCGTCTGACG480GTGGAGCGTG CCTGGCGATA TGATGATTCT GGCTGAGCGG ACGAAAAAAA GAATGCCCCG540ACGATCGGGT TTCATTACGA AACATTGCTT CCTGATTTTG TTTCTTTATG GAACGTTTTT600GCTGAGGATA TGGTGAAAAT GCGAGCTGGC GCGCTTTTTT TCTTCTGCCA TAAGCGGCGG660TCAGGATAGC CGGCGAAGCG GGTGGGAAAA AATTTTTTGC TGATTTTCTG CCGACTGCGG720GAGAAAAGGC GGTCAAACAC GGAGGATTGT AAGGGCATTA TGCGGCAAAG GAGCGGATCG780GGATCGCAAT CCTGACAGAG ACTAGGGTTT TTTGTTCCAA TATGGAACGT AAAAAATTAA840CCTGTGTTTC ATATCAGAAC AAAAAGGCGA AAGATTTTTT TGTTCCCTGC CGGCCCTACA900GTGATCGCAC TGCTCCGGTA CGCTCCGTTC AGGCCGCGCT TCACTGGCCG GCGCGGATAA960CGCCAGGGCT CATCATGTCT ACATGCGCAC TTATTTGAGG GTGAAAGGAA TGCTAAAAGT 1020TATTCAATCT CCAGCCAAAT ATCTTCAGGG TCCTGATGCT GCTGTTCTGT TCGGTCAATA 1080TGCCAAAAAC CTGGCGGAGA GCTTCTTCGT CATCGCTGAC GATTTCGTAA TGAAGCTGGC 1140GGGAGAGAAA GTGGTGAATG GCCTGCAGAG CCACGATATT CGCTGCCATG CGGAACGGTT 1200TAACGGCGAA TGCAGCCATG CGGAAATCAA CCGTCTGATG GCGATTTTGC AAAAACAGGG 1260CTGCCGCGGC GTGGTCGGGA TCGGCGGTGG TAAAACCCTC GATACCGCGA AGGCGATCGG 1320TTACTACCAG AAGCTGCCGG TGGTGGTGAT CCCGACCATC GCCTCGACCG ATGCGCCAAC 1380CAGCGCGCTG TCGGTGATCT ACACCGAAGC GGGCGAGTTT GAAGAGTATC TGATCTATCC 1440GAAAAACCCG GATATGGTGG TGATGGACAC GGCGATTATC GCCAAAGCGC CGGTACGCCT 1500GCTGGTCTCC GGCATGGGCG ATGCGCTCTC CACCTGGTTC GAGGCCAAAG CTTGCTACGA 1560TGCGCGCGCC ACCAGCATGG CCGGAGGACA GTCCACCGAG GCGGCGCTGA GCCTCGCCCG 1620CCTGTGCTAT GATACGCTGC TGGCGGAGGG CGAAAAGGCC CGTCTGGCGG CGCAGGCCGG 1680GGTAGTGACC GAAGCGCTGG AGCGCATCAT CGAGGCGAAC ACTTACCTCA GCGGCATTGG 1740CTTTGAAAGC AGTGGCCTGG CCGCTGCCCA TGCAATCCAC AACGGTTTCA CCATTCTTGA 1800AGAGTGCCAT CACCTGTATC ACGGTGAGAA AGTGGCCTTC GGTACCCTGG CGCAGCTGGT 1860GCTGCAGAAC AGCCCGATGG ACGAGATTGA AACGGTGCAG GGCTTCTGCC AGCGCGTCGG 1920CCTGCCGGTG ACGCTCGCGC AGATGGGCGT CAAAGAGGGG ATCGACGAGA AAATCGCCGC 1980GGTGGCGAAA GCTACCTGCG CGGAAGGGGA AACCATCCAT AATATGCCGT TTGCGGTGAC 2040CCCGGAGAGC GTCCATGCCG CTATCCTCAC CGCCGATCTG TTAGGCCAGC AGTGGCTGGC 2100GCGTTAATTC GCGGTGGCTA AACCGCTGGC CCAGGTCAGC GGTTTTTCTT TCTCCCCTCC 2160GGCAGTCGCT GCCGGAGGGG TTCTCTATGG TACAACGCGG AAAAGGATAT GACTGTTCAG 2220ACTCAGGATA CCGGGAAGGC GGTCTCTTCC GTCATTGCCC AGTCATGGCA CCGCTGCAGC 2280AAGTTTATGC AGCGCGAAAC CTGGCAAACG CCGCACCAGG CCCAGGGCCT GACCTTCGAC 2340TCCATCTGTC GGCGTAAAAC CGCGCTGCTC ACCATCGGCC AGGCGGCGCT GGAAGACGCC 2400TGGGAGTTTA TGGACGGCCG CCCCTGCGCG CTGTTTATTC TTGATGAGTC CGCCTGCATC 2460CTGAGCCGTT GCGGCGAGCC GCAAACCCTG GCCCAGCTGG CTGCCCTGGG ATTTCGCGAC 2520GGCAGCTATT GTGCGGAGAG CATTATCGGC ACCTGCGCGC TGTCGCTGGC CGCGATGCAG 2580GGCCAGCCGA TCAACACCGC CGGCGATCGG CATTTTAAGC AGGCGCTACA GCCATGGAGT 2640TTTTGCTCGA CGCCGGTGTT TGATAACCAC GGGCGGCTGT TCGGCTCTAT CTCGCTTTGC 2700TGTCTGGTCG AGCACCAGTC CAGCGCCGAC CTCTCCCTGA CGCTGGCCAT CGCCCGCGAG 2760GTGGGTAACT CCCTGCTTAC CGACAGCCTG CTGGCGGAAT CCAACCGTCA CCTCAATCAG 2820ATGTACGGCC TGCTGGAGAG CATGGACGAT GGGGTGATGG CGTGGAACGA ACAGGGCGTG 2880CTGCAGTTTC TCAATGTTCA GGCGGCGAGA CTGCTGCATC TTGATGCTCA GGCCAGCCAG 2940GGGAAAAATA TCGCCGATCT GGTGACCCTC CCGGCGCTGC TGCGCCGCGC CATCAAACAC 3000GCCCGCGGCC TGAATCACGT CGAAGTCACC TTTGAAAGTC AGCATCAGTT TGTCGATGCG 3060GTGATCACCT TAAAACCGAT TGTCGAGGCG CAAGGCAACA GTTTTATTCT GCTGCTGCAT 3120CCGGTGGAGC AGATGCGGCA GCTGATGACC AGCCAGCTCG GTAAAGTCAG CCACACCTTT 3180GAGCAGATGT CTGCCGACGA TCCGGAAACC CGACGCCTGA TCCACTTTGG CCGCCAGGCG 3240GCGCGCGGCG GCTTCCCGGT GCTACTGTGC GGCGAAGAGG GGGTCGGGAA AGAGCTGCTG 3300AGCCAGGCTA TTCACAATGA AAGCGAACGG GCGGGCGGCC CCTACATCTC CGTCAACTGC 3360CAGCTATATG CCGACAGCGT GCTGGGCCAG GACTTTATGG GCAGCGCCCC TACCGACGAT 3420GAAAATGGTC GCCTGAGCCG CCTTGAGCTG GCCAACGGCG GCACCCTGTT TCTGGAAAAG 3480ATCGAGTATC TGGCGCCGGA GCTGCAGTCG GCTCTGCTGC AGGTGATTAA GCAGGGCGTG 3540CTCACCCGCC TCGACGCCCG GCGCCTGATC CCGGTGGATG TGAAGGTGAT TGCCACCACC 3600ACCGTCGATC TGGCCAATCT GGTGGAACAG AACCGCTTTA GCCGCCAGCT GTACTATGCG 3660CTGCACTCCT TTGAGATCGT CATCCCGCCG CTGCGCGCCC GACGCAACAG TATTCCGTCG 3720CTGGTGCATA ACCGGTTGAA GAGCCTGGAG AAGCGTTTCT CTTCGCGACT GAAAGTGGAC 3780GATGACGCGC TGGCACAGCT GGTGGCCTAC TCGTGGCCGG GGAATGATTT TGAGCTCAAC 3840AGCGTCATTG AGAATATCGC CATCAGCAGC GACAACGGCC ACATTCGCCT GAGTAATCTG 3900CCGGAATATC TCTTTTCCGA GCGGCCGGGC GGGGATAGCG CGTCATCGCT GCTGCCGGCC 3960AGCCTGACTT TTAGCGCCAT CGAAAAGGAA GCTATTATTC ACGCCGCCCG GGTGACCAGC 4020GGGCGGGTGC AGGAGATGTC GCAGCTGCTC AATATCGGCC GCACCACCCT GTGGCGCAAA 4080ATGAAGCAGT ACGATATTGA CGCCAGCCAG TTCAAGCGCA AGCATCAGGC CTAGTCTCTT 4140CGATTCGCGC CATGGAGAAC AGGGCATCCG ACAGGCGATT GCTGTAGCGT TTGAGCGCGT 4200CGCGCAGCGG ATGCGCGCGG TCCATGGCCG TCAGCAGGCG TTCGAGCCGA CGGGACTGGG 4260TGCGCGCCAC GTGCAGCTGG GCAGAGGCGA GATTCCTCCC CGGGATCACG AACTGTTTTA 4320ACGGGCCGCT CTCGGCCATA TTGCGGTCGA TAAGCCGCTC CAGGGCGGTG ATCTCCTCTT 4380CGCCGATCGT CTGGCTCAGG CGGGTCAGGC CCCGCGCATC GCTGGCCAGT TCAGCCCCCA 4440GCACGAACAG CGTCTGCTGA ATATGGTGCA GGCTTTCCCG CAGCCCGGCG TCGCGGGTCG 4500TGGCGTAGCA GACGCCCAGC TGGGATATCA GTTCATCGAC GGTGCCGTAG GCCTCGACGC 4560GAATATGGTC TTTCTCGATG CGGCTGCCGC CGTACAGGGC GGTGGTGCCT TTATCCCCGG 4620TGCGGGTATA GATACGATAC ATTCAGTTTC TCTCACTTAA CGGCAGGACT TTAACCAGCT 4680GCCCGGCGTT GGCGCCGAGC GTACGCAGTT GATCGTCGCT ATCGGTGACG TGTCCGGTAG 4740CCAGCGGCGC GTCCGCCGGC AGCTGGGCAT GAGTGAGGGC TATCTCGCCG GACGCGCTGA 4800GCCCGATACC CACCCGCAGG GGCGAGCTTC TGGCCGCCAG GGCGCCCAGC GCAGCGGCGT 4860CACCGCCTCC GTCATAGGTT ATGGTCTGGC AGGGGACCCC CTGCTCCTCC AGCCCCCAGC 4920ACAGCTCATT GATGGCGCCG GCATGGTGCC CGCGCGGATC GTAAAACAGG CGTACGCCTG 4980GCGGTGAAAG CGACATGACG GTCCCCTCGT TAACACTCAG AATGCCTGGC GGAAAATCGC 5040GGCAATCTCC TGCTCGTTGC CTTTACGCGG GTTCGAGAAC GCATTGCCGT CTTTTAGAGC 5100CATCTCCGCC ATGTAGGGGA AGTCGGCCTC TTTTACCCCC AGATCGCGCA GATGCTGCGG 5160AATACCGATA TCCATCGACA GACGCGTGAT AGCGGCGATG GCTTTTTCCG CCGCGTCGAG 5220AGTGGACAGT CCGGTGATAT TTTCGCCCAT CAGTTCAGCG ATATCGGCGA ATTTCTCCGG 5280GTTGGCGATC AGGTTGTAGC GCGCCACATG CGGCAGCAGG ACAGCGTTGG CCACGCCGTG 5340CGGCATGTCG TACAGGCCGC CCAGCTGGTG CGCCATGGCG TGCACGTAGC CGAGGTTGGC 5400GTTATTGAAA GCCATCCCGG CCAGCAGAGA AGCATAGGCC ATGTTTTCCC GCGCCTGCAG 5460ATTGCTGCCG AGGGCCACGG CCTGGCGCAG GTTGCGGGCG ATGAGGCGGA TCGCCTGCAT 5520GGCGGCGGCG TCCGTCACCG GGTTAGCGTC TTTGGAGATA TAGGCCTCTA CGGCGTGGGT 5580CAGGGCATCC ATCCCGGTCG CCGCGGTCAG GGCGGCCGGT TTACCGATCA TCAGCAGTGG 5640ATCGTTGATA GAGACCGACG GCAGTTTGCG CCAGCTGACG ATCACAAACT TCACTTTGGT 5700TTCGGTGTTG GTCAGGACGC AGTGGCGGGT GACCTCGCTG GCGGTGCCGG CGGTGGTATT 5760GACCGCGACG ATAGGCGGCA GCGGGTTGGT CAGGGTCTCG ATTCCGGCAT ACTGGTACAG 5820ATCGCCCTCA TGGGTGGCGG CGATGCCGAT GCCTTTGCCG CAATCGTGCG GGCTGCCGCC 5880GCCCACGGTG ACGATGATGT CGCACTGTTC GCGGCGAAAC ACGGCGAGGC CGTCGCGCAC 5940GTTGGTGTCT TTCGGGTTCG GCTCGACGCC GTCAAAGATC GCCACCTCGA TCCCGGCCTC 6000CCGCAGATAA TGCAGGGTTT TGTCCACCGC GCCATCTTTA ATTGCCCGCA GGCCTTTGTC 6060GGTGACCAGC AGGGCTTTTT TCCCCCCCAG CAGCTGGCAG CGTTCGCCGA CTACGGAAAT 6120GGCGTTGGGG CCAAAAAAGT TAACGTTTGG CACCAGATAA TCAAACATAC GATAGCTCAT 6180AATATACCTT CTCGCTTCAG GTTATAATGC GGAAAAACAA TCCAGGGCGC ACTGGGCTAA 6240TAATTGATCC TGCTCGACCG TACCGCCGCT AACGCCGACG GCGCCAATTA CCTGCTCATT 6300AAAAATAACT GGCAGGCCGC CGCCAAAAAT AATAATTCGC TGTTGGTTGG TTAGCTGCAG 6360ACCGTACAGA GATTGTCCTG GCTGGACCGC TGACGTAATT TCATGGGTAC CTTGCTTCAG 6420GCTGCAGGCG CTCCAGGCTT TATTCAGGGA AATATCGCAG CTGGAGACGA AGGCCTCGTC 6480CATCCGCTGG ATAAGCAGCG TGTTGCCTCC GCGGTCAACT ACGGAAAACA CCACCGCCAC 6540GTTGATCTCA GTGGCTTTTT TTTCCACCGC CGCCGCCATT TGCTGGGCGG CGGCCAGGGT 6600GATTGTCTGA ACTTGTTGGC TCTTGTTCAT CATTCTCTCC CGCACCAGGA TAACGCTGGC 6660GCGAATAGTC AGTAGGGGGC GATAGTAAAA AACTATTACC ATTCGGTTGG CTTGCTTTAT 6720TTTTGTCAGC GTTATTTTGT CGCCCGCCAT GATTTAGTCA ATAGGGTTAA AATAGCGTCG 6780GAAAAACGTA ATTAAGGGCG TTTTTTATTA ATTGATTTAT ATCATTGCGG GCGATCACAT 6840TTTTTATTTT TGCCGCCGGA GTAAAGTTTC ATAGTGAAAC TGTCGGTAGA TTTCGTGTGC 6900CAAATTGAAA CGAAATTAAA TTTATTTTTT TCACCACTGG CTCATTTAAA GTTCCGCTAT 6960TGCCGGTAAT GGCCGGGCGG CAACGACGCT GGCCCGGCGT ATTCGCTACC GTCTGCGGAT 7020TTCACCTTTT GAGCCGATGA ACAATGAAAA GATCAAAACG ATTTGCAGTA CTGGCCCAGC 7080GCCCCGTCAA TCAGGACGGG CTGATTGGCG AGTGGCCTGA AGAGGGGCTG ATCGCCATGG 7140ACAGCCCCTT TGACCCGGTC TCTTCAGTAA AAGTGGACAA CGGTCTGATC GTCGAACTGG 7200ACGGCAAACG CCGGGACCAG TTTGACATGA TCGACCGATT TATCGCCGAT TACGCGATCA 7260ACGTTGAGCG CACAGAGCAG GCAATGCGCC TGGAGGCGGT GGAAATAGCC CGTATGCTGG 7320TGGATATTCA CGTCAGCCGG GAGGAGATCA TTGCCATCAC TACCGCCATC ACGCCGGCCA 7380AAGCGGTCGA GGTGATGGCG CAGATGAACG TGGTGGAGAT GATGATGGCG CTGCAGAAGA 7440TGCGTGCCCG CCGGACCCCC TCCAACCAGT GCCACGTCAC CAATCTCAAA GATAATCCGG 7500TGCAGATTGC CGCTGACGCC GCCGAGGCCG GGATCCGCGG CTTCTCAGAA CAGGAGACCA 7560CGGTCGGTAT CGCGCGCTAC GCGCCGTTTA ACGCCCTGGC GCTGTTGGTC GGTTCGCAGT 7620GCGGCCGCCC CGGCGTGTTG ACGCAGTGCT CGGTGGAAGA GGCCACCGAG CTGGAGCTGG 7680GCATGCGTGG CTTAACCAGC TACGCCGAGA CGGTGTCGGT CTACGGCACC GAAGCGGTAT 7740TTACCGACGG CGATGATACG CCGTGGTCAA AGGCGTTCCT CGCCTCGGCC TACGCCTCCC 7800GCGGGTTGAA AATGCGCTAC ACCTCCGGCA CCGGATCCGA AGCGCTGATG GGCTATTCGG 7860AGAGCAAGTC GATGCTCTAC CTCGAATCGC GCTGCATCTT CATTACTAAA GGCGCCGGGG 7920TTCAGGGACT GCAAAACGGC GCGGTGAGCT GTATCGGCAT GACCGGCGCT GTGCCGTCGG 7980GCATTCGGGC GGTGCTGGCG GAAAACCTGA TCGCCTCTAT GCTCGACCTC GAAGTGGCGT 8040CCGCCAACGA CCAGACTTTC TCCCACTCGG ATATTCGCCG CACCGCGCGC ACCCTGATGC 8100AGATGCTGCC GGGCACCGAC TTTATTTTCT CCGGCTACAG CGCGGTGCCG AACTACGACA 8160ACATGTTCGC CGGCTCGAAC TTCGATGCGG AAGATTTTGA TGATTACAAC ATCCTGCAGC 8220GTGACCTGAT GGTTGACGGC GGCCTGCGTC CGGTGACCGA GGCGGAAACC ATTGCCATTC 8280GCCAGAAAGC GGCGCGGGCG ATCCAGGCGG TTTTCCGCGA GCTGGGGCTG CCGCCAATCG 8340CCGACGAGGA GGTGGAGGCC GCCACCTACG CGCACGGCAG CAACGAGATG CCGCCGCGTA 8400ACGTGGTGGA GGATCTGAGT GCGGTGGAAG AGATGATGAA GCGCAACATC ACCGGCCTCG 8460ATATTGTCGG CGCGCTGAGC CGCAGCGGCT TTGAGGATAT CGCCAGCAAT ATTCTCAATA 8520TGCTGCGCCA GCGGGTCACC GGCGATTACC TGCAGACCTC GGCCATTCTC GATCGGCAGT 8580TCGAGGTGGT GAGTGCGGTC AACGACATCA ATGACTATCA GGGGCCGGGC ACCGGCTATC 8640GCATCTCTGC CGAACGCTGG GCGGAGATCA AAAATATTCC GGGCGTGGTT CAGCCCGACA 8700CCATTGAATA AGGCGGTATT CCTGTGCAAC AGACAACCCA AATTCAGCCC TCTTTTACCC 8760TGAAAACCCG CGAGGGCGGG GTAGCTTCTG CCGATGAACG CGCCGATGAA GTGGTGATCG 8820GCGTCGGCCC TGCCTTCGAT AAACACCAGC ATCACACTCT GATCGATATG CCCCATGGCG 8880CGATCCTCAA AGAGCTGATT GCCGGGGTGG AAGAAGAGGG GCTTCACGCC CGGGTGGTGC 8940GCATTCTGCG CACGTCCGAC GTCTCCTTTA TGGCCTGGGA TGCGGCCAAC CTGAGCGGCT 9000CGGGGATCGG CATCGGTATC CAGTCGAAGG GGACCACGGT CATCCATCAG CGCGATCTGC 9060TGCCGCTCAG CAACCTGGAG CTGTTCTCCC AGGCGCCGCT GCTGACGCTG GAGACCTACC 9120GGCAGATTGG CAAAAACGCT GCGCGCTATG CGCGCAAAGA GTCACCTTCG CCGGTGCCGG 9180TGGTGAACGA TCAGATGGTG CGGCCGAAAT TTATGGCCAA AGCCGCGCTA TTTCATATCA 9240AAGAGACCAA ACATGTGGTG CAGGACGCCG AGCCCGTCAC CCTGCACATC GACTTAGTAA 9300GGGAGTGACC ATGAGCGAGA AAACCATGCG CGTGCAGGAT TATCCGTTAG CCACCCGCTG 9360CCCGGAGCAT ATCCTGACGC CTACCGGCAA ACCATTGACC GATATTACCC TCGAGAAGGT 9420GCTCTCTGGC GAGGTGGGCC CGCAGGATGT GCGGATCTCC CGCCAGACCC TTGAGTACCA 9480GGCGCAGATT GCCGAGCAGA TGCAGCGCCA TGCGGTGGCG CGCAATTTCC GCCGCGCGGC 9540GGAGCTTATC GCCATTCCTG ACGAGCGCAT TCTGGCTATC TATAACGCGC TGCGCCCGTT 9600CCGCTCCTCG CAGGCGGAGC TGCTGGCGAT CGCCGACGAG CTGGAGCACA CCTGGCATGC 9660GACAGTGAAT GCCGCCTTTG TCCGGGAGTC GGCGGAAGTG TATCAGCAGC GGCATAAGCT 9720GCGTAAAGGA AGCTAAGCGG AGGTCAGCAT GCCGTTAATA GCCGGGATTG ATATCGGCAA 9780CGCCACCACC GAGGTGGCGC TGGCGTCCGA CTACCCGCAG GCGAGGGCGT TTGTTGCCAG 9840CGGGATCGTC GCGACGACGG GCATGAAAGG GACGCGGGAC AATATCGCCG GGACCCTCGC 9900CGCGCTGGAG CAGGCCCTGG CGAAAACACC GTGGTCGATG AGCGATGTCT CTCGCATCTA 9960TCTTAACGAA GCCGCGCCGG TGATTGGCGA TGTGGCGATG GAGACCATCA CCGAGACCAT 10020TATCACCGAA TCGACCATGA TCGGTCATAA CCCGCAGACG CCGGGCGGGG TGGGCGTTGG 10080CGTGGGGACG ACTATCGCCC TCGGGCGGCT GGCGACGCTG CCGGCGGCGC AGTATGCCGA 10140GGGGTGGATC GTACTGATTG ACGACGCCGT CGATTTCCTT GACGCCGTGT GGTGGCTCAA 10200TGAGGCGCTC GACCGGGGGA TCAACGTGGT GGCGGCGATC CTCAAAAAGG ACGACGGCGT 10260GCTGGTGAAC AACCGCCTGC GTAAAACCCT GCCGGTGGTG GATGAAGTGA CGCTGCTGGA 10320GCAGGTCCCC GAGGGGGTAA TGGCGGCGGT GGAAGTGGCC GCGCCGGGCC AGGTGGTGCG 10380GATCCTGTCG AATCCCTACG GGATCGCCAC CTTCTTCGGG CTAAGCCCGG AAGAGACCCA 10440GGCCATCGTC CCCATCGCCC GCGCCCTGAT TGGCAACCGT TCCGCGGTGG TGCTCAAGAC 10500CCCGCAGGGG GATGTGCAGT CGCGGGTGAT CCCGGCGGGC AACCTCTACA TTAGCGGCGA 10560AAAGCGCCGC GGAGAGGCCG ATGTCGCCGA GGGCGCGGAA GCCATCATGC AGGCGATGAG 10620CGCCTGCGCT CCGGTACGCG ACATCCGCGG CGAACCGGGC ACCCACGCCG GCGGCATGCT 10680TGAGCGGGTG CGCAAGGTAA TGGCGTCCCT GACCGGCCAT GAGATGAGCG CGATATACAT 10740CCAGGATCTG CTGGCGGTGG ATACGTTTAT TCCGCGCAAG GTGCAGGGCG GGATGGCCGG 10800CGAGTGCGCC ATGGAGAATG CCGTCGGGAT GGCGGCGATG GTGAAAGCGG ATCGTCTGCA 10860AATGCAGGTT ATCGCCCGCG AACTGAGCGC CCGACTGCAG ACCGAGGTGG TGGTGGGCGG 10920CGTGGAGGCC AACATGGCCA TCGCCGGGGC GTTAACCACT CCCGGCTGTG CGGCGCCGCT 10980GGCGATCCTC GACCTCGGCG CCGGCTCGAC GGATGCGGCG ATCGTCAACG CGGAGGGGCA 11040GATAACGGCG GTCCATCTCG CCGGGGCGGG GAATATGGTC AGCCTGTTGA TTAAAACCGA 11100GCTGGGCCTC GAGGATCTTT CGCTGGCGGA AGCGATAAAA AAATACCCGC TGGCCAAAGT 11160GGAAAGCCTG TTCAGTATTC GTCACGAGAA TGGCGCGGTG GAGTTCTTTC GGGAAGCCCT 11220CAGCCCGGCG GTGTTCGCCA AAGTGGTGTA CATCAAGGAG GGCGAACTGG TGCCGATCGA 11280TAACGCCAGC CCGCTGGAAA AAATTCGTCT CGTGCGCCGG CAGGCGAAAG AGAAAGTGTT 11340TGTCACCAAC TGCCTGCGCG CGCTGCGCCA GGTCTCACCC GGCGGTTCCA TTCGCGATAT 11400CGCCTTTGTG GTGCTGGTGG GCGGCTCATC GCTGGACTTT GAGATCCCGC AGCTTATCAC 11460GGAAGCCTTG TCGCACTATG GCGTGGTCGC CGGGCAGGGC AATATTCGGG GAACAGAAGG 11520GCCGCGCAAT GCGGTCGCCA CCGGGCTGCT ACTGGCCGGT CAGGCGAATT AAACGGGCGC 11580TCGCGCCAGC CTCTCTCTTT AACGTGCTAT TTCAGGATGC CGATAATGAA CCAGACTTCT 11640ACCTTAACCG GGCAGTGCGT GGCCGAGTTT CTTGGCACCG GATTGCTCAT TTTCTTCGGC 11700GCGGGCTGCG TCGCTGCGCT GCGGGTCGCC GGGGCCAGCT TTGGTCAGTG GGAGATCAGT 11760ATTATCTGGG GCCTTGGCGT CGCCATGGCC ATCTACCTGA CGGCCGGTGT CTCCGGCGCG 11820CACCTAAATC CGGCGGTGAC CATTGCCCTG TGGCTGTTCG CCTGTTTTGA ACGCCGCAAG 11880GTGCTGCCGT TTATTGTTGC CCAGACGGCC GGGGCCTTCT GCGCCGCCGC GCTGGTGTAT 11940GGGCTCTATC GCCAGCTGTT TCTCGATCTT GAACAGAGTC AGCATATCGT GCGCGGCACT 12000GCCGCCAGTC TTAACCTGGC CGGGGTCTTT TCCACGTACC CGCATCCACA TATCACTTTT 12060ATACAAGCGT TTGCCGTGGA GACCACCATC ACGGCAATCC TGATGGCGAT GATCATGGCC 12120CTGACCGACG ACGGCAACGG AATTC12145(2)SEQ ID NO20的信息(i)序列特征(A)长度94个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO20AGCTTAGGAG TCTAGAATAT TGAGCTCGAA TTCCCGGGCA TGCGGTACCG GATCCAGAAA60AAAGCCCGCA CCTGACAGTG CGGGCTTTTT TTTT94(2)SEQ ID NO21的信息(i)序列特征(A)长度37个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO21GGAATTCAGA TCTCAGCAAT GAGCGAGAAA ACCATGC 37(2)SEQ ID NO22的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO22GCTCTAGATT AGCTTCCTTT ACGCAGC27(2)SEQ ID NO23的信息
(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO23GGCCAAGCTT AAGGAGGTTA ATTAAATGAA AAG33(2)SEQ ID NO24的信息(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO24GCTCTAGATT ATTCAATGGT GTCGGG26(2)SEQ ID NO25的信息(i)序列特征(A)长度42个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO25GCGCCGTCTA GAATTATGAG CTATCGTATG TTTGATTATC TG 42(2)SEQ ID NO26的信息(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO26TCTGATACGG GATCCTCAGA ATGCCTGGCG GAAAAT 36(2)SEQ ID NO27的信息(i)序列特征(A)长度51个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)
(xi)序列描述SEQ ID NO27GCGCGGATCC AGGAGTCTAG AATTATGGGA TTGACTACTA AACCTCTATC T51(2)SEQ ID NO28的信息(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO28GATACGCCCG GGTTACCATT TCAACAGATC GTCCTT 36(2)SEQ ID NO29的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO29TCGACGAATT CAGGAGGA 18(2)SEQ ID NO30的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO30CTAGTCCTCC TGAATTCG 18(2)SEQ ID NO31的信息(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO31CTAGTAAGGA GGACAATTC19(2)SEQ ID NO32的信息(i)序列特征(A)长度19个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO32CATGGAATTG TCCTCCTTA19(2)SEQ ID NO33的信息(i)序列特征(A)长度271个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体GPP1(xi)序列描述SEQ ID NO33Met Lys Arg Phe Asn Val Leu Lys Tyr Ile Arg Thr Thr Lys Ala Asn1 5 10 15Ile Gln Thr Ile Ala Met Pro Leu Thr Thr Lys Pro Leu Ser Leu Lys20 25 30Ile Asn Ala Ala Leu Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln35 40 45Pro Ala Ile Ala Ala Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr50 55 60Phe Asp Ala Glu His Val Ile His Ile Ser His Gly Trp Arg Thr Tyr65 70 75 80Asp Ala Ile Ala Lys Phe Ala Pro Asp Phe Ala Asp Glu Glu Tyr Val85 90 95Asn Lys Leu Glu Gly Glu Ile Pro Glu Lys Tyr Gly Glu His Ser Ile100 105 110Glu Val Pro Gly Ala Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro115 120 125Lys Glu Lys Trp Ala Val Ala Thr Ser Gly Thr Arg Asp Met Ala Lys130 135 140Lys Trp Phe Asp Ile Leu Lys Ile Lys Arg Pro Glu Tyr Phe Ile Thr145 150 155 160Ala Asn Asp Val Lys Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys165 170 175Gly Arg Asn Gly Leu Gly Phe Pro Ile Asn Glu Gln Asp Pro Ser Lys180 185 190Ser Lys Val Val Val Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly195 200 205Lys Ala Ala Gly Cys Lys Ile Val Gly Ile Ala Thr Thr Phe Asp Leu210 215 220Asp Phe Leu Lys Glu Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu225 230 235 240Ser Ile Arg Val Gly Glu Tyr Asn Ala Glu Thr Asp Glu Val Glu Leu245 250 255Ile Phe Asp Asp Tyr Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp260 265 270(2)SEQ ID NO34的信息(i)序列特征(A)长度555个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体DHAB1(xi)序列描述SEQ ID NO34Met Lys Arg Ser Lys Arg Phe Ala Val Leu Ala Gln Arg Pro Val Asn1 5 10 15Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu Gly Leu Ile Ala Met20 25 30Asp Ser Pro Phe Asp Pro Val Ser Ser Val Lys Val Asp Asn Gly Leu35 40 45Ile Val Glu Leu Asp Gly Lys Arg Arg Asp Gln Phe Asp Met Ile Asp50 55 60Arg Phe Ile Ala Asp Tyr Ala Ile Asn Val Glu Arg Thr Glu Gln Ala65 70 75 80Met Arg Leu Glu Ala Val Glu Ile Ala Arg Met Leu Val Asp Ile His85 90 95Val Ser Arg Glu Glu Ile Ile Ala Ile Thr Thr Ala Ile Thr Pro Ala100 105 110Lys Ala Val Glu Val Met Ala Gln Met Asn Val Val Glu Met Met Met115 120 125Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His130 135 140Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala145 150 155 160Glu Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile165 170 175Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln180 185 190Cys Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr195 200 205Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val210 215 220Ser Val Tyr Gly Thr Glu Ala Val Phe Thr Asp Gly Asp Asp Thr Pro225 230 235 240Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys245 250 255Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ser260 265 270Glu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr275 280 285Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile290 295 300Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu305 310 315 320Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp325 330 335Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met340 345 350Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val355 360 365Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp370 375 380Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly385 390 395 400Leu Arg Pro Val Thr Glu Ala Glu Thr Ile Ala Ile Arg Gln Lys Ala405 410 415Ala Arg Ala Ile Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Pro Ile420 425 430Ala Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Asn Glu435 440 445Met Pro Pro Arg Asn Val Val Glu Asp Leu Ser Ala Val Glu Glu Met450 455 460Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Gly Ala Leu Ser Arg465 470 475 480Ser Gly Phe Glu Asp Ile Ala Ser Asn Ile Leu Asn Met Leu Arg Gln485 490 495Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Gln500 505 510Phe Glu Val Val Ser Ala Val Asn Asp Ile Asn Asp Tyr Gln Gly Pro515 520 525Gly Thr Gly Tyr Arg Ile Ser Ala Glu Arg Trp Ala Glu Ile Lys Asn530 535 540Ile Pro Gly Val Val Gln Pro Asp Thr Ile Glu545 550 555(2)SEQ ID NO35的信息(i)序列特征(A)长度194个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体DHAB2(xi)序列描述SEQ ID NO35Met Gln Gln Thr Thr Gln Ile Gln Pro Ser Phe Thr Leu Lys Thr Arg1 5 10 15Glu Gly Gly Val Ala Ser Ala Asp Glu Arg Ala Asp Glu Val Val Ile20 25 30Gly Val Gly Pro Ala Phe Asp Lys His Gln His His Thr Leu Ile Asp35 40 45Met Pro His Gly Ala Ile Leu Lys Glu Leu Ile Ala Gly Val Glu Glu50 55 60Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val65 70 75 80Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly85 90 95Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu100 105 110Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr115 120 125Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg130 135 140Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg145 150 155 160Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys165 170 175His Val Val Gln Asp Ala Glu Pro Val Thr Leu His Ile Asp Leu Val180 185 190Arg Glu(2)SEQ ID NO36的信息(i)序列特征(A)长度140个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体DHAB3
(xi)序列描述SEQ ID NO36Met Ser Glu Lys Thr Met Arg Val Gln Asp Tyr Pro Leu Ala Thr Arg1 5 10 15Cys Pro Glu His Ile Leu Thr Pro Thr Gly Lys Pro Leu Thr Asp Ile20 25 30Thr Leu Glu Lys Val Leu Ser Gly Glu Val Gly Pro Gln Asp Val Arg35 40 45Ile Ser Arg Gln Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met50 55 60Gln His Ala Val Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile Ala65 70 75 80Ile Pro Asp Glu Arg Ile Leu Ala Ile Tyr Asn Ala Leu Arg Pro Phe85 90 95Arg Ser Ser Gln Ala Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu His100 105 110Thr Trp His Ala Thr Val Asn Ala Ala Phe Val Arg Glu Ser Ala Glu115 120 125Val Tyr Gln Gln Arg His Lys Leu Arg Lys Gly Ser130 135 140(2)SEQ ID NO37的信息(i)序列特征(A)长度387个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构未知(ii)分子类型蛋白质(vi)原始来源(A)生物体DHAT(xi)序列描述SEQ ID NO37Met Ser Tyr Arg Met Phe Asp Tyr Leu Val Pro Asn Val Asn Phe Phe1 5 10 15Gly Pro Asn Ala Ile Ser Val Val Gly Glu Arg Cys Gln Leu Leu Gly20 25 30Gly Lys Lys Ala Leu Leu Val Thr Asp Lys Gly Leu Arg Ala Ile Lys35 40 45Asp Gly Ala Val Asp Lys Thr Leu His Tyr Leu Arg Glu Ala Gly Ile50 55 60Glu Val Ala Ile Phe Asp Gly Val Glu Pro Asn Pro Lys Asp Thr Asn65 70 75 80Val Arg Asp Gly Leu Ala Val Phe Arg Arg Glu Gln Cys Asp Ile Ile85 90 95Val Thr Val Gly Gly Gly Ser Pro His Asp Cys Gly Lys Gly Ile Gly100 105 110Ile Ala Ala Thr His Glu Gly Asp Leu Tyr Gln Tyr Ala Gly Ile Glu115 120 125Thr Leu Thr Asn Pro Leu Pro Pro Ile Val Ala Val Asn Thr Thr Ala130 135 140Gly Thr Ala Ser Glu Val Thr Arg His Cys Val Leu Thr Asn Thr Glu145 150 155 160Thr Lys Val Lys Phe Val Ile Val Ser Trp Arg Lys Leu Pro Ser Val165 170 175Ser Ile Asn Asp Pro Leu Leu Met Ile Gly Lys Pro Ala Ala Leu Thr180 185 190Ala Ala Thr Gly Met Asp Ala Leu Thr His Ala Val Glu Ala Tyr Ile195 200 205Ser Lys Asp Ala Asn Pro Val Thr Asp Ala Ala Ala Met Gln Ala Ile210 215 220Arg Leu Ile Ala Arg Asn Leu Arg Gln Ala Val Ala Leu Gly Ser Asn225 230 235 240Leu Gln Ala Arg Glu Asn Met Ala Tyr Ala Ser Leu Leu Ala Gly Met245 250 255Ala Phe Asn Asn Ala Asn Leu Gly Tyr Val His Ala Met Ala His Gln260 265 270Leu Gly Gly Leu Tyr Asp Met Pro His Gly Val Ala Asn Ala Val Leu275 280 285Leu Pro His Val Ala Arg Tyr Asn Leu Ile AIa Asn Pro Glu Lys Phe290 295 300Ala Asp Ile Ala Glu Leu Met Gly Glu Asn Ile Thr Gly Leu Ser Thr305 310 315 320Leu Asp Ala Ala Glu Lys Ala Ile Ala Ala Ile Thr Arg Leu Ser Met325 330 235Asp Ile Gly Ile Pro Gln His Leu Arg Asp Leu Gly Val Lys Glu Ala340 345 350Asp Phe Pro Tyr Met Ala Glu Met Ala Leu Lys Asp Gly Asn Ala Phe355 360 365Ser Asn Pro Arg Lys Gly Asn Glu Gln Glu Ile Ala Ala Ile Phe Arg370 375 380Gln Ala Phe385(2)SEQ ID NO38的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)
(xi)序列描述SEQ ID NO38GCGAATTCAT GAGCTATCGT ATGTTTG 27(2)SEQ ID NO39的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO39GCGAATTCAG AATGCCTGGC GGAAAATC 28(2)SEQ ID NO40的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO40GGGAATTCAT GAGCGAGAAA ACCATGCG 28(2)SEQ ID NO41的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO41GCGAATTCTT AGCTTCCTTT ACGCAGC 27(2)SEQ ID NO42的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO42GCGAATTCAT GCAACAGACA ACCCAAATTC30(2)SEQ ID NO43的信息(i)序列特征(A)长度25个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO43GCGAATTCAC TCCCTTACTA AGTCG 25(2)SEQ ID NO44的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO44GGGAATTCAT GAAAAGATCA AAACGATTTG30(2)SEQ ID NO45的信息(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO45GCGAATTCTT ATTCAATGGT GTCGGGCTG 29(2)SEQ ID NO46的信息(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO46TTGATAATAT AACCATGGCT GCTGCTGCTG ATAG 34(2)SEQ ID NO47的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO47GTATGATATG TTATCTTGGA TCCAATAAAT CTAATCTTC 39(2)SEQ ID NO48的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO48CATGACTAGT AAGGAGGACA ATTC 24(2)SEQ ID NO49的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO49CATGGAATTG TCCTCCTTAC TAGT 2权利要求
1.由重组生物体生产1,3-丙二醇的方法,包括(i)用转化盒转化合适宿主生物体,所述转化盒含有至少一种以下基因(a)编码甘油-3-磷酸脱氢酶活性的基因;(b)编码甘油-3-磷酸酶活性的基因;(c)编码脱水酶活性的基因;(d)编码1,3-丙二醇氧化还原酶活性的基因;条件是假如所述转化盒包含少于(a)-(d)的全部4个基因,那么所述合适宿主生物体含有内源性基因,由此产生的转化宿主生物体含有(a)-(d)基因每种至少一个;(ii)在存在至少一种选自单糖、寡糖、多糖或一碳底物的碳源的情况下,于合适条件培养所述转化宿主生物体,由此生产1,3-丙二醇;以及(iii)回收1,3-丙二醇。
2.权利要求1的方法,其中所述转化盒包含(a)-(d)所有基因。
3.权利要求1的方法,其中所述合适宿主生物体选自细菌、酵母和丝状真菌。
4.权利要求3的方法,其中所述合适宿主生物体选自柠檬酸杆菌属、肠杆菌属、梭菌属、克雷伯氏菌属、气杆菌属、乳杆菌属、曲霉属、酵母属、裂殖酵母属、接合酵母属、毕赤酵母属、克鲁维酵母属、念珠菌属、汉逊酵母、德巴利酵母属、毛霉属、球拟酵母属、甲基酵母属、埃希氏菌属、沙门氏菌属、芽孢杆菌属、链霉菌属和假单胞菌属。
5.权利要求4的方法,其中所述合适宿主生物体选自大肠杆菌、克雷伯氏菌属菌种(Klebsiella spp.)和酵母属菌种(Saccharomycesspp.)。
6.权利要求1的方法,其中所述转化宿主生物体是用包含dhaB1、dhaB2、dhaB3和dhaT基因的转化盒转化的酵母属菌种(Saccharomycesspp.),其中所述基因稳定地整合入所述酵母属菌种基因组。
7.权利要求1的方法,其中所述转化宿主生物体是用包含GPD1和GPD2基因的转化盒转化的克雷伯氏菌属菌种(Klebsiella spp.)。
8.权利要求1的方法,其中所述碳源是萄萄糖。
9.权利要求1的方法,其中所述编码甘油-3-磷酸脱氢酶的基因选自相应于SEQ ID NO11、SEQ ID NO12和SEQ ID NO13所示氨基酸序列的基因,所述氨基酸序列包含不引起所述甘油-3-磷酸脱氢酶功能改变的氨基酸取代、缺失或加入。
10.权利要求1的方法,其中所述编码甘油-3-磷酸酶的基因选自相应于SEQ ID NO33和SEQ ID NO17所示氨基酸序列的基因,所述氨基酸序列包含不引起所述甘油-3-磷酸酶功能改变的氨基酸取代、缺失或加入。
11.权利要求1的方法,其中所述编码甘油激酶的基因相应于SEQID NO18所示氨基酸序列,所述氨基酸序列包含不引起所述甘油激酶功能改变的氨基酸取代、缺失或加入。
12.权利要求1的方法,其中所述编码脱氢酶的基因包括dhaB1、dhaB2和dhaB3,所述基因分别对应于SEQ ID NO34、SEQ ID NO35和SEQ ID NO36所示的氨基酸序列,所述氨基酸序列包含不引起所述脱氢酶功能改变的氨基酸取代、缺失或加入。
13.权利要求1的方法,其中所述编码1,3-丙二醇氧化还原酶的基因对应于SEQ ID NO37所示的氨基酸序列,所述氨基酸序列包含不引起所述1,3-丙二醇氧化还原酶功能改变的氨基酸取代、缺失或加入。
14.转化的宿主细胞,包含(a)一组基因,包括(1)编码相应于SEQ ID NO11所示氨基酸序列的甘油-3-磷酸脱氢酶的基因;(2)编码相应于SEQ ID NO17所示氨基酸序列的甘油-3-磷酸酶的基因;(3)编码相应于SEQ ID NO34所示氨基酸序列的甘油脱水酶α亚基的基因;(4)编码相应于SEQ ID NO35所示氨基酸序列的甘油脱水酶β亚基位的基因;(5)编码相应于SEQ ID NO36所示氨基酸序列的甘油脱水酶γ亚基的基因;以及(6)编码相应于SEQ ID NO37所示氨基酸序列的1,3-丙二醇氧化还原酶的基因,(a)(1)-(6)的各个氨基酸序列包含不引起基因(1)-(6)的酶的功能改变的氨基酸取代、缺失或加入,以及(b)用(a)的一组基因转化宿主细胞,由此转化的宿主细胞利用选自单糖、寡糖和多糖或一碳底物的至少一种底物生产1,3-丙二醇。
全文摘要
提供重组生物体,该重组生物体含有编码甘油-3-磷酸脱氢酶、甘油-3-磷酸酶、甘油脱水酶和1,3-丙二醇氧化还原酶活性的基因,可用于由多种碳底物生产1,3-丙二醇。
文档编号C12N1/21GK1244217SQ97181298
公开日2000年2月9日 申请日期1997年11月10日 优先权日1996年11月13日
发明者A·A·加藤拜, S·L·海尼, V·纳加拉杨, R·V·奈尔, C·E·纳卡慕拉, M·S·派尼, S·K·皮卡塔吉奥, M·迪尔斯-托雷斯, A·K·H·苏, R·D·拉雷奥, D·E·特里姆布尔, G·M·怀特德 申请人:纳幕尔杜邦公司, 詹伦卡国际有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1