本发明涉及重组细胞、重组细胞的制备方法以及异戊二烯或萜烯的生产方法。本发明的重组细胞稳定地保持了通过甲羟戊酸途径合成异戊烯二磷酸的能力,并且具有高的异戊二烯或萜烯的生产性。
背景技术:
异戊二烯是合成聚异戊二烯的单体原料,特别是在轮胎工业中是重要的材料。另一方面,萜烯是以碳原子数为5的异戊二烯作为构成单元的烃,并且是由植物、昆虫、菌类等产生出的一组生物体物质。异戊二烯以及萜烯用于树脂原料、香料原料、食品添加剂、洗涤剂、电子材料、医药和农药原料等的所有领域,并且是作为工业材料必不可少的物质。
由于异戊二烯主要作为石脑油或乙烯生产的石油裂解的副产物而通过石化工艺进行生产,因此对于将来的需求而言,原料的可持续性存在危险。此外,由于许多有用的萜烯是从植物或其精油等天然的原料中提取·纯化而得的,因此难以大量获得。虽然也尝试了化学合成,但是具有复杂结构的萜烯的合成需要极大的成本和劳动力。因此,异戊二烯或萜烯的已有的生产方法中存在许多的问题。
近年来,在各种物质生产领域中,利用了微生物等并且通过生物技术而向新的生产工艺的转换技术的开发和实用化正在稳步发展。关于异戊二烯或萜烯,例如,已知使用糖作为原料的重组大肠杆菌的生产技术(例如,专利文献1、2)。然而,这些全部被限制为少量的连续生产或通过诱导表达系统的瞬时生产,从未有过可以进行恒定的大规模生产的例子。因此,特别是在该技术领域中,需要能够实现稳定大规模生产的新技术。需要说明的是,作为通过大肠杆菌以外的微生物(重组体)的异戊二烯的生产技术,例如存在专利文献3、4中记载的那些。
就通过微生物(重组体)生产异戊二烯或萜烯而言,在微生物中大量合成构成其前体的异戊烯二磷酸(IPP)和构成其异构体的二甲基烯丙基二磷酸(DMAPP)是必要的。IPP能够通过两种不同的代谢途径合成,即甲羟戊酸途径(MVA途径)和非甲羟戊酸途径(MEP途径)。甲羟戊酸途径存在于真核细胞的细胞质、一部分的放线菌或古细菌中。非甲羟戊酸途径存在于细菌或植物的叶绿体等中。
甲羟戊酸途径(MVA途径)使用乙酰CoA作为起始材料。作为在甲羟戊酸途径中起作用的酶,从上游起依次可举出:乙酰CoA乙酰转移酶、HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶、5-磷酸甲羟戊酸激酶以及二磷酸甲羟戊酸脱羧酶。
另一方面,非甲羟戊酸途径(MEP途径)使用甘油醛3-磷酸和丙酮酸作为起始材料。作为在非甲羟戊酸途径中起作用的酶,从上游起依次可举出:DOXP合成酶、DOXP还原异构酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇合成酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇激酶、2-C-甲基-D-赤藓糖醇-2,4-环二磷酸合成酶、HMB-PP合成酶以及HMB-PP还原酶。
在使用大肠杆菌等细菌生产异戊二烯或萜烯时,可以认为,除了内源性MEP途径之外,还可以通过导入在能量上占优势的外源MVA途径来进行更有效的前体合成。即,由于内源性MEP途径受到多重且精密的控制,其改变是非常困难的,难以改变内源性MEP途径而实现作为前体的IPP的大规模合成。因此,为了大量获得异戊二烯、萜烯等目标产物,优选利用MVA途径进行前体合成能力的提高。
然而,当向宿主中导入外源MVA途径时,随着通过MVA途径的前体合成效率的提高,生物合成途径中的中间代谢物引起的细胞毒性不容忽视。因此,在已导入外源MVA途径的宿主中,为了避免这些毒性物质的积蓄,能积极地接受MVA途径的基因中发生突变并丧失了功能的基因。其结果,在导入外源MVA途径并生长而得的克隆中,丧失MVA途径的活性并且依赖于内源性MEP途径活性的克隆具有优势。可以认为,这种现象是阻碍获得稳定的高生产异戊二烯或萜烯的菌株的重要因素之一。因此,为了通过微生物而提高异戊二烯、萜烯等目标产物的生产量,有必要获得不依赖于MEP途径并且具有通过MVA途径的稳定的IPP合成能力的克隆,并且提高通过MVA途径的前体合成能力。
现有技术文献
专利文献
[专利文献1]日本特表2011-505841号公报
[专利文献2]日本特表2011-518564号公报
[专利文献3]国际公开第2014/065271号
[专利文献4]国际公开第2014/104202号
技术实现要素:
发明所解决的技术问题
为了实现上述目的,例如,期望利用缺失了通过内源性MEP途径合成IPP的能力并且仅通过MVA途径合成IPP而生长的微生物。然而,具有这种特征(基因型)的生产异戊二烯或萜烯的微生物(重组体)仍是未知的,并且使用了该微生物来生产异戊二烯或萜烯的方法也是未知的。
因此,本发明的目的是提供能够稳定地大量生产异戊二烯或萜烯的重组细胞,以及使用该重组细胞来生产异戊二烯或萜烯的方法。
解决问题的技术手段
本发明的一个实施方式是一种重组细胞,其能够生产异戊二烯或萜烯,所述重组细胞具有通过甲羟戊酸途径合成异戊烯二磷酸的能力,其中,选自DOXP合成酶、DOXP还原异构酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇合成酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇激酶、2-C-甲基-D-赤藓糖醇-2,4-环二磷酸合成酶、HMB-PP合成酶以及HMB-PP还原酶中的至少一种内源性酶的活性发生了缺失,从而缺失了通过内源性非甲羟戊酸途径合成异戊烯二磷酸的能力,上述重组细胞具有编码异戊二烯合成酶的基因、编码单萜合成酶的基因、编码倍半萜合成酶的基因、编码二萜合成酶的基因、编码角鲨烯合成酶的基因或编码八氢番茄红素合成酶的基因,作为第一外源基因,表达上述第一外源基因,能够生产异戊二烯或碳原子数为10、15、20、30或40的萜烯。
上述甲羟戊酸途径优选是外源性甲羟戊酸途径。
通过上述外源性甲羟戊酸途径合成异戊烯二磷酸的能力优选是通过下述基因实现的:编码选自乙酰CoA乙酰转移酶、HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶、5-磷酸甲羟戊酸激酶以及二磷酸甲羟戊酸脱羧酶中的至少一种酶的第二外源基因。
上述重组细胞优选是细菌。
上述重组细胞优选是古细菌。
上述重组细胞,优选能够用选自一氧化碳和二氧化碳中的至少一种作为唯一碳源进行增殖。
上述重组细胞,优选具有由甲基四氢叶酸或甲基四氢蝶呤、一氧化碳以及CoA来合成乙酰CoA的功能。
上述重组细胞,优选是梭菌属(Clostridium)细菌或穆尔氏菌属(Moorella)细菌。
上述重组细胞,优选是属于甲烷八叠球菌属(Methanosarcina)、甲烷球菌(Methanococcus)或甲烷热球菌属(Methanothermococc)的古细菌。
上述重组细胞,优选能够由选自甲烷、甲醇、甲胺、甲酸、甲醛以及甲酰胺中的至少一种C1化合物来生产异戊二烯或萜烯。
上述重组细胞,优选具有选自丝氨酸途径、核酮糖单磷酸途径以及木酮糖单磷酸途径中的至少一种C1碳同化途径,作为甲醛的固定化途径。
上述重组细胞,优选属于Methylacidphilum属、甲基弯曲菌属(Methylosinus)、甲基胞囊菌属(Methylocystis)、甲基杆菌属(Methylobacterium)、甲基胞菌属(Methylocella)、甲基球菌属(Methylococcus)、甲基单胞菌属(Methylomonas)、甲基杆状菌属(Methylobacter)、甲基小杆菌属(Methylobacillus)、嗜甲基菌属(Methylophilus)、甲基娇养杆菌属(Methylotenera)、食甲基菌属(Methylovorus)、甲基微菌属(Methylomicrobium)、噬甲基菌属(Methylophaga)、嗜甲基菌属(Methylophilaceae)、甲基营养菌属(Methyloversatilis)。
上述重组细胞,优选属于甲烷球形菌(Methanosphaera)、甲烷八叠球菌属(Methanosarcina)、甲烷叶菌属(Methanolobus)、甲烷类球菌属(Methanococcoides)、甲烷嗜盐菌(Methanohalophilus)、甲烷盐菌属(Methanohalobium)。
本发明的另一个实施方式是一种上述重组细胞的制备方法,其包含下述工序:第一工序,提供具有通过非甲羟戊酸途径合成异戊烯二磷酸的能力的宿主细胞;第二工序,使上述宿主细胞所具有的通过非甲羟戊酸途径合成异戊烯二磷酸的能力缺失;第三工序,向上述宿主细胞中导入编码异戊二烯合成酶的基因、编码单萜合成酶的基因、编码倍半萜合成酶的基因、编码二萜合成酶的基因、编码角鲨烯合成酶的基因或编码八氢番茄红素合成酶的基因,作为第一外源基因。
上述重组细胞的制备方法,优选其还包含下述工序:第四工序,向上述宿主细胞中导入编码选自下述酶组中的至少一种酶的基因作为第二外源基因,并赋予通过该甲羟戊酸途径合成异戊烯二磷酸的能力,上述酶组为在甲羟戊酸途径中起作用的酶组,即乙酰CoA乙酰转移酶、HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶、5-磷酸甲羟戊酸激酶以及二磷酸甲羟戊酸脱羧酶。
本发明的另一个实施方式是一种异戊二烯或萜烯的生产方法,其中,上述重组细胞或通过上述重组细胞的制备方法而制得的重组细胞,与选自一氧化碳、二氧化碳、甲酸、甲烷、甲醇、甲胺、甲醛以及甲酰胺中的至少一种C1化合物接触,在上述重组细胞中由上述C1化合物生产异戊二烯或碳原子数为10、15、20、30或40的萜烯。
上述异戊二烯或萜烯的生产方法优选包含下述工序:使用选自一氧化碳、二氧化碳、甲酸、甲烷、甲醇、甲胺、甲醛以及甲酰胺中的至少一种C1化合物作为碳源对上述重组细胞进行培养,并从其培养物中得到异戊二烯或碳原子数为10、15、20、30或40的萜烯。
发明效果
根据本发明,可以稳定地进行使用了重组细胞的异戊二烯或萜烯的生产。
附图说明
[图1]是表示质粒pUC-Δdxr-ermC的构成的说明图。
[图2]是表示质粒pSK1(LbMVA-ISPS)的构成的说明图。
具体实施方式
在下文中,将对本发明的实施方式进行说明。需要说明的是,在本发明中,术语“基因”全部可以用术语“核酸”或“DNA”代替。
本发明的重组细胞是能够生产异戊二烯或萜烯的重组细胞,其具有通过甲羟戊酸途径(MVA途径)合成异戊烯二磷酸的能力,缺失了通过内源性非甲羟戊酸途径(MEP途径)合成异戊烯二磷酸的能力。此外,本发明的重组细胞编码具有编码异戊二烯合成酶的基因、编码单萜合成酶的基因、编码倍半萜合成酶的基因、编码二萜合成酶的基因、编码角鲨烯合成酶的基因或编码八氢番茄红素合成酶的基因,作为外源基因(第一外源基因)。
<甲羟戊酸途径>
如上所述,甲羟戊酸途径(MVA途径)是使用乙酰CoA作为起始材料的异戊烯二磷酸(IPP)的生物合成途径。在甲羟戊酸途径中起作用的酶,从上游起依次可举出:乙酰CoA乙酰转移酶、HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶、5-磷酸甲羟戊酸激酶以及二磷酸甲羟戊酸脱羧酶。
本发明的重组细胞具有通过MVA途径合成异戊烯二磷酸(IPP)的能力。
本发明的重组细胞具有的MVA途径中,包含宿主细胞固有的内源性MVA途径和从外源向宿主细胞导入的MVA途径。当宿主细胞是仅具有非甲羟戊酸途径(MEP途径)作为IPP合成途径的宿主细胞(例如,细菌等原核生物)时,上述MVA途径是外源性的。另一方面,当宿主细胞具有MEP途径和MVA途径两者作为IPP合成途径时,上述MVA途径可以是内源性或外源性中的任意一者或者两者。
当向宿主细胞中导入外源性MVA途径时,将编码在甲羟戊酸途径中起作用的酶的基因,例如编码选自乙酰CoA乙酰转移酶、HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶、5-磷酸甲羟戊酸激酶以及二磷酸甲羟戊酸脱羧酶等中的酶的基因(第二外源基因)导入宿主中,并且使其表达。导入的酶基因,只要其保持通过MVA途径合成IPP的能力,则可以是上述任意一种酶基因或多种酶基因。
作为外源性MVA途径的来源,例如上述酶组(乙酰CoA乙酰转移酶、HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶、5-磷酸甲羟戊酸激酶、二磷酸甲羟戊酸脱羧酶)的来源,例如可举出来源于真核生物。需要说明的是,全部的真核生物都具有MVA途径。
然而,在真核生物以外的生物中也发现了MVA途径。作为具有MVA途径的上述微生物,在放线菌中可举出:链霉菌属菌株(Streptomyces sp.Strain)CL190(Takagi M.et al.,J.Bacteriol.2000,182(15),4153-7)、灰色孢链霉菌(Streptomyces griseolosporeus)MF730-N6(Hamano Y.et al.,Biosci.Biotechnol.Biochem.2001,65(7),1627-35)。
此外,在细菌中可举出:瑞士乳杆菌(Lactobacillus helvecticus)(Smeds A et al.,DNA seq.2001,12(3),187-190)、约氏乳杆菌(Lactobacillus johnsonii)NCC 533、无枝菌酸棒杆菌(Corynebacterium amycolatum)、海分枝杆菌(Mycobacterium marinum)、凝结芽孢杆菌(Bacillus coagulans)、粪肠球菌(Enterococcus faecalis)、无乳链球菌(Streptococcus agalactiae)、橙黄色黏球菌(Myxococcus xanthus)等(Lombard J.et al.,Mol.Biol.Evol.2010,28(1),87-99)。
此外,在古细菌中可举出:气火菌属(Aeropyrum)、硫化叶菌属(Sulfolobus)、脱硫古球菌属(Desulfurococcus)、热变形菌属(Thermoproteus)、阳光杆菌属(Halobacterium)、甲烷球菌属(Methanococcus)、热球菌属(Thermococcus)、热火球古菌属(Pyrococcus)、甲烷火菌属(Methanopyrus)、热原体属(Thermoplasma)等(Lombard J.et al.,Mol.Biol.Evol.2010,28(1),87-99)。
在本发明中,这些来源于放线菌、细菌或古细菌的MVA途径可以用作外源性MVA途径。
<非甲羟戊酸途径>
非甲羟戊酸途径(MEP途径)是异戊烯基二磷酸(IPP)的生物合成途径,其中,使用甘油醛3-磷酸和丙酮酸作为起始材料。作为在非甲羟戊酸途径中起作用的酶,从上游起依次可举出:DOXP合成酶、DOXP还原异构酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇合成酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇激酶、2-C-甲基-D-赤藓糖醇-2,4-环二磷酸合成酶、HMB-PP合成酶以及HMB-PP还原酶。
本发明的重组细胞缺失了通过内源性MEP途径合成异戊烯二磷酸(IPP)的能力。具体而言,上述选自DOXP合成酶、DOXP还原异构酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇合成酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇激酶、2-C-甲基-D-赤藓糖醇-2,4-环二磷酸合成酶、HMB-PP合成酶以及HMB-PP还原酶中的至少一种内源性酶的活性发生了缺失,其结果,缺失了通过内源性MEP途径合成IPP的能力。
作为缺失了这些酶的活性的实施方式,例如可举出:缺失了编码酶的结构基因的一部分或全部、在结构基因中产生移码等突变等实施方式。其他实施方式可举出:由于控制酶基因的启动子的突变或核糖体结合区域的突变等,而不能正常进行酶的表达的实施方式。作为突变处理,可举出:通过放射线照射或使用N-甲基-N’-硝基-N-亚硝基胍(NTG)或亚硝酸等变异剂的处理等。
缺失了活性的酶是DOXP合成酶、DOXP还原异构酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇合成酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇激酶、2-C-甲基-D-赤藓糖醇-2,4-环二磷酸合成酶、HMB-PP合成酶以及HMB-PP还原酶中的任意一种或多种。
在优选的实施方式中,缺失了DOXP还原异构酶和HMB-PP合成酶中的至少一种或两种。
<宿主细胞>
作为本发明的重组细胞所基于的宿主细胞,可以是具有MEP途径的宿主细胞,例如可举出细菌。此外,一部分古细菌也是候选者。此外,从可资化碳源的观点出发,作为所谓的合成气利用性微生物或甲醇利用性微生物(甲基营养菌等)并且具有MEP途径的微生物是宿主细胞的候选者。
<合成气利用性微生物>
合成气(Synthesis gas,Syngas)是由一氧化碳、二氧化碳以及氢作为主要成分的混合气体,其可以通过金属催化剂的作用在高温·高压下从废弃物、天然气以及煤中有效地获得。
在本发明的重组细胞的一个实施方式中,重组细胞能够用选自一氧化碳和二氧化碳中的至少一种作为唯一碳源进行增殖。此外,其优选具有由甲基四氢叶酸或甲基四氢蝶呤、一氧化碳以及CoA来合成乙酰CoA的功能。通过具有这些性质,本发明的重组细胞例如可以利用合成气来生产异戊二烯或萜烯。作为这类细胞(微生物)的实例,可举出:具有还原型乙酰CoA途径(Wood-Ljungdahl pathway)和甲醇途径(Methanol pathway)的厌氧性微生物。
作为该厌氧性微生物的代表性实例,可举出:杨氏梭菌(Clostridium ljungdahlii)、Clostridium autoethanogenum、食一氧化碳梭菌(Clostridium carboxidivorans)、Clostridium ragsdalei(Kopke M.et al.,Appl.Environ.Microbiol.2011,77(15),5467-5475)、热醋穆尔氏菌(Moorella thermoacetica)(与Clostridium thermoaceticum相同)(Pierce EG.Et al.,Environ.Microbiol.2008,10,2550-2573)等的梭菌属(Clostridium)细菌或穆尔氏菌属(Moorella)细菌。特别是,梭菌属(Clostridium)细菌已经确立了宿主-载体系统或培养方法,并且适合作为本发明的宿主细胞。
作为除梭菌属(Clostridium)细菌、穆尔氏菌属(Moorella)细菌之外的上述厌氧微生物的实例,可举出:生孢一氧化碳胞菌(Carboxydocella sporoducens sp.Nov.)(Slepova TV.et al.,Inter.J.Sys.Evol.Microbiol.2006,56,797-800)、胶状红假单胞菌菌(Rhodopseudomonas gelatinosa)(Uffen RL,J.Bacteriol.1983,155(3),956-965)、黏液真杆菌(Eubacterium limosum)(Roh H.et al.,J.Bacteriol.2011,193(1),307-308)、甲基丁酸杆菌(Butyribacterium methylotrophicum)(Lynd,LH.Et al.,J.Bacteriol.1983,153(3),1415-1423)、食羧寡养菌(Oligotropha carboxidovorans)、日本慢生根瘤菌(Bradyrhizobium japonicum)等细菌。
此外,虽然细菌具有还原型乙酰CoA途径,但是古细菌也具有类似的途径。作为乙酰CoA合成酶的基质的甲基供体,在细菌中是甲基四氢叶酸等,而在古细菌中是甲基四氢蝶呤等(Diender M.et al.,Frontiers in Microbiology 2015,vol.6,article 1275)。
作为属于古细菌的上述厌氧性微生物的实例,可举出:属于热球菌属(Thermococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷球菌属(Methanococcus)、食甲基甲烷菌属(Methanomethylovorans)、甲烷线菌属(Methanothrix)、甲烷热杆菌属(Methanothermobacter)、Methanomethylophilus属、甲烷球形菌属(Methanosphaera)等的细菌(Diender M.et al.,Frontiers in Microbiology 2015,vol.6,article 1275;Borrel G.et al.,Genome Biol.Evol.2013,5(10),1769-1779)。在本发明中,例如,可以使用属于甲烷八叠球菌属(Methanosarcina)、甲烷球菌属(Methanococcus)或产甲烷热球菌属(Methanothermococcus)的古细菌。
<甲基营养菌>
甲基营养菌(Methylotroph)是以分子内不具有C-C键的碳化合物,例如甲烷、甲醇、甲胺、二甲胺、三甲胺等作为唯一的碳源和能源的C1化合物利用性微生物的总称。甲烷营养菌(Methanotroph)、甲烷氧化细菌、甲醇利用性细菌、甲醇利用性酵母、甲醇利用性微生物等微生物,全部都属于甲基营养菌。
甲基营养菌以将甲醇转化为甲醛,然后将甲醛转化为具有C-C键的有机物的反应作为中心代谢反应。作为经由甲醛的碳同化途径,已知有:丝氨酸途径、核酮糖单磷酸途径(RuMP途径)以及木酮糖单磷酸途径(XuMP途径)。被分类为细菌的甲基营养菌(甲基营养细菌)保有丝氨酸回路或RuMP途径。另一方面,被分类为酵母的甲基营养菌(甲基营养酵母)保有XuMP途径。
此外,甲基营养细菌中,基于甲醇需求性的差异,被分类为专性甲基营养菌(obligate methylotroph)和可以利用其他的碳化合物的兼性甲基营养菌(facultative methylotroph)。
本发明的重组细胞可以是甲基营养菌。例如,在本发明的重组细胞的一个实施方式中,本发明的重组细胞能够由选自甲烷、甲醇、甲胺、甲酸、甲醛以及甲酰胺中的至少一种C1化合物来生产异戊二烯或萜烯。此外,其具有选自丝氨酸途径、核酮糖单磷酸途径以及木酮糖单磷酸途径中的至少一种C1碳同化途径,作为甲醛的固定化途径。
作为能够用于本发明的甲基营养菌,例如可举出下述属于菌属的甲基营养菌:Methylacidphilum属、甲基弯曲菌属(Methylosinus)、甲基胞囊菌属(Methylocystis)、甲基杆菌属(Methylobacterium)、甲基胞菌属(Methylocella)、甲基球菌属(Methylococcus)、甲基单胞菌属(Methylomonas)、甲基杆状菌属(Methylobacter)、甲基小杆菌属(Methylobacillus)、嗜甲基菌属(Methylophilus)、甲基娇养杆菌属(Methylotenera)、食甲基菌属(Methylovorus)、甲基微菌属(Methylomicrobium)、噬甲基菌属(Methylophaga)、嗜甲基菌属(Methylophilaceae)、甲基营养菌属(Methyloversatilis)、分枝杆菌属(Mycobacterium)、节杆菌属(Arthrobacter)、芽孢杆菌属(Bacillus)、贝日阿托氏菌属(Beggiatoa)、伯克霍尔德氏菌属(Burkholderia)、颗粒杆菌属(Granulibacter)、生丝微菌属(Hyphomicrobium)、假单胞菌属(Pseudomonas)、无色小杆菌属(Achromobactor)、副球菌属(Paracoccus)、泉发菌属(Crenothrix)、Clonothrix属、红细菌属(Rhodobacter)、红环菌科属(Rhodocyclaceae)、硅杆菌属(Silicibacter)、硫微螺菌属(Thiomicrospira)、疣微菌属(Verrucomicrobia)等。
除细菌之外,具有MEP途径的还可举出:属于毕赤酵母属(Pichia)、假丝酵母菌属(Candida)、酵母菌属(Saccharomyces)、汉逊酵母属(Hansenula)、球拟酵母属(Torulopsis)、克勒克酵母属(Kloeckera)等的甲基营养酵母。作为毕赤酵母属(Pichia)酵母的实例,可举出:甲虫毕赤酵母(P.haplophila)、巴斯德毕赤酵母(P.pastoris)、喜海藻糖毕赤酵母(P.trehalophila)、P.lindnerii等。作为假丝酵母菌(Candida)属酵母的实例,可举出:近平滑假丝酵母(C.parapsilosis)、甲醇假丝酵母(C.methanolica)、博伊丁假丝酵母(C.boidinii)、C.alcomigas等。作为酵母菌属(Saccharomyces)酵母的实例,可举出:Saccharomyces metha-nonfoams等。作为汉逊酵母属(Hansenula)酵母的实例,可举出:H.wickerhamii、H.capsulata、H.glucozyma、H.henricii、H.minuta、H.nonfermentans、H.philodendra、H.polymorpha等。作为球拟酵母属(Torulopsis)酵母的实例,可举出:T.methanolovescens、光滑球拟酵母菌(T.glabrata)、T.nemodendra、T.pinus、T.methanofloat、T.enokii、T.menthanophiles、T.methanosorbosa、T.methanodomercqii等。
在优选的实施方式中,重组细胞属于Methylacidphilum属、甲基弯曲菌属(Methylosinus)、甲基胞囊菌属(Methylocystis)、甲基杆菌属(Methylobacterium)、甲基胞菌属(Methylocella)、甲基球菌属(Methylococcus)、甲基单胞菌属(Methylomonas)、甲基杆状菌属(Methylobacter)、甲基小杆菌属(Methylobacillus)、嗜甲基菌属(Methylophilus)、甲基娇养杆菌属(Methylotenera)、食甲基菌属(Methylovorus)、甲基微菌属(Methylomicrobium)、噬甲基菌属(Methylophaga)、嗜甲基菌属(Methylophilaceae)或甲基营养菌属(Methyloversatilis)。特别优选属于甲烷球形菌(Methanosphaera)、甲烷八叠球菌属(Methanosarcina)、甲烷叶菌属(Methanolobus)、甲烷类球菌属(Methanococcoides)、甲烷嗜盐菌(Methanohalophilus)、甲烷盐菌属(Methanohalobium)。
需要说明的是,在非甲基营养菌的宿主细胞中,通过导入经由甲醛的碳同化代谢途径(丝氨酸途径、RuMP途径、XuMP酸途径等),能够以与甲基营养菌相同的方式进行处理。就RuMP途径的导入而言,例如,可以通过导入3-己酮糖6磷酸合成酶(HPS;例如EC4.1.2.43)基因、6-磷酸-3-己烷苏洛异构酶(6-phospho-3-hexuloisomerase)(PHI;例如EC5.3.1.27)基因来实现。例如,通过导入丝氨酸羟甲基转移酶(例如EC 2.1.2.1)基因,可以实现丝氨酸途径的导入。像这样使非甲基营养菌甲基营养化的方法的详细内容,记载在例如国际公开第2014/104202号(专利文献4)中。
<第一外源基因>
在本发明中,具有异戊二烯合成酶基因作为外源基因(第一外源基因)的重组细胞能够生产异戊二烯。此外,具有单萜合成酶基因作为外源基因的重组细胞能够生产单萜(碳原子数为10的萜烯)。此外,具有倍半萜合成酶基因作为外源基因的重组细胞能够生产倍半萜(碳原子数为15的萜烯)。此外,具有二萜合成酶基因作为外源基因的重组细胞能够生产二萜(碳原子数为20的萜烯)。此外,具有角鲨烯合成酶基因作为外源基因的重组细胞能够生产三萜(碳原子数为30的萜烯)。此外,具有八氢番茄红素合成酶基因作为外源基因的重组细胞能够生产四萜(碳原子数为40的萜烯)。以下,对各酶以及基因按顺序进行说明。
<异戊二烯合成酶>
异戊二烯合成酶(isoprene synthase,IspS)具有将异戊烯二磷酸(IPP)的异构体即二甲基烯丙基二磷酸(dimethylallyl diphosphate(DMAPP))转化为异戊二烯的作用。需要说明的是,异戊烯基二磷酸和二甲基烯丙基二磷酸之间的结构转化由异戊烯二磷酸异构酶(isopentenyl diphosphate isomerase(IDI))催化。异戊烯二磷酸异构酶存在于所有生物体中。
用于本发明的异戊二烯合成酶(IspS)没有特别限制,例如可以使用源于植物等真核生物的异戊二烯合成酶。作为源于植物的异戊二烯合成酶,通常可举出源于黑杨、黧豆、野葛的异戊二烯合成酶,但不限于这些。作为异戊二烯合成酶的具体实例,可举出Q50L36、Q6EJ97、Q9AR86、Q7XAS7、A0PFK2、A0A0M4UQH9、A0A0M5MSL0(以上为UniProtKB entry)等。
序列编号1表示编码源于黑杨的异戊二烯合成酶(GenBank Accession No.:AM410988.1)的氨基酸序列。
关于本发明中使用的异戊二烯合成酶,除了在自然界中发现并且分离的异戊二烯合成酶之外,还可以是其改性体。例如,可以是现有的异戊二烯合成酶的部分片段或、是其氨基酸取代突变体并且具有异戊二烯合成酶活性的蛋白质。
例如,本发明中使用的异戊二烯合成酶中至少包含下述(a-1)、(a-2)或(a-3)的蛋白质:
(a-1)由序列编号1所示的氨基酸序列组成的蛋白质;
(a-2)由氨基酸序列组成并且具有异戊二烯合成酶活性的蛋白质,其中,所述氨基酸序列是在由序列编号1所示的氨基酸序列中缺失、取代或添加有1~20个氨基酸而成的。
(a-3)由氨基酸序列组成并且具有异戊二烯合成酶活性的蛋白质,其中,所述氨基酸序列与由序列编号1所示的氨基酸序列具有90%以上的同一性。
需要说明的是,(a-3)中的氨基酸序列的同一性更优选为92%以上,进一步优选为95%以上,特别优选为98%以上。
除异戊二烯合成酶基因外,实施方式中还可以具有编码异戊烯基二磷酸异构酶(IDI)的基因作为外源基因。通过导入IDI基因,增强了从IPP向DMAPP的转化,并且可以增强异戊二烯合成能力。这里使用的IDI没有特别限制,其实例可举出P61615、Q13907、Q46822、P50740、Q8TT35、P15496、Q10132、Q9KWG2(以上为UniProtKB entry)等。
<单帖合成酶>
单萜是碳原子数为10的萜烯,其由两个异戊二烯单元组成。单萜有非环状和环状的。非环状单萜包含香叶醇、月桂烯、柠檬醛、芳樟醇、橙花醇等。环状单萜包含柠檬烯、α-水芹烯、β-水芹烯、薄荷醇、百里香酚、α-蒎烯、β-蒎烯、蒈烯、香芹酮、桉叶素、樟脑等。
单萜合成酶是将香叶基二磷酸(GPP)或橙花基二磷酸(neryl diphosphate(NPP))转化为单萜的酶的总称。作为单萜的合成途径,可举出:通过GPP合成酶(GPP synthase(GPPS))或NPP合成酶(NPP synthase(NPPS))的作用,从异戊烯基二磷酸(IPP)出发,合成GPP或NPP。随后,通过单萜合成酶的作用,从GPP或NPP出发,合成单萜。
在优选的实施方式中,单萜合成酶是环状单萜合成酶。更优选的是,环状单萜合成酶是水芹烯合成酶,具体而言,是α-水芹烯合成酶或β-水芹烯合成酶。
作为α-水芹烯合成酶,可以使用任何酶,只要其具有从作为底物的GPP或NPP出发,生成α-水芹烯的活性即可。α-水芹烯合成酶的实例包含但不限于G5CV35、E5GAG2(以上为UniProtKB entry)、GN65-37361(SolCyc GeneID)等。
作为β-水芹烯合成酶,可以使用任何酶,只要其具有从作为底物的GPP或NPP出发,生成β-水芹烯的活性即可。β-水芹烯合成酶的实例包含但不限于Q9M7D1、C1K5M3、Q1XBU4、R9QMW3、R9QMR4、R9QMW7、E9N3U9、C0PTH8、F2XFA5、F2XFA1、F2XFA4、A0A0B0P314(以上为UniProtKB entry)等。
至于本发明中使用的单萜合成酶,除了在自然界中发现且分离的单萜合成酶外,还可以使用它们的变体。例如,可以为是现有单萜合成酶的部分片段或氨基酸取代突变体,并且具有单萜合成酶活性的蛋白质。
例如,本发明中使用的水芹烯合成酶(单萜合成酶的一个实例)至少包含下述(b-1)~(b-3)的蛋白质。
(b-1)由序列编号2所示的氨基酸序列组成的蛋白质;
(b-2)由氨基酸序列组成并且具有α-水芹烯合成酶活性的蛋白质,其中,所述氨基酸序列是在由序列编号2所示的氨基酸序列中缺失、取代或添加有1~20个氨基酸而成的。
(b-3)由氨基酸序列组成并且具有α-水芹烯合成酶活性的蛋白质,其中,所述氨基酸序列与由序列编号2所示的氨基酸序列具有90%以上的同一性。
需要说明的是,(b-3)中的氨基酸序列的同一性更优选为92%以上,进一步优选为95%以上,特别优选为98%以上。
此外,本发明中使用的水芹烯合成酶(单萜合成酶的一个实例)至少包含下述(c-1)~(c-3)的蛋白质。
(c-1)由序列编号3所示的氨基酸序列组成的蛋白质;
(c-2)由氨基酸序列组成并且具有β-水芹烯合成酶活性的蛋白质,其中,所述氨基酸序列是在由序列编号3所示的氨基酸序列中缺失、取代或添加有1~20个氨基酸而成的。
(c-3)由氨基酸序列组成并且具有β-水芹烯合成酶活性的蛋白质,其中,所述氨基酸序列与由序列编号3所示的氨基酸序列具有90%以上的同一性。
需要说明的是,(c-3)中的氨基酸序列的同一性更优选为92%以上,进一步优选为95%以上,特别优选为98%以上。
除了单萜合成酶基因外,实施方式中还可以具有编码异戊烯基二磷酸异构酶(IDI)作为外源基因的基因。通过导入IDI基因,可以增强从IPP向DMAPP的转化,并且增强GPP合成能力或NPP合成能力。其结果,可以提高单萜合成能力。
在优选的实施方式中,除了单萜合成酶基因等外,还具有编码GPP合成酶(GPPS)作为外源基因的基因或NPP合成酶(NPPS)基因。通过导入这些基因,可以增强从GPP或NPP出发的单萜合成能力。GPPS的实例包含S4S927、S4S8D9、D8LHY4、H6VLF6、H6VLF3、D8RV97、Q6V4K1、Q8LKJ3、Q8LKJ2、Q8LKJ1、Q9FSW8、H6VLF7、V5REB1、Q58GE8(以上为UniProtKB entry)。NPPS的实例包含源于番茄的NDPS1(Schilmiller AL et al.,PNAS 2009,106(26),10865-10870)等。
<倍半萜合成酶>
倍半萜是碳原子数为15的萜烯,其由三个异戊二烯单元组成。倍半萜有非环状、单环状、双环状以及三环状的。非环状倍半萜包含法呢烯、法呢醇等。单环状倍半萜包含zingiberene、Humulene、脱落酸等。双环状倍半萜包含Caryophyllene、Eudesman、Eremophilan、Valeran、Cadinan、Cadinene、Guajan、Driman、Cedrol、Nootkatone等。三环状倍半萜包含Illudan、Prezizaan、Marasman、Cedran、Thujopsan、Hirsutan等。
倍半萜合成酶是将法呢基二磷酸(FPP)转化为倍半萜的酶的总称。作为倍半萜的合成路线,可举出:通过GPP合成酶的作用,从IPP出发合成GPP。随后,通过FPP合成酶的作用,从GPP出发合成FPP。随后,通过倍半萜合成酶的作用,从FPP出发合成倍半萜。
在优选的实施方式中,倍半萜合成酶是环状倍半萜合成酶。在另一优选的实施方式中,倍半萜合成酶是法呢烯合成酶。
作为法呢烯合成酶,可以使用具有从作为底物的法呢基二磷酸(FPP)出发,生成法呢烯的活性的任何酶。法呢烯合成酶的实例包含:用于合成法呢烯的α体((3E,6E)-alpha-farnesene)的Q84LB2,B9RXW0、B2KSJ6、Q84KL5(以上为UniProtKB entry)等;用于合成法呢烯的β体((E)-beta-farnesene)的Q9FXY7、O48935、Q2NM15、C7E5V9、C7E5V7、Q94JS8、C7E5W0、C7E5V8(以上为UniProtKB entry)等,但不限于此。
关于本发明中使用的倍半萜合成酶,除了天然发现和分离的倍半萜合成酶外,还可以使用其变体。例如,可以为是现有倍半萜合成酶的部分片段或氨基酸取代突变体,并且具有倍半萜合成酶活性的蛋白质。
例如,本发明中使用的法呢烯合成酶(倍半合成酶)至少包含下述(d-1)~(d-3)的蛋白质。
(d-1)由序列编号4所示的氨基酸序列组成的蛋白质;
(d-2)由氨基酸序列组成并且具有法呢烯合成酶活性的蛋白质,其中,所述氨基酸序列是在由序列编号4所示的氨基酸序列中缺失、取代或添加有1~20个氨基酸而成的。
(d-3)由氨基酸序列组成并且具有法呢烯合成酶活性的蛋白质,其中,所述氨基酸序列与由序列编号4所示的氨基酸序列具有90%以上的同一性。
需要说明的是,(d-3)中的氨基酸序列的同一性更优选为92%以上,进一步优选为95%以上,特别优选为98%以上。
除了倍半萜合成酶基因外,实施方式中还可以具有编码IDI作为外源基因的基因。通过导入IDI基因,可以增强GPP合成能力。其结果,FPP合成能力增强,并且可以提高倍半萜合成能力。
在优选的实施方式中,除了倍半萜合成酶基因等之外,还具有编码GPP合成酶(GPPS)的基因和/或FPP合成酶(FPPS)基因作为外源基因。通过导入这些基因,增强了GPP和/或FPP的合成能力,其结果,可以提高倍半萜的合成能力。GPPS的实例包含上述例举的那些。FPPS的实例包含P08524、P09152、P49349、P14324、P05369、O014230(以上为UniProtKB entry)等。对于GPPS基因和FPPS基因,可以导入任一种,也可以导入这两种。
<二萜合成酶>
二萜是碳原子数为20的萜烯,其由四个异戊二烯单元组成。二萜有非环状、单环状、双环状以及三环状的。非环状二萜包含α-生育酚、视黄醇、植醇等。环状二萜包含Abietane、Abietic acid、Neoabietic acid、Levomaric acid、Sapietic acid、Atisane、Beyerane、Gibbane、Gibberellic acid、Kaurane、Steviol、Labdane、Picrasane、Pimarane、Podocarpane、Rosane、Taxane、视黄醛,视黄酸,视黄醇等。
二萜合成酶是将香叶基香叶基二磷酸(GGPP)转化为二萜的酶的总称。作为二萜的合成途径,可举出:通过GPP合成酶的作用,从IPP出发合成GPP。随后,通过FPP合成酶的作用,从GPP出发合成FPP。随后,通过GGPP合成酶(GGPPS)的作用,从FPP出发合成GGPP。随后,通过二萜合成酶的作用,从GGPP出发合成二萜。
作为二萜合成酶,可以使用具有从GGPP出发,生成二萜的活性的任何酶。二萜合成酶的实例包含但不限于Q38710、P9WJ61、G9MAN7、M4HY05、H8ZM70、M1VDX3、A2PZA5、Q675L5、Q0E088、P9WJ60、Q6Z5J6、M4HYP3(UniProtKB entry)等。
关于本发明中使用的二萜合成酶,除了天然发现和分离的二萜合成酶外,还可以使用其变体。例如,可以为是现有二萜合成酶的部分片段或氨基酸取代突变体,并且具有二萜合成酶活性的蛋白质。
除了二萜合成酶基因外,实施方式还可以具有编码IDI作为外源基因的基因。通过导入IDI基因,可以增强GPP合成能力。其结果,FPP合成能力和GPP合成能力增强,并且可以增强二萜合成能力。
在优选的实施方式中,除了二萜合成酶基因等外,还具有至少一种选自下述的基因作为外源基因:编码GPP合成酶(GPPS)的基因、编码FPP合成酶(FPPS)的基因以及编码GGPP合成酶(GGPPS)的基因。通过导入这些基因,GPP、FPP或GGPP的合成能力增强,其结果,可以增强二萜合成能力。GPPS和FPPS的实例包含上述的那些。GGPPS的实例包含Q12051、Q84J75、P34802、P80042、Q94ID7、Q9SLG2、Q9C446、Q54BK1、Q9LUE1、Q92236、Q39108、O95749、Q12051、Q9P885、P24322(UniProtKB entry)等。
对于GPPS基因、FPPS基因、GGPPS基因,可以导入任一种,也可以导入两种以上。
在优选的实施方式中,除了二萜合成酶基因等之外,还具有编码柯巴基二磷酸合成酶(CPPS)作为外源基因的基因。柯巴基二磷酸(Copalyl diphosphate(CPP))是碳原子数为20的GGPP衍生物。通过导入CPP合成酶基因,可以应对二萜合成酶底物为CPP的情况。CPPS的实例包含G8HZG6、O22667、A0A0N7I618、Q0Q2G7(UniProtKB entry)等。
<角鲨烯合成酶>
三萜是碳原子数为30的萜烯,其由六个异戊二烯单元组成。通常,通过FPP(C15)的二聚体化,生成作为非环状三萜的角鲨烯(Squalene)(C30)(由角鲨烯合成酶催化),从角鲨烯出发生成2,3-Oxidosqualene(2,3-epoxy-2,3-dihydroaqualene),经过2,3-Oxidosqualene的环化而生物合成200种以上的三萜骨架。然而,由于从角鲨烯出发生成2,3-Oxidosqualene是需氧的,因此通过作为厌氧古细菌的本发明的重组细胞而可以生产的三萜主要是,通过角鲨烯的环化生产的藿烯(Hopene)、藿烷醇(Hopanol)以及其衍生物即藿烷类(Hopanoid)化合物。
如上所述,角鲨烯合成酶(squalene synthase(SS))(EC 2.5.1.21)具有使FPP二聚体化的作用。在合成类胡萝卜素化合物的情况下,除角鲨烯合成酶基因外,至少还导入角鲨烯/藿烯环化酶(Squalene/Hopene cyclase)(EC 5.4.99.17)基因或角鲨烯/藿烷醇环化酶(Squalene/Hopanol cyclase)(EC 4.2.1.129)基因即可。通常,角鲨烯/藿烯环化酶也具有角鲨烯/藿烷醇环化酶活性。角鲨烯合成酶(SS)的实例包含P53799、P36596、P29704、P37268、P52020、Q9HGZ6、Q9Y753、Q9SDW9、P78589(UniProtKB entry)等。角鲨烯/藿烯环化酶(角鲨烯/藿烷醇环化酶)的实例包含P33247、P33990、P54924、P55348(UniProtKB entry)等。
通过导入除SS基因之外的IDI基因,可以增强角鲨烯合成能力。此外,通过导入香叶基二磷酸合成酶(GPPS)基因和/或法呢基二磷酸合成酶(FPPS)基因,可以增强合成角鲨烯的能力。GPPS和FPPS的实例包含上述例举的那些。
关于本发明中使用的角鲨烯合成酶,除了在自然界中发现和分离的角鲨烯合成酶之外,还可以使用其变体。例如,可以为是现有角鲨烯合成酶的部分片段或氨基酸取代突变体,并且具有角鲨烯合成酶活性的蛋白质。
<八氢番茄红素合成酶>
四萜是由八个异戊二烯单元组成并且碳原子数为40的萜烯,主要包含类胡萝卜素的化合物组。四萜中存在许多非环状或环状四萜。非环状四萜包含八氢番茄红素、番茄红素、链孢红素等。单环状四萜包含γ-胡萝卜素等。双环状四萜包含α-胡萝卜素、β-胡萝卜素、虾青素、抗青黄素、角黄素、辣椒红素、β-隐黄质、叶黄素、蓝溪藻黄素(myxoxanthophyll)、玉米黄质、岩藻黄质、紫罗兰红素、新黄质、毛莨黄素等。
八氢番茄红素合成酶(Phytoene synthase(PYS))(EC 2.5.1.32)具有使香叶基香叶基二磷酸(GGPP)二聚体化的作用。PYS的实例包含Q7Z859、Q9P854、P37272、Q67GH9、D5KXJ0、P21683、Q9UUQ6、P08196、B2ATB0、Q2U4X9、A2QM49、P37271、P37273、P49085、P54975、P9WHP3、P54977、P22872、P17056(UniProtKB entry)等。
通过导入除PSY基因之外的IDI基因,可以增强八氢番茄红素的合成能力。此外,通过导入选自GPP合成酶基因、FPP合成酶基因以及GGPP合成酶基因中的至少一种基因,可以增强八氢番茄红素的合成能力。GPPS、FPPS、GGPPS的实例包含上述例举的那些。
关于本发明中使用的八氢番茄红素合成酶,除了在自然界中发现和分离的八氢番茄红素合成酶之外,还可以使用其变体。例如,可以为是现有八氢番茄红素合成酶的部分片段或氨基酸取代突变体,并且具有八氢番茄红素合成酶活性的蛋白质。
如上所述,本发明的重组细胞具有异戊二烯合成酶基因、单萜合成酶基因、倍半萜合成酶基因、二萜合成酶基因、角鲨烯合成酶基因或八氢番茄红素合成酶基因作为外源基因。并且还可以任选具有IDI基因、GPPS基因、NPPS基因、GGPPS基因、CPPS基因、SS基因等。
<重组细胞的制备方法>
本发明的重组细胞可以例如使用具有通过非甲羟戊酸途径合成异戊烯二磷酸的能力的宿主细胞和编码异戊二烯合成酶或萜烯合成酶的基因来制备。例如,本发明的重组细胞可以通过包含下述工序(1)~(3)方法进行制备:
(1)第一工序,提供具有通过非甲羟戊酸途径合成异戊烯二磷酸的能力的宿主细胞;
(2)第二工序,使上述宿主细胞所具有的通过非甲羟戊酸途径合成异戊烯二磷酸的能力缺失;
(3)第三工序,向上述宿主细胞中导入编码异戊二烯合成酶的基因、编码单萜合成酶的基因、编码倍半萜合成酶的基因、编码二萜合成酶的基因、编码角鲨烯合成酶的基因或编码八氢番茄红素合成酶的基因,作为第一外源基因。
上述第一工序提供具有通过非甲羟戊酸途径(MEP途径)合成异戊烯二磷酸(IPP)的能力的宿主细胞。例如,制备细菌等通过MEP途径合成IPP的细胞作为宿主细胞。
在上述第二工序中,使宿主细胞所具有的通过非甲羟戊酸途径(MEP途径)合成异戊烯二磷酸(IPP)的能力缺失。例如,使选自DOXP合成酶、DOXP还原异构酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇合成酶、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇激酶、2-C-甲基-D-赤藓糖醇-2,4-环二磷酸合成酶、HMB-PP合成酶以及HMB-PP还原酶等作用于MEP途径的酶组中的至少一种内源性酶的活性缺失。如上所述,作为使酶的活性缺失的方法,例如可举出:使酶基因的一部分或全部缺失、在酶基因中产生突变(移码等)、在启动子或核糖体结合区域中产生突变等。作为突变处理的实例,可举出:通过放射线照射、变异剂(NTG、亚硝酸盐等)的处理等。需要说明的是,可以仅使一种上述酶活性缺失,或使多种上述酶活性缺失。
在优选的实施方式中,至少缺失DOXP还原异构酶和HMB-PP合成酶中的任意一种或两种。
在上述第三工序中,向上述宿主细胞中导入编码异戊二烯合成酶的基因、编码单萜合成酶的基因、编码倍半萜合成酶的基因、编码二萜合成酶的基因、编码角鲨烯合成酶的基因或编码八氢番茄红素合成酶的基因,作为第一外源基因。由此,获得缺乏通过内源性MEP途径合成异戊烯二磷酸的能力并且能生产异戊二烯或萜烯的重组细胞。需要说明的是,IPP的合成可以通过内源性MVA途径或另行导入的外源性MVA途径来进行。
需要说明的是,在本方法中,第二工序和第三工序的实施顺序并不重要。即,可以使内源性MEP途径的活性缺失后再导入第一外源基因,也可以在导入第一外源基因后再使内源性MEP途径的活性缺失。两个工序也可以同时进行。
在优选的实施方式中,除了上述(1)~(3)外,还包含以下工序(4):
(4)第四工序,向所述宿主细胞中导入编码选自下述酶组中的至少一种酶的基因作为第二外源基因,并赋予通过该甲羟戊酸途径合成异戊烯二磷酸的能力,所述酶组为在甲羟戊酸途径中起作用的酶组,即乙酰CoA乙酰转移酶、HMG-CoA合成酶、HMG-CoA还原酶、甲羟戊酸激酶、5-磷酸甲羟戊酸激酶以及二磷酸甲羟戊酸脱羧酶。
当宿主细胞不具有内源性甲羟戊酸途径(MVA途径)时,则基本上第四工序是必要的。导入的第二外源基因只要可以赋予通过MVA途径合成IPP的能力,则可以是上述任意一种酶基因或多种酶基因。
需要说明的是,在本方法中,尽管第二工序、第三工序、第四工序的实施顺序并不重要,但优选在第二工序之前进行第四工序。即,优选在导入第二外源基因后再使内源性MEP途径缺失。此外,第三工序和第四工序可以同时进行。例如,可以将第一外源基因和第二外源基因整合到一个载体中,并将该载体导入宿主细胞中,从而同时进行第三工序和第四工序。
<基因导入的方法>
作为向宿主细胞中导入基因的方法没有特别限制,可以根据宿主细胞的种类等适当选择。例如,可以使用能够导入宿主细胞并且能够表达被整合的基因的载体。例如,当宿主细胞是细菌等原核生物时,可以使用能够在宿主细胞中自主复制或能够被整合到染色体中,并且在可以转录所插入的上述基因的位置处含有启动子的载体作为该载体。例如,优选使用该载体在宿主细胞中构建包含启动子、核糖体结合序列、上述基因(DNA)、和转录终止序列的一系列构成。
当宿主细胞是梭菌属(Clostridium)细菌(包括穆尔氏菌属(Moorella)细菌这样的相关菌种)时,可以使用梭菌属(Clostridium)细菌和大肠杆菌的穿梭载体pIMP1(Mermelstein LD et al.,Bio/technology 1992,10,190-195)。该穿梭载体是pUC9(ATCC 37252)与从枯草芽孢杆菌(Bacillus subtilis)中分离的pIM13(Projan SJ et al.,J.Bacteriol.1987,169(11),5131-5139)形成的融合载体,并且稳定存在于梭菌属(Clostridium)细菌中。
需要说明的是,向梭菌属(Clostridium)细菌中导入基因时,虽然通常使用电穿孔法,但基因导入后的导入的外源质粒容易受到限制酶Cac824I等的降解,并且极其不稳定。因此,在保有携带了来源于枯草芽孢杆菌(Bacillus subtilis)噬菌体Φ3T1的甲基转移酶基因的pAN1(Mermelstein LD et al.,Apply.Environ.Microbiol.1993,59(4),1077-1081)的大肠杆菌,例如菌株ER2275等中,优选将来源于pIMP1的载体先进行扩增并进行甲基化处理,然后将其从大肠杆菌中回收并用于通过电穿孔的转化。需要说明的是,最近已经开发出缺失了Cac824I基因的丙酮丁醇梭菌(Clostridium acetobutylicum),还没有进行甲基化处理的载体也可以是稳定的(Dong H.et al.,PLoS ONE 2010,5(2),e9038)。
作为梭菌属(Clostridium)细菌中异源基因表达的启动子,例如可举出:thl(硫解酶(thiolase))启动子(Perret S et al.,J.Bacteriol.2004,186(1),253-257)、Dha(甘油脱水酶(glycerol dehydratase))启动子(Raynaud C.et al.,PNAS 2003,100(9),5010-5015)、ptb(磷酸丁酰转移酶(phosphotransbutyrylase))启动子(Desai RP et al.,Appl.Environ.Microbiol.1999,65(3),936-945)、adc(乙酰乙酸脱羧酶(acetoacetate decarboxylase))启动子(Lee J et al.,Appl.Environ.Microbiol.2012,78(5),1416-1423)。然而,在本发明中不限于此,可以使用在宿主细胞等中发现的各种代谢系统的操纵子中使用的启动子区域的序列。
对在宿主细胞是甲基营养细菌的情况进行说明时,作为整合到甲基营养细菌的染色体中的方法,可举出:在具有核酮糖单磷酸途径的鞭毛甲基小杆菌(Methylobacillus flagellatus)或具有丝氨酸途径的扭脱甲基杆菌(Methylobacterium extorquencs)中,通过目的基因的破坏操作的示例(Chistoserdova L.et al.,Microbiology 2000,146,233-238;Chistoserdov AY.,et al.,J.Bacteriol 1994,176,4052-4065)。这些是使用了环状DNA并且导入到基因组中的基因导入法,但是在嗜甲基菌属(Methylophilus)细菌中,也开发有使用了线性DNA并且导入到基因组中的基因导入法(日本特开第2004-229662号公报)。通常,当不易被宿主细胞降解时,通过线性DNA的基因组重组比通过环状DNA的基因组重组更有效率。此外,通常,同源重组法如反向重复序列(inverted-repeat sequence)等那样,优选以在基因组上存在多个拷贝的基因为靶点。此外,作为将多拷贝导入基因组的方法,除了同源重组外,还有搭载到转座子中的方法。作为通过质粒导入甲基营养细菌中的基因导入法,例如存在,广泛宿主区载体即pAYC32(Chistoserdov AY.,et al.,Plasmid 1986,16,161-167)、pRP301(Lane M.,et al.,Arch.Microbiol.1986,144(1),29-34)、pBBR1、pBHR1(Antoine R.et al.,Molecular Microbiology 1992,6,1785-1799)、pCM80(Marx CJ.et al.,Microbiology 2001,147,2065-2075)等
对宿主细胞是古细菌的情况进行说明时,在古细菌中的基因工程中,例如,可以使用以甲烷八叠球菌属(Methanosarcina)细菌中内在的质粒pC2A作为基质的大肠杆菌的穿梭载体(Sowers K.R.et al.,J.Bacteriol.1988,170,4979-4982;Metcalf W.W.et al.,PNAS 1997,94,2626-2631)。还存在通过同源重组进行基因导入、缺失的实例(Rother M.,et al.,J.Bacteriol 2005,187,5552-5559;Conway D.M.,J.Mol.Biol.1996,262,12-20),可以使用这些方法。作为表达系统,可以使用利用了四环素抗性基因表达的控制系统的诱导以及构成表达的方法(Guess A.M.et al.,Archaea 2008,2,193-203)等。
此外,当使用载体将多种基因导入宿主细胞时,各基因可以整合到一个载体中,也可以分别整合到不同的载体中。此外,在一个载体中整合多个基因时,各核酸可以在共通的启动子下表达,也可以分别在不同的启动子下表达。作为导入多种基因的实例,可举出:导入上述第一外源基因和第二外源基因的实施方式。
除了导入上述外源基因外,还可以通过实施突变或基因组重排(Genome shuffling)来培育异戊二烯或萜烯的生产性得到显著提高的菌株。
<异戊二烯或萜烯的生产方法>
本发明的异戊二烯或萜烯的生产方法中,上述重组细胞与选自一氧化碳、二氧化碳、甲酸、甲烷、甲醇、甲胺、甲醛以及甲酰胺中的至少一种C1化合物接触,在该重组细胞中由上述C1化合物生产异戊二烯或碳原子数为10、15、20、30或40的萜烯。典型的,使用选自一氧化碳、二氧化碳、甲酸、甲烷、甲醇、甲胺、甲醛以及甲酰胺中的至少一种C1化合物作为碳源对上述重组细胞进行培养,并从其培养物中得到异戊二烯或碳原子数为10、15、20、30或40的萜烯。
就用作碳源的上述C1化合物而言,可以仅使用一种,也可以组合两种以上使用。此外,优选使用这些C1化合物作为主要碳源,更优选为唯一的碳源。此外,优选同时提供氢(H2)作为能源。
作为培养本发明的重组细胞的方法没有特别限制,可以根据宿主细胞的种类等适当进行。当重组细胞是梭菌属(Clostridium)细菌(绝对厌氧性)时,例如,在包含生长必需的无机盐类以及合成气的营养条件下进行培养。优选在0.2~0.3MPa(绝对压)程度的压力状态下进行培养。此外,为了使初期增殖以及到达细胞密度良好,可以添加少量的维生素、酵母提取物、玉米浆、胰蛋白胨(Bacto Trypton)等有机物。
需要说明的是,当重组细胞是好氧性或兼性厌氧性的时,例如可以进行使用了液体培养基的通气·搅拌培养。
可以向上述重组细胞提供以一氧化碳和氢作为主要成分的气体或者以二氧化碳和氢作为主要成分的气体。即,将这些气体用作碳源并培养重组细胞,或者使这些气体与重组细胞接触,由气体中的一氧化碳或二氧化碳生产异戊二烯或萜烯。这时,氢也被用作能源。
也可以向重组细胞提供甲酸以及/或甲醇,由甲酸以及/或甲醇生产异戊二烯或萜烯。即,除了一氧化碳或二氧化碳以外,可以单独使用甲酸或甲醇作为碳源并培养重组细胞,或者使甲酸或甲醇与重组细胞接触,从而由甲酸或甲醇生产异戊二烯或萜烯。
也可以在不进行培养的情况下进行异戊二烯或萜烯的生产。即,无论是否伴随细胞分裂(细胞增殖),都可以使上述C1化合物与重组细胞接触,以生产异戊二烯或萜烯。例如,将上述C1化合物连续供给到固定化了的重组细胞,可以连续地生产异戊二烯或萜烯。同样在该实施方式中,就这些碳源即C1化合物而言,可以仅使用一种,也可以组合两种以上使用。此外,优选同时与作为能源的氢(H2)接触。
生产的异戊二烯或萜烯,例如可以从细胞外即培养液或气相馏分中回收。
在下文中,将通过实施例对本发明进行更具体的说明,但是本发明不限于这些实施例。
[实施例1]
在该实施例中,通过一种合成气利用性细菌即李氏梭菌(Clostridium ljungdahlii)的重组细胞以及缺失了MEP途径的重组细胞,对异戊二烯的生产量进行比较。
(1)各种载体的构建
参照Appl Biochem Biotechnol(2012)168:1384–1393,制备pUC-Δdxr-ermC(序列编号5),其包含:李氏梭菌(C.ljungdahlii)的DOXP还原异构酶基因dxr(CLJU_c13080)的上游序列、红霉素抗性基因(来源于金黄色葡萄球菌(Staphylococcus aureus)的ermC基因,序列编号5,GenBank Accession No.:KX011076)以及李氏梭菌(C.ljungdahlii)的DOXP还原异构酶基因dxr的下游序列。pUC-Δdxr-ermC的构成如图1所示。在该图中,dxr upstream表示DOXP还原异构酶基因的上游序列,dxr downstream表示DOXP还原异构酶基因的下游序列,ermC表示红霉素抗性基因,AmpR表示氨苄青霉素抗性基因。
对梭菌(Clostridium)/大肠杆菌(E.Coli)二元载体即pJIR750ai(Sigma-Aldrich公司)进行改变,构建pSK1(LbMVA-ISPS)(序列编号10),其包含:来源于乳酸杆菌的甲羟戊酸途径的基因簇(来源于约氏乳杆菌(Lactobacillus johnsonii)NCC 533,序列编号7、序列编号8,GenBank Accession No.:AE017198.1)、异戊二烯合成酶基因(来源于黑杨IspS基因,序列编号9,GenBank Accession No.:AM410988.1)、氯霉素抗性基因(来源于pJIR750ai)的,密码子改变了的核苷酸序列。
pSK1(LbMVA-ISPS)的构成如图2所示。图中,MvaE表示乙酰CoA乙酰转移酶基因,HMGCR表示HMG-CoA还原酶基因,HMGCS表示HMG-CoA合成酶基因,MVK表示甲羟戊酸激酶基因,MVD表示二磷酸甲羟戊酸脱羧酶基因,PMVK表示磷酸甲羟戊酸激酶基因,IDI表示异戊烯二磷酸异构酶基因。此外,IspS populus表示来源于黑杨的异戊二烯合成酶的序列(用于梭菌(Clostridium)中改变部分密码子),GroEL SD表示李氏梭菌(C.ljungdahlii)的chaperonin GroEL基因的上游的SD序列,thl promoter表示丙酮丁醇梭菌(Clostridium acetobutylicum)的硫解酶启动子。此外,pMB1表示大肠杆菌的ori,CatP表示氯霉素抗性基因,rep origin表示梭菌(Clostridium)的复制起点,pIP404replication enzyme表示梭菌(Clostridium)的复制酶。
(2)向DSM13528/ATCC55383菌株导入基因
使用Leang C.et al.,Appl Environ Microbiol.2013 79(4),1102-9中记载的方法,通过电穿孔法向DSM13528/ATCC55383菌株中导入pSK1(LbMVA-ISPS)。通过在含有5μg/mL甲砜霉素的ATCC1754琼脂培养基(含果糖,1.5%琼脂)中进行筛选,获得异戊二烯生产菌株SK1。SK1菌株同时具有内源性MEP途径和外源性MVA途径这两种途径。
(3)缺失MEP途径(dxr基因敲除)的梭菌(Clostridium)菌株的制备
使用Leang C.et al.,Appl Environ Microbiol.2013 79(4),1102-9推荐的方法,向SK1菌株中导入pUC-Δdxr-Cat。在分别含有4μg/mL克拉霉素以及5μg/mL甲砜霉素的ATCC1754琼脂培养基(1.5%琼脂)中进行筛选,并通过同源重组使dxr缺失。由此,制备了缺失了内源性MEP途径并且依赖于外源性MVA途径而生长的异戊二烯生产菌株SK2。
(4)异戊二烯的定量
将SK1菌株和SK2菌株分别在37℃的厌氧条件下进行培养。接种到5ml的含有5μg/mL甲砜霉素的ATCC1754培养基中(其中,pH=5.0,不含果糖),将CO/CO2/H2=33/33/34%(体积比)的混合气体导入27mL体积的可密封的顶空小瓶容器中,在0.25MPa(绝对压)的气压下进行填充,用铝盖密封后振荡培养。当观察到增殖液的OD600达到1.0时终止培养,并通过气相色谱质谱仪(GCMS-QP2010Ultra,岛津制作所公司)来分析气相。
其结果,对于SK1菌株、SK2菌株,以平均10mg异戊二烯/干燥菌体(g)的生产量检测出异戊二烯。
从上文可知,缺失了内源性MEP途径但具有外源性MVA途径功能的李氏梭菌(Clostridium ljungdahlii)的重组细胞,能够与具有内源性MEP途径和外源性MVA途径这两者的重组细胞同等地生产异戊二烯。即,无论是否具有内源性MEP途径,通过外源性MVA途径都能生产同等的异戊二烯。
[实施例2]
在本实施例中,使用实施例1中制备的SK1菌株以及SK2菌株,研究各菌株中异戊二烯生产的稳定性。
(1)重组细胞的传代培养实验
对于各SK1菌株以及SK2菌株,将5个克隆各自接种到5mL的含有5μg/mL的甲砜霉素的ATCC1754培养基中(其中,pH=5.0,不含果糖),将CO/CO2/H2=33/33/34%(体积比)的混合气体导入27mL体积的可密封的顶空小瓶容器中,在0.25MPa(绝对压)的气压下进行填充,用铝盖密封后,振荡培养。当OD600达到1.0时,将各菌株重新接种在新的ATCC1754培养基中(传代培养)。当该传代培养的工序重复20次时,证实了所有的克隆在第20次传代培养后也能增殖。
(2)质粒稳定性和异戊二烯生产性
参照Isolation of Plasmid DNA from Bacillus subtilis using the QIAprep Spin Miniprep Kit-(EN),从SK1菌株以及SK2菌株的各克隆中,使用QIAprep Spin Miniprep Kit(QIAGEN公司),从各菌体中提取质粒pSK1(LbMVA-ISPS)。将提取出的DNA转化到E.coli JM109(Takara Bio公司)中,在获得的菌落中,使用QIAprep Spin Miniprep Kit分别从10个菌落中再次进行质粒提取。使用Applied Biosystems 3130遗传分析仪(Applied Biosystems公司)分析获得的质粒的核苷酸序列。
其结果,认为在来源于SK1菌株的各克隆的质粒中,在甲羟戊酸途径基因簇序列中发生有至少一个以上的突变,并且缺失了MVA途径的功能。需要说明的是,未发现抗药性基因序列的突变。另一方面,在来源于SK2菌株的各克隆的质粒中,在甲羟戊酸途径基因簇序列中以及抗药性基因序列中均未发现突变,并且MVA基因簇在20次传代后也保持正常。
此外,对于SK1菌株以及SK2菌株的20次传代培养后的小瓶的气相,通过气相色谱质谱仪(GCMS-QP2010 Ultra)进行分析。结果,在SK1菌株中,所有克隆中异戊二烯的生产量都在气相色谱质谱仪的检测限以下。另一方面,在SK2菌株中,在所有克隆中检测出平均10mg异戊二烯/干燥菌体(g)的生产量的异戊二烯。
根据上述内容,将合成异戊二烯的前体(IPP)的外源性甲羟戊酸途径导入到宿主细胞中,同时敲除宿主的内源性非甲羟戊酸途径基因,从而可以制备只有外源性甲羟戊酸途径作为IPP的合成途径起作用的重组细胞。并且,显示了,导入了异戊二烯合成酶基因的该重组细胞可以稳定地维持外源性甲羟戊酸途径的功能,并且可以稳定且连续地生产异戊二烯。
序列表
<110> 积水化学工业株式会社
<120> 重组细胞、重组细胞的制备方法以及异戊二烯或萜烯的生产方法
<130> 17P01386
<150> JP 2017-034566
<151> 2017-02-27
<160> 10
<170> PatentIn version 3.1
<210> 1
<211> 595
<212> PRT
<213> 银灰杨
<400> 1
Met Ala Thr Glu Leu Leu Cys Leu His Arg Pro Ile Ser Leu Thr His
1 5 10 15
Lys Leu Phe Arg Asn Pro Leu Pro Lys Val Ile Gln Ala Thr Pro Leu
20 25 30
Thr Leu Lys Leu Arg Cys Ser Val Ser Thr Glu Asn Val Ser Phe Thr
35 40 45
Glu Thr Glu Thr Glu Ala Arg Arg Ser Ala Asn Tyr Glu Pro Asn Ser
50 55 60
Trp Asp Tyr Asp Phe Leu Leu Ser Ser Asp Thr Asp Glu Ser Ile Glu
65 70 75 80
Val Tyr Lys Asp Lys Ala Lys Lys Leu Glu Ala Glu Val Arg Arg Glu
85 90 95
Ile Asn Asn Glu Lys Ala Glu Phe Leu Thr Leu Leu Glu Leu Ile Asp
100 105 110
Asn Val Gln Arg Leu Gly Leu Gly Tyr Arg Phe Glu Ser Asp Ile Arg
115 120 125
Arg Ala Leu Asp Arg Phe Val Ser Ser Gly Gly Phe Asp Gly Val Thr
130 135 140
Lys Thr Ser Leu His Ala Thr Ala Leu Ser Phe Arg Leu Leu Arg Gln
145 150 155 160
His Gly Phe Glu Val Ser Gln Glu Ala Phe Ser Gly Phe Lys Asp Gln
165 170 175
Asn Gly Asn Phe Leu Glu Asn Leu Lys Glu Asp Thr Lys Ala Ile Leu
180 185 190
Ser Leu Tyr Glu Ala Ser Phe Leu Ala Leu Glu Gly Glu Asn Ile Leu
195 200 205
Asp Glu Ala Arg Val Phe Ala Ile Ser His Leu Lys Glu Leu Ser Glu
210 215 220
Glu Lys Ile Gly Lys Glu Leu Ala Glu Gln Val Asn His Ala Leu Glu
225 230 235 240
Leu Pro Leu His Arg Arg Thr Gln Arg Leu Glu Ala Val Trp Ser Ile
245 250 255
Glu Ala Tyr Arg Lys Lys Glu Asp Ala Asn Gln Val Leu Leu Glu Leu
260 265 270
Ala Ile Leu Asp Tyr Asn Met Ile Gln Ser Val Tyr Gln Arg Asp Leu
275 280 285
Arg Glu Thr Ser Arg Trp Trp Arg Arg Val Gly Leu Ala Thr Lys Leu
290 295 300
His Phe Ala Lys Asp Arg Leu Ile Glu Ser Phe Tyr Trp Ala Val Gly
305 310 315 320
Val Ala Phe Glu Pro Gln Tyr Ser Asp Cys Arg Asn Ser Val Ala Lys
325 330 335
Met Phe Ser Phe Val Thr Ile Ile Asp Asp Ile Tyr Asp Val Tyr Gly
340 345 350
Thr Leu Asp Glu Leu Glu Leu Phe Thr Asp Ala Val Glu Arg Trp Asp
355 360 365
Val Asn Ala Ile Asn Asp Leu Pro Asp Tyr Met Lys Leu Cys Phe Leu
370 375 380
Ala Leu Tyr Asn Thr Ile Asn Glu Ile Ala Tyr Asp Asn Leu Lys Asp
385 390 395 400
Lys Gly Glu Asn Ile Leu Pro Tyr Leu Thr Lys Ala Trp Ala Asp Leu
405 410 415
Cys Asn Ala Phe Leu Gln Glu Ala Lys Trp Leu Tyr Asn Lys Ser Thr
420 425 430
Pro Thr Phe Asp Asp Tyr Phe Gly Asn Ala Trp Lys Ser Ser Ser Gly
435 440 445
Pro Leu Gln Leu Ile Phe Ala Tyr Phe Ala Val Val Gln Asn Ile Lys
450 455 460
Lys Glu Glu Ile Glu Asn Leu Gln Lys Tyr His Asp Ile Ile Ser Arg
465 470 475 480
Pro Ser His Ile Phe Arg Leu Cys Asn Asp Leu Ala Ser Ala Ser Ala
485 490 495
Glu Ile Ala Arg Gly Glu Thr Ala Asn Ser Val Ser Cys Tyr Met Arg
500 505 510
Thr Lys Gly Ile Ser Glu Glu Leu Ala Thr Glu Ser Val Met Asn Leu
515 520 525
Ile Asp Glu Thr Cys Lys Lys Met Asn Lys Glu Lys Leu Gly Gly Ser
530 535 540
Leu Phe Ala Lys Pro Phe Val Glu Thr Ala Ile Asn Leu Ala Arg Gln
545 550 555 560
Ser His Cys Thr Tyr His Asn Gly Asp Ala His Thr Ser Pro Asp Glu
565 570 575
Leu Thr Arg Lys Arg Val Leu Ser Val Ile Thr Glu Pro Ile Leu Pro
580 585 590
Phe Glu Arg
595
<210> 2
<211> 778
<212> PRT
<213> 潘那利番茄
<400> 2
Met Ile Val Gly Tyr Arg Ser Thr Ile Ile Thr Leu Ser His Pro Lys
1 5 10 15
Leu Gly Asn Gly Lys Thr Ile Ser Ser Asn Ala Ile Phe Gln Arg Ser
20 25 30
Cys Arg Val Arg Cys Ser His Ser Thr Thr Ser Ser Met Asn Gly Phe
35 40 45
Glu Asp Ala Arg Asp Arg Ile Arg Glu Ser Phe Gly Lys Leu Glu Leu
50 55 60
Ser Pro Ser Ser Tyr Asp Thr Ala Trp Val Ala Met Val Pro Ser Lys
65 70 75 80
His Ser Leu Asn Glu Pro Cys Phe Pro Gln Cys Leu Asp Trp Ile Ile
85 90 95
Glu Asn Gln Arg Glu Asp Gly Ser Trp Gly Leu Asn Pro Thr His Pro
100 105 110
Leu Leu Leu Lys Asp Ser Leu Ser Ser Thr Leu Ala Cys Leu Leu Ala
115 120 125
Leu Thr Lys Trp Arg Val Gly Asp Glu Gln Ile Lys Arg Gly Leu Gly
130 135 140
Phe Ile Glu Thr Tyr Gly Trp Ala Val Asp Asn Lys Asp Gln Ile Ser
145 150 155 160
Pro Leu Gly Phe Glu Val Ile Phe Ser Ser Met Ile Lys Ser Ala Glu
165 170 175
Lys Leu Asp Leu Asn Leu Pro Leu Asn Leu His Leu Val Asn Leu Val
180 185 190
Asn Cys Lys Arg Asp Ser Thr Ile Lys Arg Asn Val Glu Tyr Met Gly
195 200 205
Glu Gly Val Gly Glu Leu Cys Asp Trp Lys Glu Ile Ile Lys Leu His
210 215 220
Gln Arg Gln Asn Gly Ser Leu Phe Asp Ser Pro Ala Thr Thr Ala Ala
225 230 235 240
Ala Leu Ile Tyr His Gln His Asp Gln Lys Cys Asn Gln Tyr Leu Asn
245 250 255
Ser Ile Leu Lys Gln His Lys Asn Trp Val Pro Thr Met Tyr Pro Thr
260 265 270
Lys Ile His Ser Leu Leu Cys Leu Val Asp Thr Leu Gln Asn Leu Gly
275 280 285
Val His Arg His Phe Lys Ser Glu Ile Lys Lys Ala Leu Asp Glu Ile
290 295 300
Tyr Arg Leu Trp Gln Gln Lys Asn Glu Gln Ile Phe Ser Asn Val Thr
305 310 315 320
His Cys Ala Met Ala Phe Arg Leu Leu Arg Met Ser Tyr Tyr Asp Val
325 330 335
Ser Ser Asp Glu Leu Ala Glu Phe Val Asp Glu Glu His Phe Phe Thr
340 345 350
Thr Ser Gly Lys Tyr Thr Ser His Val Glu Ile Leu Glu Leu His Lys
355 360 365
Ala Ser Gln Leu Ala Ile Asp His Glu Lys Asp Asp Ile Leu Asp Lys
370 375 380
Ile Asn Asn Trp Thr Arg Thr Phe Met Glu Gln Lys Leu Leu Asn Asn
385 390 395 400
Gly Phe Ile Asp Arg Met Ser Lys Lys Glu Val Glu Leu Ala Leu Lys
405 410 415
Lys Phe Tyr Thr Thr Ser Asp Leu Ala Glu Asn Arg Arg Tyr Ile Lys
420 425 430
Ser Tyr Glu Glu Asn Asn Phe Lys Ile Leu Lys Ala Ala Tyr Arg Ser
435 440 445
Pro Asn Ile Asn Asn Lys Asp Leu Leu Ala Phe Ser Ile His Glu Phe
450 455 460
Glu Leu Cys Gln Ala Gln His Arg Glu Glu Leu Gln Gln Leu Arg Arg
465 470 475 480
Trp Phe Glu Asp Tyr Arg Leu Asp Gln Leu Gly Leu Ala Glu Arg Tyr
485 490 495
Ile His Ala Thr Tyr Leu Phe Gly Val Thr Ile Ile Pro Glu Pro Glu
500 505 510
Leu Ser Asp Ala Arg Leu Met Asn Ala Lys Tyr Ile Met Leu Leu Thr
515 520 525
Ile Val Asp Glu Tyr Phe Glu Ser Phe Ala Ser Lys Asp Glu Cys Leu
530 535 540
Asn Ile Ile Glu Leu Val Glu Arg Trp Asp Asp Tyr Ala Ser Val Gly
545 550 555 560
Tyr Lys Ser Glu Lys Val Lys Val Phe Phe Ser Thr Phe Tyr Lys Ser
565 570 575
Ile Glu Glu Leu Ala Thr Ile Ala Glu Ile Lys Gln Gly Arg Ser Val
580 585 590
Lys Asn His Leu Ile Asn Leu Trp Leu Glu Val Met Lys Leu Met Leu
595 600 605
Met Glu Gln Val Glu Trp Trp Thr Ser Lys Thr Ile Pro Ser Ile Glu
610 615 620
Glu Tyr Leu Cys Val Thr Ser Ile Thr Phe Gly Ser Arg Leu Leu Leu
625 630 635 640
Leu Thr Ile Gln Tyr Phe Leu Gly Ile Lys Ile Ser Lys Asp Leu Leu
645 650 655
Glu Ser Asp Glu Ile Cys Gly Leu Cys Asn Cys Thr Gly Arg Val Met
660 665 670
Arg Ile Leu Asn Asp Leu Gln Asp Ser Lys Arg Glu Gln Lys Gly Val
675 680 685
Ser Ile Asn Leu Val Thr Leu Leu Met Lys Ser Ile Ser Glu Glu Glu
690 695 700
Ala Ile Met Lys Met Lys Glu Ile Leu Glu Met Asn Arg Arg Glu Leu
705 710 715 720
Leu Lys Met Val Leu Val Gln Lys Lys Gly Ser Gln Leu Pro Gln Leu
725 730 735
Cys Lys Asp Ile Phe Trp Arg Thr Ser Lys Trp Thr His Phe Thr Tyr
740 745 750
Ser Gln Thr Asp Gly Phe Arg Ile Glu Glu Glu Met Lys Asn His Ile
755 760 765
Asp Glu Val Phe Tyr Lys Pro Leu Asn His
770 775
<210> 3
<211> 630
<212> PRT
<213> 北美冷杉
<400> 3
Met Ala Leu Val Ser Ser Ala Pro Lys Ser Cys Leu His Lys Ser Leu
1 5 10 15
Ile Arg Ser Thr His His Glu Leu Lys Pro Leu Arg Arg Thr Ile Pro
20 25 30
Thr Leu Gly Met Cys Arg Arg Gly Lys Ser Phe Thr Pro Ser Val Ser
35 40 45
Met Ser Leu Thr Thr Ala Val Ser Asp Asp Gly Leu Gln Arg Arg Ile
50 55 60
Gly Asp Tyr His Ser Asn Leu Trp Asp Asp Asp Phe Ile Gln Ser Leu
65 70 75 80
Ser Thr Pro Tyr Gly Glu Pro Ser Tyr Arg Glu Arg Ala Glu Lys Leu
85 90 95
Ile Gly Glu Val Lys Glu Met Phe Asn Ser Met Pro Ser Glu Asp Gly
100 105 110
Glu Ser Met Ser Pro Leu Asn Asp Leu Ile Glu Arg Leu Trp Met Val
115 120 125
Asp Ser Val Glu Arg Leu Gly Ile Asp Arg His Phe Lys Lys Glu Ile
130 135 140
Lys Ser Ala Leu Asp Tyr Val Tyr Ser Tyr Trp Asn Glu Lys Gly Ile
145 150 155 160
Gly Cys Gly Arg Asp Ser Val Phe Pro Asp Val Asn Ser Thr Ala Ser
165 170 175
Gly Phe Arg Thr Leu Arg Leu His Gly Tyr Ser Val Ser Ser Glu Val
180 185 190
Leu Lys Val Phe Gln Asp Gln Asn Gly Gln Phe Ala Phe Ser Pro Ser
195 200 205
Thr Lys Glu Arg Asp Ile Arg Thr Val Leu Asn Leu Tyr Arg Ala Ser
210 215 220
Phe Ile Ala Phe Pro Gly Glu Lys Val Met Glu Glu Ala Glu Ile Phe
225 230 235 240
Ser Ser Arg Tyr Leu Lys Glu Ala Val Gln Lys Ile Pro Val Ser Ser
245 250 255
Leu Ser Gln Glu Ile Asp Tyr Thr Leu Glu Tyr Gly Trp His Thr Asn
260 265 270
Met Pro Arg Leu Glu Thr Arg Asn Tyr Leu Asp Val Phe Gly His Pro
275 280 285
Thr Ser Pro Trp Leu Lys Lys Lys Arg Thr Gln Tyr Leu Asp Ser Glu
290 295 300
Lys Leu Leu Glu Leu Ala Lys Leu Glu Phe Asn Ile Phe His Ser Leu
305 310 315 320
Gln Gln Lys Glu Leu Gln Tyr Leu Ser Arg Trp Trp Ile His Ser Gly
325 330 335
Leu Pro Glu Leu Thr Phe Gly Arg His Arg His Val Glu Tyr Tyr Thr
340 345 350
Leu Ser Ser Cys Ile Ala Thr Glu Pro Lys His Ser Ala Phe Arg Leu
355 360 365
Gly Phe Ala Lys Thr Cys His Leu Ile Thr Val Leu Asp Asp Ile Tyr
370 375 380
Asp Thr Phe Gly Thr Met Asp Glu Ile Glu Leu Phe Asn Glu Ala Val
385 390 395 400
Arg Arg Trp Asn Pro Ser Glu Lys Glu Arg Leu Pro Glu Tyr Met Lys
405 410 415
Glu Ile Tyr Met Ala Leu Tyr Glu Ala Leu Thr Asp Met Ala Arg Glu
420 425 430
Ala Glu Lys Thr Gln Gly Arg Asp Thr Leu Asn Tyr Ala Arg Lys Ala
435 440 445
Trp Glu Val Tyr Leu Asp Ser Tyr Thr Gln Glu Ala Lys Trp Ile Ala
450 455 460
Ser Gly Tyr Leu Pro Thr Phe Glu Glu Tyr Leu Glu Asn Ala Lys Val
465 470 475 480
Ser Ser Gly His Arg Ala Ala Ala Leu Thr Pro Leu Leu Thr Leu Asp
485 490 495
Val Pro Leu Pro Asp Asp Val Leu Lys Gly Ile Asp Phe Pro Ser Arg
500 505 510
Phe Asn Asp Leu Ala Ser Ser Phe Leu Arg Leu Arg Gly Asp Thr Arg
515 520 525
Cys Tyr Lys Ala Asp Arg Asp Arg Gly Glu Glu Ala Ser Ser Ile Ser
530 535 540
Cys Tyr Met Lys Asp Asn Pro Gly Leu Thr Glu Glu Asp Ala Leu Asn
545 550 555 560
His Ile Asn Ala Met Ile Asn Asp Ile Ile Lys Glu Leu Asn Trp Glu
565 570 575
Leu Leu Lys Pro Asp Ser Asn Ile Pro Met Thr Ala Arg Lys His Ala
580 585 590
Tyr Glu Ile Thr Arg Ala Phe His Gln Leu Tyr Lys Tyr Arg Asp Gly
595 600 605
Phe Ser Val Ala Thr Gln Glu Thr Lys Ser Leu Val Arg Arg Thr Val
610 615 620
Leu Glu Pro Val Pro Leu
625 630
<210> 4
<211> 574
<212> PRT
<213> 黄花蒿
<400> 4
Met Ser Thr Leu Pro Ile Ser Ser Val Ser Phe Ser Ser Ser Thr Ser
1 5 10 15
Pro Leu Val Val Asp Asp Lys Val Ser Thr Lys Pro Asp Val Ile Arg
20 25 30
His Thr Met Asn Phe Asn Ala Ser Ile Trp Gly Asp Gln Phe Leu Thr
35 40 45
Tyr Asp Glu Pro Glu Asp Leu Val Met Lys Lys Gln Leu Val Glu Glu
50 55 60
Leu Lys Glu Glu Val Lys Lys Glu Leu Ile Thr Ile Lys Gly Ser Asn
65 70 75 80
Glu Pro Met Gln His Val Lys Leu Ile Glu Leu Ile Asp Ala Val Gln
85 90 95
Arg Leu Gly Ile Ala Tyr His Phe Glu Glu Glu Ile Glu Glu Ala Leu
100 105 110
Gln His Ile His Val Thr Tyr Gly Glu Gln Trp Val Asp Lys Glu Asn
115 120 125
Leu Gln Ser Ile Ser Leu Trp Phe Arg Leu Leu Arg Gln Gln Gly Phe
130 135 140
Asn Val Ser Ser Gly Val Phe Lys Asp Phe Met Asp Glu Lys Gly Lys
145 150 155 160
Phe Lys Glu Ser Leu Cys Asn Asp Ala Gln Gly Ile Leu Ala Leu Tyr
165 170 175
Glu Ala Ala Phe Met Arg Val Glu Asp Glu Thr Ile Leu Asp Asn Ala
180 185 190
Leu Glu Phe Thr Lys Val His Leu Asp Ile Ile Ala Lys Asp Pro Ser
195 200 205
Cys Asp Ser Ser Leu Arg Thr Gln Ile His Gln Ala Leu Lys Gln Pro
210 215 220
Leu Arg Arg Arg Leu Ala Arg Ile Glu Ala Leu His Tyr Met Pro Ile
225 230 235 240
Tyr Gln Gln Glu Thr Ser His Asp Glu Val Leu Leu Lys Leu Ala Lys
245 250 255
Leu Asp Phe Ser Val Leu Gln Ser Met His Lys Lys Glu Leu Ser His
260 265 270
Ile Cys Lys Trp Trp Lys Asp Leu Asp Leu Gln Asn Lys Leu Pro Tyr
275 280 285
Val Arg Asp Arg Val Val Glu Gly Tyr Phe Trp Ile Leu Ser Ile Tyr
290 295 300
Tyr Glu Pro Gln His Ala Arg Thr Arg Met Phe Leu Met Lys Thr Cys
305 310 315 320
Met Trp Leu Val Val Leu Asp Asp Thr Phe Asp Asn Tyr Gly Thr Tyr
325 330 335
Glu Glu Leu Glu Ile Phe Thr Gln Ala Val Glu Arg Trp Ser Ile Ser
340 345 350
Cys Leu Asp Met Leu Pro Glu Tyr Met Lys Leu Ile Tyr Gln Glu Leu
355 360 365
Val Asn Leu His Val Glu Met Glu Glu Ser Leu Glu Lys Glu Gly Lys
370 375 380
Thr Tyr Gln Ile His Tyr Val Lys Glu Met Ala Lys Glu Leu Val Arg
385 390 395 400
Asn Tyr Leu Val Glu Ala Arg Trp Leu Lys Glu Gly Tyr Met Pro Thr
405 410 415
Leu Glu Glu Tyr Met Ser Val Ser Met Val Thr Gly Thr Tyr Gly Leu
420 425 430
Met Ile Ala Arg Ser Tyr Val Gly Arg Gly Asp Ile Val Thr Glu Asp
435 440 445
Thr Phe Lys Trp Val Ser Ser Tyr Pro Pro Ile Ile Lys Ala Ser Cys
450 455 460
Val Ile Val Arg Leu Met Asp Asp Ile Val Ser His Lys Glu Glu Gln
465 470 475 480
Glu Arg Gly His Val Ala Ser Ser Ile Glu Cys Tyr Ser Lys Glu Ser
485 490 495
Gly Ala Ser Glu Glu Glu Ala Cys Glu Tyr Ile Ser Arg Lys Val Glu
500 505 510
Asp Ala Trp Lys Val Ile Asn Arg Glu Ser Leu Arg Pro Thr Ala Val
515 520 525
Pro Phe Pro Leu Leu Met Pro Ala Ile Asn Leu Ala Arg Met Cys Glu
530 535 540
Val Leu Tyr Ser Val Asn Asp Gly Phe Thr His Ala Glu Gly Asp Met
545 550 555 560
Lys Ser Tyr Met Lys Ser Phe Phe Val His Pro Met Val Val
565 570
<210> 5
<211> 857
<212> DNA
<213> 金黄色葡萄球菌
<400> 5
aaagagggtt ataatgaacg agaaaaatat aaaacacagt caaaacttta ttacttcaaa 60
acataatata gataaaataa tgacaaatat aagattaaat gaacatgata atatctttga 120
aatcggctca ggaaaagggc attttaccct tgaattagta cagaggtgta atttcgtaac 180
tgccattgaa atagaccata aattatgcaa aactacagaa aataaacttg ttgatcacga 240
taatttccaa gttttaaaca aggatatatt gcagtttaaa tttcctaaaa accaatccta 300
taaaatattt ggtaatatac cttataacat aagtacggat ataatacgca aaattgtttt 360
tgatagtata gctgatgaga tttatttaat cgtggaatac gggtttgcta aaagattatt 420
aaatacaaaa cgctcattgg cattattttt aatggcagaa gttgatattt ctatattaag 480
tatggttcca agagaatatt ttcatcctaa acctaaagtg aatagctcac ttatcagatt 540
aaatagaaaa aaatcaagaa tatcacacaa agataaacag aagtataatt atttcgttat 600
gaaatgggtt aacaaagaat acaagaaaat atttacaaaa aatcaattta acaattcctt 660
aaaacatgca ggaattgacg atttaaacaa tattagcttt gaacaattct tatctctttt 720
caatagctat aaattattta ataagtaagt taagggatgc ataaactgca tcccttaact 780
tgtttttcgt gtacctattt tttgtgaatc gattatgtct tttgcgcatt cacttctttt 840
ctatataaat atgagcg 857
<210> 6
<211> 5510
<212> DNA
<213> Artificial
<220>
<223> 质粒pUC-Δdxr-ermC
<400> 6
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctttgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgaattcctt aagagtagag gcaaattata aatttgtatt ttttgctatt 2280
atagtgtcaa tttttatggc gctttgtatt ccagttttag atgtggaata taatttttta 2340
gatgtagcaa ctaccttgtt tggttttcta tatgtggcag tattttttag cactatagtt 2400
ttagtaaata gcagtagtta tggtaactat ttagtgtgga ttatagttat atcttcctgg 2460
tgctgtgata cagcagctta ttatacgggt aagtttttag gtaagaaaaa attatgtcct 2520
aaggtgagtc ctaaaaagac tgtggaaggt tctataggtg gaataattgg tagtgcagtg 2580
gcttgtggaa tctttggatt tttttcaatt caaaggggtg ttcctatatc attttatcat 2640
tatatagtaa tgggagtaat ttgtggagca ttttgtcagt tcggggattt agcagcttct 2700
tctataaaga gatatgttgg agtaaaggac tatagcaacc ttataccagg tcatggtggg 2760
atcttagata gatttgacag catacttttt tcaggagtta tagtttatta ttatctaacc 2820
tttgtagctg taatttaagt agcgaaccca aatctctgat ttggtgtgag tcacttactc 2880
attcgaccca agggagaagg agttacataa attagaaccc aaatcctaac aagttaagaa 2940
ttaataatga aaagttaata gtgaaggatg atttttagct atcgcaaaaa atctacatta 3000
actattaatt aaaaaaattt tacatgtgcg aaagttgagt taataataga gaaatatatt 3060
ctataaaaag gatatgtttc tctattattt tatttcatgt attagctgtg agtttaatat 3120
agatcatgtg cgtatttatt ttatagcata aatatggtat agttaatcat gttaaaaatc 3180
ttaaaaatct tatttaatgt gttataagga ctagaggaaa atgaggagtt gttatgagga 3240
tccaaagagg gttataatga acgagaaaaa tataaaacac agtcaaaact ttattacttc 3300
aaaacataat atagataaaa taatgacaaa tataagatta aatgaacatg ataatatctt 3360
tgaaatcggc tcaggaaaag ggcattttac ccttgaatta gtacagaggt gtaatttcgt 3420
aactgccatt gaaatagacc ataaattatg caaaactaca gaaaataaac ttgttgatca 3480
cgataatttc caagttttaa acaaggatat attgcagttt aaatttccta aaaaccaatc 3540
ctataaaata tttggtaata taccttataa cataagtacg gatataatac gcaaaattgt 3600
ttttgatagt atagctgatg agatttattt aatcgtggaa tacgggtttg ctaaaagatt 3660
attaaataca aaacgctcat tggcattatt tttaatggca gaagttgata tttctatatt 3720
aagtatggtt ccaagagaat attttcatcc taaacctaaa gtgaatagct cacttatcag 3780
attaaataga aaaaaatcaa gaatatcaca caaagataaa cagaagtata attatttcgt 3840
tatgaaatgg gttaacaaag aatacaagaa aatatttaca aaaaatcaat ttaacaattc 3900
cttaaaacat gcaggaattg acgatttaaa caatattagc tttgaacaat tcttatctct 3960
tttcaatagc tataaattat ttaataagta agttaaggga tgcataaact gcatccctta 4020
acttgttttt cgtgtaccta ttttttgtga atcgattatg tcttttgcgc attcacttct 4080
tttctatata aatatgagcg gtcgacgaat tgggaggaat accatttgta tataatagca 4140
gcgataatag cctttggcgt attgattata attcatgaac tgggacattt tactatggcg 4200
aaattaaatg gagtaaaagt agaagaattt tctataggaa tgggtcctaa gctctttgga 4260
ataaagggca aggaaacgga atatcatata aggcttcttc ctattggtgg ttatgtaaag 4320
atgctgggtg atgagggtga aagtgatgac cctagggcat ttaataataa aagtcctctt 4380
agaaaactta gtgtagtaac agctggaccc ataatgaatt ttgtacttgg agttatacta 4440
tttgcaataa tagcttctgc gagggggtat ctgtctccta tagtgagtaa agtaatgcca 4500
aatcaacctg cagctttagc gggtataaag ctaggagata aaataactag ggtaaataat 4560
tcaaagatat ctacctggga agactttgta acagaagttt atactgcagg aggaaatcca 4620
attaatataa cttatgaacg taatggaaac acaaatcagg taagagttat tccaataaaa 4680
gataaaaaag aaaataggta tgttgtaggt attgaatcaa ctcaagtcac taagcctact 4740
ttggggcagt cagtatccta tgggtttata gaaactaaat ccctaatcaa gcagacattt 4800
agttttttta aaacactatt tagaggaaaa gcatctatga atgatgtagg gggacctgtt 4860
actataataa aaatatcagg tgcagcagca aaagcaggaa tattgagttt gatggcattt 4920
tcagcttata taagtataca gcttgctata tttaacataa taccttttcc agctttggat 4980
ggaggatata tatttttatt tttgtttgaa ataataacag gtaaaaaagt agatgaaaat 5040
aaggttggaa cgataaatta tgttggattt gcaatactta tggcacttat ggtactagtt 5100
accgtaaagc ttggcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 5160
tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 5220
ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat 5280
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 5340
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 5400
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 5460
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 5510
<210> 7
<211> 3983
<212> DNA
<213> 约氏乳杆菌
<400> 7
taaaagattg ctaagattgt ttagcaatct ttttttagaa ttgattaaaa aaattatact 60
ttatacattt gatgcatggc gtgagctatc atgttaatag aataattttt attaagaggt 120
ggaagagtgt tacaggatgt ttatatagta ggaatgaatc gaattccttt tggtaagtat 180
cgtggatttt ataaggataa aagtgctgtt gacctaggag tgttagcact taagggatta 240
ttgaaaaaga atattgttcc acaagataaa atagatagca ttttggtggg aaatgtatta 300
agtgctgggc taggtcaaaa tgtcgctcga caaatagctt taaaatcagg tttacctgaa 360
tctgtagtgg gtactagcgt agacgacgtt tgtggttcaa gtttaaaggc attacggttt 420
gctcaaggtc aaatgctcct aggagattct caaattgcaa ttgtaggtgg ggcagaaagt 480
atgacaaatg caccactttt acttgataaa agtaaaaagc atgatgaaaa tccagcatat 540
caagatagct taatgataga tggaattggg gatgcttatt cgagaaagcc gatgggaatt 600
acagctgaga atgtagctga taaataccat attacgcgtc aagatatgga tgaatttgca 660
cgtgattctc atgccaaggc ttatgcagct caggagaatg actggtttaa ggaagagtat 720
gcaccaattg aactcgatgg tcatgttctt gatcatgatg aaaccattcg accagattct 780
agtttagaag ccctaggtca attaaaacct gtatttaagg aaaatggacg agttacggct 840
ggcaattctt caccgttaac tgatggtgca agtatgttgt tattatctaa tcaacaaaaa 900
ttagatgaat taaatttaac tccattagca tacttgggtg cctatgcaga aattggctgt 960
gatcctgctt atatgggata cgcaccatat tttgctatta aaaaattact tacaaaaact 1020
aatagcacaa ttgaggatta tgatctaatt gaaattaatg aggcctttgc agctcaagca 1080
tatgctgtag cccgtgatct aaatattcca aaagaaaaat taaatatcgc tggaggagca 1140
attagtttag gacatccgct tggtgcaacc ggtacgcgct tagtaatgag tgcagtaaac 1200
agtttgcgta aaattaatgg tcgaagagca attgtatctc tatgtattgg cggtggccaa 1260
ggaatcgcat atgaaattag aagaatcatc taaaaagaaa ttttatcaat ggttaccaga 1320
ggaaagaaga gtctttttaa ctgaaaaagg aattaaacta agtgagattg agtctgaaac 1380
tttggaaaga ctagataaac ttagtgaaaa tgtaattggt caagtccgtc ttcctcttgg 1440
tgtgcttcct aagttaatag ttaacgggaa agattatcaa gtaccaatgg ccgtagaaga 1500
accatcggtt gttgcagcag caaaccatgc agctaaaatt tttaatcaaa atggtggagc 1560
agtagctgat agtagacgaa atggaatata tggtcaaatt gttttagagg taactgataa 1620
ttttgattta actaagttta ctactgaatt tcctcaatta attagcttag ctaataaaaa 1680
attcgttagc ttagtcaagc atggtggagg agttcgtaaa attgaagctt ctcaaaaaga 1740
aaatttagtt tttcttagag ttttggttga cccagcagaa gctatgggag ctaataaaac 1800
aaatgctatt ttagaatttt taggaaatga attagagaag cagccagata ttgaacaaac 1860
tctgtatgca attttgtcta attatcctac gcaattgact agtgctaaag taagtctttc 1920
aattgacagt gtaggaggat taaaagttgc taaaaagata gctttattga gtaaaatagg 1980
acaaactgat atttaccggg cagtgactaa taataaagga attatgaatg gtattgatag 2040
tgtattggtt gcaactggta atgattatcg tggagttgaa gcagcaactg ctgtttgggc 2100
taataaaaat ggtgcctata catctttgag taagtggaaa attgaagaag atagactagt 2160
ggggactgta acagttccct tagcaatcgg tgtagtaggt ggctcaatta aggctcgtcg 2220
agacgttcaa caaagcttta gtttattagg taatatatct gccaagcaac tagcagaagt 2280
tattgcgaca actggcttag caaataactt ttcagctctt ttagcaattt ctactaaggg 2340
aattcaagct gggcatatga aattgcaggc gagaaattta gtagcaacct taaaagctag 2400
tgaaggtgaa aaagcaatag ttttaaaaaa attgcaggaa agtaaaaaat atactcaaga 2460
agcagctttt gaatttttaa gcgaaataag aaaggatcaa aaataagatg aaggttggaa 2520
ttgatcaaat tggatatttt actccaaata agtatgttga tatggtggat ttagcccatg 2580
ctaggaatca agatccaaat aaatttttaa ttgggattgg acagaaaaaa atgagcgttg 2640
cagatccaac tcaagatgca gtttcaatgg gaattaatgc aactctacgc tatatcgata 2700
agattgataa atcaaaagta ggacttttga tttttggtac tgaaagtagt gtggatcaat 2760
ctaaatctgg ctctttattt gtaaaatcgg cattagggtt agatcctact gtgagagctt 2820
ttgaagttaa ggaagcatgt tttggcttaa cggctggctt aatgattgcc caagattttg 2880
tacgacttca tcctgatcaa actgctattg ttatcggcag tgatattgct cgctatgggg 2940
ttaatactgc tggtgaagtt actcaaggag ctggaagtgt tagtttatta atttctagta 3000
atccaagaat tttagaatta aatgaaggcc atagtgctta tagtgaggat atcaatgatt 3060
tctggcgccc taactattct aaaacagcca aggtagatgg aaagtattct acccaggttt 3120
acttagactt tttcaaacat actttttctg cttacaaaga acaaaagaat cttgaaacaa 3180
aagattttgc cgctattgtc taccacttac cttttactaa gatgggatta aaggcaaata 3240
gattagctgt tgagggaacg gatgaagaaa caaatgcccg gttaatggac agctttactg 3300
cagctaaaga attgaatgca aatgtaggta atatttacac tggatcgtta tacttgagtc 3360
tacttagttt acttgaaaat ggtaggttaa aagctggaga cttagtcggt ctattttctt 3420
atggttcagg tgcaatggct gaattttatt ccgcaaatgt agttgaaggc tatgaaaaac 3480
aacttgataa ggttggagat aaagctttat tagataatcg aagcaagctt agtgttgccg 3540
aatatgagga aatcttttct gcaggtttgg aagatccaga aaacaatgtt gaacttatca 3600
gtgatgaaga aactggtaga tattattttg ctggtattcg taatgatatc cgccaatatc 3660
aagttaaata acttgtattc gcttacatag ttgttataat aagatgtgtg gagaggtaga 3720
ataatattgt aaatagtttt tatctccaga ttgtagtgtt ttaaagacaa gattctctta 3780
gtaagatcaa atagtcgtta ttcaatacag atgcaaacaa gtgatgttga tcaagtcata 3840
atatcaaacc cagatactga cgttatggcg ctagatagta tttacctcat ccacttgaaa 3900
aaaggttgta gaccaggcag tctacaacct tttttataag cacaaaaaag cagtcacatc 3960
gactgcttaa attaatataa tta 3983
<210> 8
<211> 4313
<212> DNA
<213> 约氏乳杆菌
<400> 8
cataagtctc tagtctcctt agcaaatatt ttagcatatg agacaaggca attagactta 60
atgaaattta taatatagga aagataattg tgaataaaaa aatagaagtc aaagcacatg 120
gaaaagtgat tcttattggt gagcattctg tagtttatgg ctatgatgcc ctcgctcttc 180
caatccaggc cttaaatatc accacaactg ttgaagaaac tgatggtcct acttggatgg 240
atacaactca ttatcatggt gctttttttg atgcgccgga tgaatacgat ggtattaaat 300
atattgtgaa aactttactt gaaagagtag aaaacgctcc taatcttaaa attacttata 360
ctggtgaaat tcctatggaa cggggttttg gatcaagtgc tgttgtagct ttaggaacta 420
ccaaggctgt ttcacaattt ttaggattaa ctctttctga agctgagatc atggaaatca 480
ctaatcatgc agaaatgatt aatcatggaa aagcttccgg ccttgacgct gctaccgtaa 540
attccgatta cttagttttc ttcaataaac aagacggacc aaaacagctt tctcaaaaat 600
taggtgctac cttattaatt atggatacgg gtgaacttgg aaataccaaa gtcgcagttc 660
aatcagttaa aaagcaaatg gatgaaagtg atcttaaaaa gaaacaaatt gcacggcttg 720
gagaattagc taccgcaaca cgacaaaatt ggtttaacca aaatgcagaa gagatcggga 780
agatttttaa tgaagccgaa gacatccttg cctcctttaa gctttcaact gaaagaatcg 840
ataatatttg taaaattgcc aatgaaaatg gcgctttagg agctaaatta tctggtggtg 900
gcttaggtgg cattgtaatt gcactatgtc ctaatcaaga agttgctaaa aaaattgccg 960
aaaaagctaa agctaatttt gataatgact ggattgagga aatttaatga agaaaactgc 1020
tcgtgcccac actaatatcg ccttaattaa atattgggga aaagctgacc aagctttaaa 1080
gacaccgtta atgtctagtc tttcaatgac attagatgcc ttttatactg atactacatt 1140
tgaacatgat tcctcattaa ctgaagatac ctttatttta aatgatcaaa aacaatcagt 1200
agaagacagc aagcgagttt ttaattatat tcatttatta caagaaaagt ttggcgttaa 1260
tgaccacttt acaattcggt ctacaaacca tgttcctact tctgctggcc ttgcttcctc 1320
agcatcagct tttgcggctc ttgcaacaag ctttgttgca agctatggat tagatctttc 1380
taaaaaggag ctttcaagac ttgcacgcct tgggtctggg tcagcgacta gatcagttta 1440
tggcggcttt gttgaatgga aaaaaggatt tgatgatgag agctcctatg cagctccaat 1500
tgatgaaaat cctgatcttg atctttctct actagcaatc gaagttaata caaagcagaa 1560
aaaaatttct tcaacaaaag gaatgcagtt agcccaaacc tctccttttt atcaaccttg 1620
gttagctaga aacgaagaag aaattgctga aattaaacaa gctatccaaa ataatgactt 1680
tactagaatt ggtgaactta gtgaactaag tgccaacgag atgcacgctt gcaatttaac 1740
tgctaaagaa ccctttactt attttgaacc ggaaacaatt aaaattatta aattagttga 1800
agatttaaga aaaaatggca tcgaatgtta ctatacaatt gatgctggtc caaacgtaaa 1860
aattctctgc accttaagaa atagaaaaga tattatttca gctgttcaga aaaccttgac 1920
taatgttaaa atagtcgttg cgagtttcgg cccaggcgtt actctgcttt agtaatttga 1980
aaataaaaag attagaggaa tattcgttga ttacagaaca agcaccagga aagttgtata 2040
ttgcgggaga gtatgcagtt cttgagcaaa actgccctgc cattttagtt gcagtaaatg 2100
aatttgtacg tgtttcaatt gcaaagagta caggtacaag tgggttaatt cattctaaac 2160
agtattctca agattcaatt cactggatcc gtaaaggtaa ccaaatggtt attgataatc 2220
gtgataatcc gtttgaatac attttatctg ctattaactt tacagaacgt ttttgtcttg 2280
aacaaaaagt ttcaatgtct ttatatgacc tacatgttaa ttcagatctt gattcagccg 2340
acggtaaaaa atacggtctt ggctcttcag cggctgtaac agttgctacg gtgaaggcta 2400
ttcttaattt ctatggatta cactgtacaa aagatcttat ttttaaactt tctgctattt 2460
ctcactatag cgttcaaggt aatggttctg ctggtgatat tgcagcaagt gtttacggtg 2520
gttggcttgc ttatcaaact tttgataaag catggcttaa gaaagaatta gctactaaat 2580
ctcttagcga agttttaaat gaagcttggc ctggtcttaa gattcaatta ttaactcctc 2640
cagaaggact aaacttggta attggttgga gtcaaaagcc tgcttcaact tctcaattag 2700
ttgataaaac taatgcaaag aaaaagttta ttaagactca atatgacact tttttagatg 2760
aatcacggaa atgtgttctt gatatgatta agggctttaa tgaaaaaaat atttctttaa 2820
ttcaaaaaca aattcgttta aatcgtcagt tattaaaaga ctttgcttct cttaaccata 2880
ttgctatcga aatcccacgt ttaactaaat taattaatat tgccgaacaa tttaatggcg 2940
ctgctaagac ttctggtgca ggaaatggcg attgtggtat tgtgattgca gatgaaaaaa 3000
ctgatatcga agaaatgaaa aataattggc gtaaaaatgg aattatgcca ttgaactttc 3060
tagttcactc aattgcttag tgggaaaaat tatgtcacaa agatctcaaa gaaaagaaga 3120
acatctagca ttagctaaga tgttttttaa tagtaataaa gataatgatt ttaatcatgt 3180
tcatttaatc cgccctgctc ttccagaaag tgcaataagt agagatagta tttcaactga 3240
aatgtttggt catactatca gtactccctt ctttattaat gcaatgactg gcggctctga 3300
tacttcctat accatcaatc aacgtttagc taaagcggct gccgcagaaa atattccgat 3360
ggctttagga tccgctagca ttcttgaaaa agaaattgat caaatagaga gctttgaagt 3420
tgcacgtcaa gaaaatcctg atggactaat ttttgcaaat gttaatccaa ctactgatcc 3480
aaaagtagct caaaagattg ttgacgcttt agatgcaaat gcattacaga ttcatcttaa 3540
tagtgttcaa gaagctgtaa tgcctgaagg cgatcgagat tttcattgga tagataatct 3600
aaaagaaatt agagatacag ttgatgtgcc aattattatt aaagaagttg gaatgggaat 3660
tgatcctgaa tctcttcgta cccttttaat caatgacttt tcaattatcg atttaggtgg 3720
aagtggcgga actaattttg cgcaaattga aaatgaaaga cgaaagactc aaaaattaaa 3780
ctttttagaa gatattggtc tttctactgt taaaacgctg cttgcagcac gcactatccc 3840
tgttaataaa actattattg cagctggtgg cattacaaat gcactggaca tttttaagtc 3900
tttagtttta ggtgcacagt atgttggtat tgcaaactat ttcttgcagt atgctagcca 3960
agattccgag actttgattg ctgctattca aaacttaaaa tatgaattga aacttttaac 4020
tgctctattt ggtttagatc atatttctaa agccgatgaa gttagatatt atttggatac 4080
tgatctttac aatttcactc gacaactcta taattagtgc tatttcgttg gatggctgct 4140
ataagcagcc atcctttttg ttttatttat tttttaaatg ttaaagtaac aattttatta 4200
atttaaatat aaaaagtaaa aaagttcatt aaattaaatt tggatcaata ccaaaagtta 4260
atttaatgaa cttcgttcta ctaaataaca aaagctaatt aataatgttt tta 4313
<210> 9
<211> 1788
<212> DNA
<213> 银灰杨
<400> 9
atggcaactg aattattgtg cttgcaccgt ccaatctcac tgacacacaa attgttcaga 60
aatcccttgc ctaaagtcat ccaggccact cccttaactt tgaaactcag atgttctgta 120
agcacagaaa acgtcagctt cacagaaaca gaaacagaaa ccagaaggtc tgccaattat 180
gaaccaaata gctgggatta tgattatttg ctgtcttcgg acactgacga atcgattgaa 240
gtatacaaag acaaggccaa aaagctggag gctgaggtga gaagagagat taacaatgaa 300
aaggcagagt ttttgactct gcctgaactg atagataatg tccaaaggtt aggattaggt 360
taccggttcg agagtgacat aaggagagcc cttgatagat ttgtttcttc aggaggattt 420
gatgctgtta caaaaactag ccttcatgct actgctctta gcttcaggct tctcagacag 480
catggctttg aggtctctca agaagcgttc agcggattca aggatcaaaa tggcaatttc 540
ttgaaaaacc ttaaggagga catcaaggca atactaagcc tatatgaagc ttcatttctt 600
gccttagaag gagaaaatat cttggatgag gccaaggtgt ttgcaatatc acatctaaaa 660
gagctcagcg aagaaaagat tggaaaagac ctggccgaac aggtgaatca tgcattggag 720
cttccattgc atcgaaggac gcaaagacta gaagctgttt ggagcattga agcataccgt 780
aaaaaggaag atgcagatca agtactgcta gaacttgcta tattggacta caacatgatt 840
caatcagtat accaaagaga tcttcgcgag acatcaaggt ggtggaggcg tgtgggtctt 900
gcaacaaagt tgcattttgc tagagacagg ttaattgaaa gcttttactg ggcagttgga 960
gttgcgtttg aacctcaata cagtgattgc cgtaattccg tagcaaaaat gttttcgttt 1020
gtaacaatca ttgatgatat ctatgatgtt tatggtactc tggatgagtt ggagctattt 1080
acagatgctg ttgagagatg ggatgttaat gccatcgatg atcttccgga ttatatgaag 1140
ctctgcttcc tagctctcta taacactatc aatgagatag cttatgataa tctgaaggac 1200
aagggggaaa acattcttcc atacctaaca aaagcgtggg cagatttatg caatgcattc 1260
ctacaagaag caaaatggtt gtacaataag tccacaccaa catttgatga atatttcgga 1320
aatgcatgga aatcatcctc agggcctctt caactagttt ttgcctactt tgccgttgtt 1380
caaaacatca agaaagagga aattgataac ttacaaaagt atcatgatat catcagtagg 1440
ccttcccaca tctttcgtct ttgcaacgac ttggcttcag catcggctga gatagcgaga 1500
ggtgaaaccg cgaattctgt atcatgctac atgcgtacaa aaggcatttc tgaggaactt 1560
gctactgaat ccgtaatgaa tttgatcgac gaaacctgga aaaagatgaa caaagaaaag 1620
cttggtggct ctctgtttgc aaaacctttt gtcgaaacag ctattaacct tgcacgacaa 1680
tcccattgca cttatcacaa cggagatgcg catacttcac cagatgagct cactaggaaa 1740
cgtgtcctgt cagtaatcac agagcctatt ctaccctttg agagataa 1788
<210> 10
<211> 16228
<212> DNA
<213> 人工序列
<220>
<223> 质粒pSK1(LbMVA-ISPS)
<400> 10
gaattcgagc tcggtacctt tttaacaaaa tatattgata aaaataataa tagtgggtat 60
aattaagttg ttagagaaaa cgtataaatt agggataaac tatggaactt atgaaataga 120
ttgaaatggt ttatctgtta ccccgtagtg ttacaggatg tttatatagt aggaatgaat 180
cgaattcctt ttggtaagta tcgtggattt tataaggata aaagtgctgt tgacctagga 240
gtgttagcac ttaagggatt attgaaaaag aatattgttc cacaagataa aatagatagc 300
attttggtgg gaaatgtatt aagtgctggg ctaggtcaaa atgtcgctcg acaaatagct 360
ttaaaatcag gtttacctga atctgtagtg ggtactagcg tagacgacgt ttgtggttca 420
agtttaaagg cattacggtt tgctcaaggt caaatgctcc taggagattc tcaaattgca 480
attgtaggtg gggcagaaag tatgacaaat gcaccacttt tacttgataa aagtaaaaag 540
catgatgaaa atccagcata tcaagatagc ttaatgatag atggaattgg ggatgcttat 600
tcgagaaagc cgatgggaat tacagctgag aatgtagctg ataaatacca tattacgcgt 660
caagatatgg atgaatttgc acgtgattct catgccaagg cttatgcagc tcaggagaat 720
gactggttta aggaagagta tgcaccaatt gaactcgatg gtcatgttct tgatcatgat 780
gaaaccattc gaccagattc tagtttagaa gccctaggtc aattaaaacc tgtatttaag 840
gaaaatggac gagttacggc tggcaattct tcaccgttaa ctgatggtgc aagtatgttg 900
ttattatcta atcaacaaaa attagatgaa ttaaatttaa ctccattagc atacttgggt 960
gcctatgcag aaattggctg tgatcctgct tatatgggat acgcaccata ttttgctatt 1020
aaaaaattac ttacaaaaac taatagcaca attgaggatt atgatctaat tgaaattaat 1080
gaggcctttg cagctcaagc atatgctgta gcccgtgatc taaatattcc aaaagaaaaa 1140
ttaaatatcg ctggaggagc aattagttta ggacatccgc ttggtgcaac cggtacgcgc 1200
ttagtaatga gtgcagtaaa cagtttgcgt aaaattaatg gtcgaagagc aattgtatct 1260
ctatgtattg gcggtggcca aggaatcgca tatgaaatta gaagaatcat ctaaaaagaa 1320
attttatcaa tggttaccag aggaaagaag agtcttttta actgaaaaag gaattaaact 1380
aagtgagatt gagtctgaaa ctttggaaag actagataaa cttagtgaaa atgtaattgg 1440
tcaagtccgt cttcctcttg gtgtgcttcc taagttaata gttaacggga aagattatca 1500
agtaccaatg gccgtagaag aaccatcggt tgttgcagca gcaaaccatg cagctaaaat 1560
ttttaatcaa aatggtggag cagtagctga tagtagacga aatggaatat atggtcaaat 1620
tgttttagag gtaactgata attttgattt aactaagttt actactgaat ttcctcaatt 1680
aattagctta gctaataaaa aattcgttag cttagtcaag catggtggag gagttcgtaa 1740
aattgaagct tctcaaaaag aaaatttagt ttttcttaga gttttggttg acccagcaga 1800
agctatggga gctaataaaa caaatgctat tttagaattt ttaggaaatg aattagagaa 1860
gcagccagat attgaacaaa ctctgtatgc aattttgtct aattatccta cgcaattgac 1920
tagtgctaaa gtaagtcttt caattgacag tgtaggagga ttaaaagttg ctaaaaagat 1980
agctttattg agtaaaatag gacaaactga tatttaccgg gcagtgacta ataataaagg 2040
aattatgaat ggtattgata gtgtattggt tgcaactggt aatgattatc gtggagttga 2100
agcagcaact gctgtttggg ctaataaaaa tggtgcctat acatctttga gtaagtggaa 2160
aattgaagaa gatagactag tggggactgt aacagttccc ttagcaatcg gtgtagtagg 2220
tggctcaatt aaggctcgtc gagacgttca acaaagcttt agtttattag gtaatatatc 2280
tgccaagcaa ctagcagaag ttattgcgac aactggctta gcaaataact tttcagctct 2340
tttagcaatt tctactaagg gaattcaagc tgggcatatg aaattgcagg cgagaaattt 2400
agtagcaacc ttaaaagcta gtgaaggtga aaaagcaata gttttaaaaa aattgcagga 2460
aagtaaaaaa tatactcaag aagcagcttt tgaattttta agcgaaataa gaaaggatca 2520
aaaataagat gaaggttgga attgatcaaa ttggatattt tactccaaat aagtatgttg 2580
atatggtgga tttagcccat gctaggaatc aagatccaaa taaattttta attgggattg 2640
gacagaaaaa aatgagcgtt gcagatccaa ctcaagatgc agtttcaatg ggaattaatg 2700
caactctacg ctatatcgat aagattgata aatcaaaagt aggacttttg atttttggta 2760
ctgaaagtag tgtggatcaa tctaaatctg gctctttatt tgtaaaatcg gcattagggt 2820
tagatcctac tgtgagagct tttgaagtta aggaagcatg ttttggctta acggctggct 2880
taatgattgc ccaagatttt gtacgacttc atcctgatca aactgctatt gttatcggca 2940
gtgatattgc tcgctatggg gttaatactg ctggtgaagt tactcaagga gctggaagtg 3000
ttagtttatt aatttctagt aatccaagaa ttttagaatt aaatgaaggc catagtgctt 3060
atagtgagga tatcaatgat ttctggcgcc ctaactattc taaaacagcc aaggtagatg 3120
gaaagtattc tacccaggtt tacttagact ttttcaaaca tactttttct gcttacaaag 3180
aacaaaagaa tcttgaaaca aaagattttg ccgctattgt ctaccactta ccttttacta 3240
agatgggatt aaaggcaaat agattagctg ttgagggaac ggatgaagaa acaaatgccc 3300
ggttaatgga cagctttact gcagctaaag aattgaatgc aaatgtaggt aatatttaca 3360
ctggatcgtt atacttgagt ctacttagtt tacttgaaaa tggtaggtta aaagctggag 3420
acttagtcgg tctattttct tatggttcag gtgcaatggc tgaattttat tccgcaaatg 3480
tagttgaagg ctatgaaaaa caacttgata aggttggaga taaagcttta ttagataatc 3540
gaagcaagct tagtgttgcc gaatatgagg aaatcttttc tgcaggtttg gaagatccag 3600
aaaacaatgt tgaacttatc agtgatgaag aaactggtag atattatttt gctggtattc 3660
gtaatgatat ccgccaatat caagttaaat aacataagtc tctagtctcc ttagcaaata 3720
ttttagcata tgagacaagg caattagact taatgaaatt tataatatag gaaagataat 3780
tgtgaataaa aaaatagaag tcaaagcaca tggaaaagtg attcttattg gtgagcattc 3840
tgtagtttat ggctatgatg ccctcgctct tccaatccag gccttaaata tcaccacaac 3900
tgttgaagaa actgatggtc ctacttggat ggatacaact cattatcatg gtgctttttt 3960
tgatgcgccg gatgaatacg atggtattaa atatattgtg aaaactttac ttgaaagagt 4020
agaaaacgct cctaatctta aaattactta tactggtgaa attcctatgg aacggggttt 4080
tggatcaagt gctgttgtag ctttaggaac taccaaggct gtttcacaat ttttaggatt 4140
aactctttct gaagctgaga tcatggaaat cactaatcat gcagaaatga ttaatcatgg 4200
aaaagcttcc ggccttgacg ctgctaccgt aaattccgat tacttagttt tcttcaataa 4260
acaagacgga ccaaaacagc tttctcaaaa attaggtgct accttattaa ttatggatac 4320
gggtgaactt ggaaatacca aagtcgcagt tcaatcagtt aaaaagcaaa tggatgaaag 4380
tgatcttaaa aagaaacaaa ttgcacggct tggagaatta gctaccgcaa cacgacaaaa 4440
ttggtttaac caaaatgcag aagagatcgg gaagattttt aatgaagccg aagacatcct 4500
tgcctccttt aagctttcaa ctgaaagaat cgataatatt tgtaaaattg ccaatgaaaa 4560
tggcgcttta ggagctaaat tatctggtgg tggcttaggt ggcattgtaa ttgcactatg 4620
tcctaatcaa gaagttgcta aaaaaattgc cgaaaaagct aaagctaatt ttgataatga 4680
ctggattgag gaaatttaat gaagaaaact gctcgtgccc acactaatat cgccttaatt 4740
aaatattggg gaaaagctga ccaagcttta aagacaccgt taatgtctag tctttcaatg 4800
acattagatg ccttttatac tgatactaca tttgaacatg attcctcatt aactgaagat 4860
acctttattt taaatgatca aaaacaatca gtagaagaca gcaagcgagt ttttaattat 4920
attcatttat tacaagaaaa gtttggcgtt aatgaccact ttacaattcg gtctacaaac 4980
catgttccta cttctgctgg ccttgcttcc tcagcatcag cttttgcggc tcttgcaaca 5040
agctttgttg caagctatgg attagatctt tctaaaaagg agctttcaag acttgcacgc 5100
cttgggtctg ggtcagcgac tagatcagtt tatggcggct ttgttgaatg gaaaaaagga 5160
tttgatgatg agagctccta tgcagctcca attgatgaaa atcctgatct tgatctttct 5220
ctactagcaa tcgaagttaa tacaaagcag aaaaaaattt cttcaacaaa aggaatgcag 5280
ttagcccaaa cctctccttt ttatcaacct tggttagcta gaaacgaaga agaaattgct 5340
gaaattaaac aagctatcca aaataatgac tttactagaa ttggtgaact tagtgaacta 5400
agtgccaacg agatgcacgc ttgcaattta actgctaaag aaccctttac ttattttgaa 5460
ccggaaacaa ttaaaattat taaattagtt gaagatttaa gaaaaaatgg catcgaatgt 5520
tactatacaa ttgatgctgg tccaaacgta aaaattctct gcaccttaag aaatagaaaa 5580
gatattattt cagctgttca gaaaaccttg actaatgtta aaatagtcgt tgcgagtttc 5640
ggcccaggcg ttactctgct ttagtaattt gaaaataaaa agattagagg aatattcgtt 5700
gattacagaa caagcaccag gaaagttgta tattgcggga gagtatgcag ttcttgagca 5760
aaactgccct gccattttag ttgcagtaaa tgaatttgta cgtgtttcaa ttgcaaagag 5820
tacaggtaca agtgggttaa ttcattctaa acagtattct caagattcaa ttcactggat 5880
ccgtaaaggt aaccaaatgg ttattgataa tcgtgataat ccgtttgaat acattttatc 5940
tgctattaac tttacagaac gtttttgtct tgaacaaaaa gtttcaatgt ctttatatga 6000
cctacatgtt aattcagatc ttgattcagc cgacggtaaa aaatacggtc ttggctcttc 6060
agcggctgta acagttgcta cggtgaaggc tattcttaat ttctatggat tacactgtac 6120
aaaagatctt atttttaaac tttctgctat ttctcactat agcgttcaag gtaatggttc 6180
tgctggtgat attgcagcaa gtgtttacgg tggttggctt gcttatcaaa cttttgataa 6240
agcatggctt aagaaagaat tagctactaa atctcttagc gaagttttaa atgaagcttg 6300
gcctggtctt aagattcaat tattaactcc tccagaagga ctaaacttgg taattggttg 6360
gagtcaaaag cctgcttcaa cttctcaatt agttgataaa actaatgcaa agaaaaagtt 6420
tattaagact caatatgaca cttttttaga tgaatcacgg aaatgtgttc ttgatatgat 6480
taagggcttt aatgaaaaaa atatttcttt aattcaaaaa caaattcgtt taaatcgtca 6540
gttattaaaa gactttgctt ctcttaacca tattgctatc gaaatcccac gtttaactaa 6600
attaattaat attgccgaac aatttaatgg cgctgctaag acttctggtg caggaaatgg 6660
cgattgtggt attgtgattg cagatgaaaa aactgatatc gaagaaatga aaaataattg 6720
gcgtaaaaat ggaattatgc cattgaactt tctagttcac tcaattgctt agtgggaaaa 6780
attatgtcac aaagatctca aagaaaagaa gaacatctag cattagctaa gatgtttttt 6840
aatagtaata aagataatga ttttaatcat gttcatttaa tccgccctgc tcttccagaa 6900
agtgcaataa gtagagatag tatttcaact gaaatgtttg gtcatactat cagtactccc 6960
ttctttatta atgcaatgac tggcggctct gatacttcct ataccatcaa tcaacgttta 7020
gctaaagcgg ctgccgcaga aaatattccg atggctttag gatccgctag cattcttgaa 7080
aaagaaattg atcaaataga gagctttgaa gttgcacgtc aagaaaatcc tgatggacta 7140
atttttgcaa atgttaatcc aactactgat ccaaaagtag ctcaaaagat tgttgacgct 7200
ttagatgcaa atgcattaca gattcatctt aatagtgttc aagaagctgt aatgcctgaa 7260
ggcgatcgag attttcattg gatagataat ctaaaagaaa ttagagatac agttgatgtg 7320
ccaattatta ttaaagaagt tggaatggga attgatcctg aatctcttcg taccctttta 7380
atcaatgact tttcaattat cgatttaggt ggaagtggcg gaactaattt tgcgcaaatt 7440
gaaaatgaaa gacgaaagac tcaaaaatta aactttttag aagatattgg tctttctact 7500
gttaaaacgc tgcttgcagc acgcactatc cctgttaata aaactattat tgcagctggt 7560
ggcattacaa atgcactgga catttttaag tctttagttt taggtgcaca gtatgttggt 7620
attgcaaact atttcttgca gtatgctagc caagattccg agactttgat tgctgctatt 7680
caaaacttaa aatatgaatt gaaactttta actgctctat ttggtttaga tcatatttct 7740
aaagccgatg aagttagata ttatttggat actgatcttt acaatttcac tcgacaactc 7800
tataattagt tttaaaatat aagtgattta gatattcata atatatttgg gaggtaaatt 7860
aatatggaaa ccagaaggtc tgccaattat gaaccaaata gctgggatta tgattatttg 7920
ctgtcttctg acactgacga atctattgaa gtatacaaag acaaggccaa aaagctggag 7980
gctgaggtga gaagagagat taacaatgaa aaggcagagt ttttgactct gcctgaactg 8040
atagataatg ttcaaaggtt aggattaggt tacagattcg agagtgacat aaggagagcc 8100
cttgatagat ttgtttcttc aggaggattt gatgctgtta caaaaactag ccttcatgct 8160
actgctctta gcttcaggct tctcagacag catggctttg aggtatctca agaagctttc 8220
agcggattca aggatcaaaa tggcaatttc ttgaaaaacc ttaaggagga catcaaggca 8280
atactaagcc tatatgaagc ttcatttctt gccttagaag gagaaaatat cttggatgag 8340
gccaaggtgt ttgcaatatc acatctaaaa gagcttagcg aagaaaagat tggaaaagac 8400
ctggccgaac aggtgaatca tgcattggag cttccattgc atagaaggac acaaagacta 8460
gaagctgttt ggagcattga agcatacaga aaaaaggaag atgcagatca agtactgcta 8520
gaacttgcta tattggacta caacatgatt caatcagtat accaaagaga tcttagagag 8580
acatcaaggt ggtggaggag agtgggtctt gcaacaaagt tgcattttgc tagagacagg 8640
ttaattgaaa gcttttactg ggcagttgga gttgcatttg aacctcaata cagtgattgt 8700
agaaattccg tagcaaaaat gttttctttt gtaacaatca ttgatgatat ctatgatgtt 8760
tatggtactc tggatgagtt ggagctattt acagatgctg ttgagagatg ggatgttaat 8820
gccatcgatg atcttcctga ttatatgaag ctttgtttcc tagctcttta taacactatc 8880
aatgagatag cttatgataa tctgaaggac aagggggaaa acattcttcc atacctaaca 8940
aaagcatggg cagatttatg taatgcattc ctacaagaag caaaatggtt gtacaataag 9000
tccacaccaa catttgatga atatttcgga aatgcatgga aatcatcctc agggcctctt 9060
caactagttt ttgcctactt tgccgttgtt caaaacatca agaaagagga aattgataac 9120
ttacaaaagt atcatgatat catcagtagg ccttcccata tctttagact ttgtaacgac 9180
ttggcttcag catctgctga gatagcaaga ggtgaaaccg caaattctgt atcatgttac 9240
atgagaacaa aaggcatttc tgaggaactt gctactgaat ccgtaatgaa tttgatcgac 9300
gaaacctgga aaaagatgaa caaagaaaag cttggtggct ctctgtttgc aaaacctttt 9360
gttgaaacag ctattaacct tgcaagacaa tcccattgta cttatcataa cggagatgca 9420
catacttcac cagatgagct tactaggaaa agagtactgt cagtaatcac agagcctatt 9480
ctaccttttg agagataata atgctatttc gttggatggc tgctataagc agccatcctt 9540
tttgttttat ttatttttta aatgttaaag taacaatttt attaatttaa atataaaaag 9600
taaaaaagtt cattaaatta aatttggatc aataccaaaa gttaatttaa tgaacttcgt 9660
tctactaaat aacaaaagct aattaataat gtttttagtc gacctgcagg catgcttggc 9720
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 9780
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 9840
cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 9900
tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 9960
tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 10020
ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 10080
tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 10140
atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 10200
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 10260
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 10320
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 10380
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 10440
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 10500
acgttttcca atgatgagca cttttaaatt aaaaatgaag ttttaaaact tcatttttaa 10560
tttaaattaa aaatgaagtt ttatcaaaaa aatttccaat aatcccactc taagccacaa 10620
acacgcccta taaaatcccg ctttaatccc actttgagac acatgtaata ttactttacg 10680
ccctagtata gtgataattt tttacattca atgccacgca aaaaaataaa ggggcactat 10740
aataaaagtt ccttcggaac taactaaagt aaaaaattat ctttacaacc tccccaaaaa 10800
aaagaacagg tacaaagtac cctataatac aagcgtaaaa aaatgagggt aaaaataaaa 10860
aaataaaaaa ataaaaaaat aaaaaaataa aaaaaataaa aaaataaaaa aataaaaaaa 10920
taaaaaaata aaaaaataaa aaaataaaaa aataaaaaaa tataaaaata aaaaaatata 10980
aaaataaaaa aatataaaaa taaaaaaata taaaaataaa aaaataaaaa aatataaaaa 11040
taaaaaaata aaaaaatata aaaatatttt ttatttaaag tttgaaaaaa atttttttat 11100
attatataat ctttgaagaa aagaatataa aaaatgagcc tttataaaag cccatttttt 11160
ttcatatacg taatatgacg ttctaatgtt tttattggta cttctaacat tagagtaatt 11220
tctttatttt taaagccttt ttctttaagg gcttttattt tttttcttaa tacatttaat 11280
tcctcttttt ttgttgcttt tcctttagct tttaattgct cttgataatt ttttttacct 11340
ctaatatttt ctcttctctt atattccttt ttagaaatta ttattgtcat atatttttgt 11400
tcttcttctg taatttctaa taactctata agagtttcat tcttatactt atattgctta 11460
tttttatcta aataacatct ttcagcactt ctagttgctc ttataacttc tctttcactt 11520
aaatgttgtc taaacatact attaagttct aaaacatcat ttaatgcctt ctcaatgtct 11580
tctgtaaagc tacaaagata atatctatat aaaaataata taagctctct gtgtcctttt 11640
aaatcatatt ctcttagttc acaaagtttt attatgtctt gtattcttcc ataatataaa 11700
cttctttctc tataaatata atttattttg cttggtctac cctttttcct ttcatatggt 11760
tttaattcag gtaaaaatcc attttgtatt tctcttaagt cataaatata ttcgtactca 11820
tctaatatat tgactactgt ttttgattta gagtttatac ttcctggaac tcttaatatt 11880
ctggttgcat ctaaggcttg tctatctgct ccaaagtatt ttaattgatt atataaatat 11940
tcttgaaccg ctttccataa tggtaatgct ttactaggta ctgcatttat tatccatatt 12000
aaatacattc ctcttccact atctattaca tagtttggta taggaatact ttgattaaaa 12060
taattctttt ctaagtccat taatacctgg tctttagttt tgccagtttt ataataatcc 12120
aagtctataa acagtgtatt taactctttt atattttcta atcgcctaca cggcttataa 12180
aaggtattta gagttatata gatattttca tcactcatat ctaaatcttt taattcagcg 12240
tatttatagt gccattggct atatcctttt ttatctataa cgctcctggt tatccaccct 12300
ttacttctac tatgaatatt atctatatag ttctttttat tcagctttaa tgcgtttctc 12360
acttattcac ctccccttct gtaaaactaa gaaaattata tcatattttc aataattatt 12420
aactattctt aaactcttaa taaaaaatag agtaagtccc caattgaaac ttaatctatt 12480
ttttatgttt taatttatta tttttattaa aatattttaa actaaattaa atgattcttt 12540
ttaatttttt actatttcat tccataatat attactataa ttatttacaa ataatatttc 12600
ttcatttgta atatttagat gatttactaa ttttagtttt tatatattaa ataattaatg 12660
tataatttat ataaaaaatc aaaggagctt ataaattatg attatttcca aagatactaa 12720
agatttaatt ttttcaattt taacaatact ttttgtaata ttatgtttaa atttaattgt 12780
atttttttca tataataaag ccgttgaagt aaaccaatcc attttcctta tgatgttatt 12840
attaaattta agttttataa taatatcttt attatattta ttgtttttaa aaaaactagt 12900
gaaatttccg gctttattaa acttattttt aggaatttta ttttcatttt catctttaca 12960
ggatttgatt atatctttaa atatgtttta tcaaatatta tctttttcta aatttatata 13020
tatttttatt atatttatta ttatatatat tttattttta agtttctttc taacagctat 13080
taaaaagaaa cttaaaaata aaaacacgta ctctaaacca ataaataaaa ctatttttat 13140
tattgctgcc ttgattggaa tagtttttag taaaattaat ttcaatattc cacaatatta 13200
tattataagc tagctttgca ttgtactttt caatcgcttc acgaatgcgg ttatctccga 13260
aagataaagt cttttcatct tccttgatga agataagatt ttctccgtct ccgccggcag 13320
aattgaagcg gggtactacg gtatcgtctg cgtcatcttc cgttgtctga tagatgatag 13380
tcataggctc attttcttcc gtttcggtaa aggggatagg ttcgcccttt gagagcaggg 13440
cggcgatgga aagcattaac ttgcttttcc catcgcccgg atctccctgc aatagcgtaa 13500
ctttgccaaa cggaatatac ggataccaca gccactttac ttctttcggc tcgatttcac 13560
ttgccttgat gatttcaaga ggtacgctga aattcatttc gttttcattt agtttcattt 13620
tttcttgttc tccttttctc tgaaaatata aaaaccacag attgatacta aaaccttggt 13680
tgtgttgctt ttcggggctt aaatcaagga aaaatccttg ttttaagcct ttcaaaaaga 13740
aacacaaggt ctttgtacta acctgtggtt atgtataaaa ttgtagattt tagggtaaca 13800
aaaaacaccg tatttctacg atgtttttgc ttaaatactt gtttttagtt acagacaaac 13860
ctgaagttaa ctatttatca attcctgcaa ttcgtttaca aaacggcaaa tgtgaaatcc 13920
gtcacatact gcgtgatgaa cttgaattgc caaaggaagt ataattttgt tatcttcttt 13980
ataatatttc cccatagtaa aaataggaat caaataatca tatcctttct gcaaattcag 14040
attaaagcca tcgaaggttg accacggtat catagataca ttaaaaatgt tttccggagc 14100
atttggcttt ccttccattc tatgattgtt tccataccgt tgcgtatcac tttcataatc 14160
tgctaaaaat gatttaaagt cagacttaca ctcagtccaa aggctggaaa atgtttcagt 14220
atcattgtga aatattgtat agcttggtat catctcatca tatatcccca attcaccatc 14280
ttgattgatt gccgtcctaa actctgaatg gcggtttaca atcattgcaa tataataaag 14340
cattgcagga tatagtttca ttcccttttc ctttatttgt gtgatatcca ctttaacggt 14400
catgctgtaa gtacaaggta cacttgcaaa gtagtggtca aaatactctt ttctgttcca 14460
actattttta tcaatttttt caaataccat ctaagttccc tctcaaattc aagtttatcg 14520
ctctaatgaa caaagatatt ataccacatt tttgtgaatt tttcaacttg cccacttcga 14580
ctgcactccc gacttaataa cttcttgaac acttgccgaa aaagaaaaac tgccgggtac 14640
gtacccggga tcgatccccg ccgagcgctt agtgggaatt tgtacccctt atcgatacaa 14700
attccccgta ggcgctaggg acactttttc actcgttaaa aagttttgag aatattttat 14760
atttttgttc atgtaatcac tccttcttaa ttacaaattt ttagcatcta atttaacttc 14820
aattcctatt atacaaaatt ttaagatact gcactatcaa cacactctta agtttgcttc 14880
taagtcttat ttccataact tcttttacgt ttccgggtac aattcgtaat catgtcatag 14940
ctgtttcctg tgtgaaattc ttatccgctc acaattccac acaacatacg agccggaagc 15000
ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 15060
tcactgcccg ctttccagtc gggaaacctg tcgtgccaga aaacttcatt tttaatttaa 15120
aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 15180
ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 15240
ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 15300
tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 15360
gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 15420
agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 15480
taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 15540
gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 15600
gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 15660
caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 15720
aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 15780
tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 15840
acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 15900
ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 15960
gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 16020
tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 16080
agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc 16140
tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca 16200
cacaggaaac agctatgacc atgattac 16228