来自睾丸酮丛毛单胞菌5-magam-4d的编码腈水合酶和酰胺酶的核酸片段以及表达所述...的制作方法

文档序号:426379阅读:416来源:国知局
专利名称:来自睾丸酮丛毛单胞菌5-magam-4d的编码腈水合酶和酰胺酶的核酸片段以及表达所述 ...的制作方法
技术领域
本发明涉及分子生物学领域,和用于分离和在重组微生物中表达外源基因的方法。更具体地讲,本发明涉及来自睾丸酮丛毛单胞菌(Comamonas testosteroni)5-MAGAM-4D的编码腈水合酶(NHase)或酰胺酶(Am)的核酸片段(基因)的分离,测序,和重组表达,其中,Nhase可用于催化某些腈水合成相应的酰胺,而酰胺酶被用于将某些酰胺水解成相应的羧酸。
背景技术
腈水合酶能催化在腈上添加一个水分子,导致根据反应1形成相应的酰胺反应1类似地,用于生产羧酸的方法是已知的,并且使用能产生具有酰胺酶(Am)活性的酶的微生物。一般,根据反应2,酰胺酶能将反应1的酰胺产物转化成相应的羧酸和氨反应2已知多种细菌属具有多种腈水合酶和酰胺酶活性谱,包括红球菌属,假单胞菌属,产碱杆菌属,节杆菌属,芽孢杆菌属,杆菌属,短杆菌属,棒状杆菌属,和微球菌属(Martinkova和Kren,Biocatalysisand Biotransformation,2073-93(2002);Cowan等,Extremophiles,2207-216(1998))。例如,腈水合酶业已从绿针假单胞菌(Pseudomonas chlororaphis)B23(Nishiyama等,J.Bacteriol.,1732465-2472(1991)),紫红红球菌(Rhodococcusrhodochrous)J1(Kobayashi等,Biochem.Biophys.Acta,112923-33(1991)),短杆菌种312(Mayaux等,J.Bacteriol.,1726764-6773(1990)),红球菌种N-774(Ikehata等,Eur.J.Biochem.,181563-570(1989)),和恶臭假单胞菌(Pseudomonas putida)5B NRRL-18668(Payne等,Biochemistry,365447-5454(1997))中分离。
业已将已知具有腈水合酶活性的野生型微生物用于将腈转化成相应的酰胺。Nagasawa等(Appl.Microbiol.Biotechnol.,40189-195(1993))比较了三种微生物腈水合酶催化剂,业已将这些催化剂用于由丙烯腈商业化生产丙烯酰胺,与紫红红球菌J1的腈水合酶活性相比,短杆菌R312和绿针假单胞菌B23的腈水合酶活性在10℃以上的温度下是不稳定的。Cowan等(同上)报道了很多嗜温腈水合酶是明显不稳定的,在20-35℃的生长温度范围内具有非常短的酶活性半衰期。除了温度不稳定性之外,含有腈水合酶的微生物催化剂容易被高浓度的诸如丙烯腈的某些底物灭活。在商业用途上,在使用短杆菌R312和绿针假单胞菌B23催化剂时,将丙烯腈的浓度保持在1.5-2wt%,而紫红红球菌J1使用最高达7wt%的浓度(Nagasawa等,同上)。类似地,Padmakumar和Oriel(Appl.Biochem.Biotechnol.,77-79671-679(1999))报道了芽孢杆菌BR449能表达热稳定性腈水合酶,但是在用于将丙烯腈水合为丙烯酰胺时,只有在丙烯腈的浓度为2wt%时会使所述酶失活,使得这种催化剂不适合商业用途。Webster等(Biotechnology Letters,2395-101(2001))比较了用作丙烯酸铵生产的催化剂的两种红球菌属分离物(一种分离物只具有腈水解酶活性,而另一种只具有组合的腈水合酶和酰胺酶活性),并且得出这样的结论,所述具有组合的腈水合酶和酰胺酶活性的所述催化剂因为以下原因而不太优选(a)难以以需要的比例诱导两种酶,(b)这两种酶(腈水合酶和酰胺酶)容易被丙烯腈灭活,和(c)相应的产物能抑制这两种酶。
除了使用野生型生物之外,包括用于表达腈水合酶的异源基因的重组生物同样已知可以转化腈。例如Cerebelaud等(WO 9504828)披露了从睾丸酮丛毛单胞菌中分离的腈水合酶基因的分离和在大肠杆菌中的表达。所述转化过的宿主能将腈有效地转化成酰胺,包括由一个腈和一个羧酸基团组成的底物。Endo等披露了表达红球菌N-771的腈水合酶的大肠杆菌转化体的生产(US 6,316,242B1)。类似地,Beppu等(EP 5024576)披露了来自红球菌属的携带有腈水合酶和酰胺酶基因的质粒,它能够转化大肠杆菌,其中,转化过的宿主随后能够利用异丁腈和异丁酰胺作为酶促底物。业已在大肠杆菌中超量生产了来自恶臭假单胞菌5B的立体选择性腈水合酶(Wu等,Appl.Microbiol.Biotechnol.,48704-708(1997);US 5,811,286)。
业已在重组生物中对编码具有酰胺酶活性的酶的基因进行了克隆,测序,和表达。例如,Azza等(FEMS Microbiol.Lett.,122129(1994))披露了来自短杆菌R312的酰胺酶基因在天然启动子的控制下在大肠杆菌中的克隆和超量表达。类似地,Kobayashi等(Eur.J.Biochem.,217327(1993))披露了来自紫红红球菌J1的腈水合酶和酰胺酶基因的克隆,以及它们在大肠杆菌中的共同表达。Wu等(DNA Cell Biol.,17915-920(1998);US 6,251,650)报道了来自恶臭假单胞菌5B的编码酰胺酶的基因在大肠杆菌中的克隆和超量表达。
申请人以前业已分离了睾丸酮丛毛单胞菌5-MGAM-4D(ATCC55744;US 5,858,736和US 5,922,589)。业已证实睾丸酮丛毛单胞菌5-MGAM-4D包括热稳定性,区域特异性的腈水合酶(EC 4.2.1.84)和酰胺酶(EC 3.5.1.4)活性,可用于将多种腈转化成它们相应的酰胺和羧酸。申请人以前业已披露了说明睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶和酰胺酶活性的用途的方法。上述用途包括由脂族α,ω-二腈区域选择性制备内酰胺(US 5,858,736),将3-羟基腈生物转化成3-羟酸(US 2002/0039770A1),并且将异丁烯腈和丙烯腈生物转化成它们相应的羧酸(USSN10/067,652),以上文献被收作本文参考。不过,来自睾丸酮丛毛单胞菌5-MAGAM-4D的编码腈水合酶和酰胺酶的核酸片段的分离和重组表达一直是令人困惑的。
要解决的问题是提供来自睾丸酮丛毛单胞菌5-MGAM-4D的编码热稳定性,区域选择性腈水合酶和酰胺酶的基因,并且提供表达所述催化剂的转化体。
另外,采用具有腈水合酶/酰胺酶活性的微生物催化剂有效地生产酰胺和羧酸的工业方法的开发一直是困难的。利用所述催化剂由相应的腈制备所述产物的很多方法不能以足以符合商业需要的高浓度生产并且积累产物,或者容易发生酶失活(在反应过程中需要低浓度的腈),或者在反应过程中出现产物抑制作用。
要解决的其他问题一直是缺少能够以高产量,高浓度,和高选择性为特征,并且与已知的腈水解化学方法相比具有额外低温和能量要求以及较少的废物产生的额外优点的方法将腈转化成相应的酰胺和酸的易用的微生物催化剂。睾丸酮丛毛单胞菌5-MGAM-4D能表达热稳定性,区域选择性腈水合酶,以及热稳定性酰胺酶。仅具有睾丸酮丛毛单胞菌5-MGAM-4D的腈水合酶活性的酶催化剂在只需要来自腈水合的酰胺产物的用途中是非常有用的。
发明概述申请人业已分离了表达来自睾丸酮丛毛单胞菌5-MAGAM-4D的热稳定性,区域选择性腈水合酶和酰胺酶的基因并且进行了测序。还披露了每一种酶的相应的氨基酸序列。本发明还涉及1)分离的多核苷酸,它所编码的多肽与SEQ ID NO4所示的来自睾丸酮丛毛单胞菌5-MGAM-4D的腈水合酶的多肽α-亚基具有90-98%的同一性;2)分离的多核苷酸,它所编码的多肽与SEQ ID NO6所示的来自睾丸酮丛毛单胞菌5-MAGAM-4D的腈水合酶的多肽β-亚基具有80-90%的同一性;和3)分离的多核苷酸,编码具有酰胺酶活性,并且与SEQ ID NO17所示的来自睾丸酮丛毛单胞菌5-MAGAM-4D的多肽具有90-95%的同一性的多肽。
本发明还提供了包含在0.9kb片段中的睾丸酮丛毛单胞菌5-MGAM-4D基因组的一个区域(SEQ ID NO9),它编码的多肽(被命名为″PK7″;并且如SEQ ID NO14所示)是腈水合酶的最佳活性所必需的。
提供了能够分别表达腈水合酶或酰胺酶或同时表达这两种酶的转化体。还提供了在重组宿主中生产腈水合酶和酰胺酶催化剂的方法。本发明还提供了用编码与PK7附属蛋白组合的酰胺酶和/或腈水合酶的多核苷酸转化过的重组宿主。
本发明的具体实施方案是用SEQ ID NO11所示核酸序列转化过的大肠杆菌。
本申请人还提供了用于使用表达来自睾丸酮丛毛单胞菌5-MAGAM-4D的腈水合酶的转化过的宿主细胞,将多种脂族或芳香族腈,不饱和腈,脂族二腈,和2-,3-,或4-羟基腈转化成相应的酰胺的方法。睾丸酮丛毛单胞菌5-MGAM-4D表达热稳定性,区域选择性腈水合酶,以及热稳定性酰胺酶。本申请披露了仅具有睾丸酮丛毛单胞菌5-MGAM-4D的腈水合酶活性的微生物转化体的制备,可将它用于仅仅需要通过腈水合单独生产酰胺产物的应用中。
附图的简要说明,序列描述,和生物学保藏通过共同构成本申请的附图,序列表,生物学保藏,以及详细说明,可以更全面地理解本发明。


图1表示插入若干质粒中的核酸片段,它是为了重组表达来自睾丸酮丛毛单胞菌5-MAGAM-4D(ATCC 55744)的克隆的基因而制备的。
以下序列符合37C.F.R.1.821-1.825(″Requirements forPatent Applications Containing Nucleotide Sequences and/orAmino Acid Sequence Disclosures-the Sequence Rules″),并且与世界知识产权组织(WIPO)标准ST.25(1998)和EPO和PCT的序列表要求(Rules 5.2和49.5(a-bis),和Section 208以及AnnexC of the Administrative Instructions)一致。用于核苷酸和氨基酸序列数据的符号和格式符合37C.F.R.§1.822的规定。
SEQ ID NO1是编码来自恶臭假单胞菌5B(NRRL-18668)的腈水合酶的α-亚基的核酸序列,它被用于探测来自睾丸酮丛毛单胞菌5-MGAM-4D(ATCC 55744)基因组DNA片段。
SEQ ID NO2是编码来自恶臭假单胞菌5B(NRRL-18668)的腈水合酶的β-亚基的核酸序列,它被用于探测来自睾丸酮丛毛单胞菌5-MGAM-4D的(ATCC 55744)基因组DNA片段。
SEQ ID NO3是编码来自睾丸酮丛毛单胞菌5-MAGAM-4D的腈水合酶的α-亚基的核酸序列。
SEQ ID NO4是来自睾丸酮丛毛单胞菌5-MAGAM-4D的腈水合酶的α-亚基的推测的氨基酸序列。
SEQ ID NO5是编码来自睾丸酮丛毛单胞菌5-MAGAM-4D的腈水合酶的β-亚基的核酸序列。
SEQ ID NO6是来自睾丸酮丛毛单胞菌5-MAGAM-4D的腈水合酶的β-亚基的推测的氨基酸序列。
SEQ ID NO7是编码来自睾丸酮丛毛单胞菌5-MGAM-4D的腈水合酶的α-和β-亚基的核酸序列,它被用于制备pSW131。
SEQ ID NO8是两个引物中的第一个(″引物1″),它被用于扩增核酸片段(SEQ ID NO7),以便制备质粒pSW131,并且用于扩增核酸片段(SEQ ID NO11),以便制备pSW137。
SEQ ID NO9是两个引物中的第二个(″引物2″),可用于扩增核酸片段(SEQ ID NO7),以便制备质粒pSW131。
SEQ ID NO10是来自睾丸酮丛毛单胞菌5-MAGAM-4D的0.9kb核酸片段的核酸序列,它包括编码附属蛋白(被表示为″P7K″)的小的开放读框(ORF),可用于表达活性腈水合酶。
SEQ ID NO11是编码来自睾丸酮丛毛单胞菌5-MGAM-4D的腈水合酶的α-和β-亚基的核酸序列和0.9kb的下游DNA(SEQ ID NO.10),它编码附属蛋白P7K,它被用于制备pSW132和pSW137。
SEQ ID NO12是两个引物中的第二个(″引物3″),可用于扩增核酸片段(SEQ ID NO11),以便制备pSW137,并且用于扩增核酸片段(SEQ ID NO23),以便制备pSW136。
SEQ ID NO13是编码附属蛋白P7K的核酸序列,并且存在于睾丸酮丛毛单胞菌5-MAGAM-4D的0.9kb的下游DNA序列(SEQ ID NO10)上。
SEQ ID NO14是附属蛋白P7K的推测的氨基酸序列,它可用于睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶的重组表达。
SEQ ID NO15是包括pKP57插入片段的前0.6kb的核酸片段的核酸序列,它可用作鉴定来自睾丸酮丛毛单胞菌5-MAGAM-4D的酰胺酶的探针序列。
SEQ ID NO16是编码来自睾丸酮丛毛单胞菌5-MAGAM-4D的酰胺酶的核酸序列。
SEQ ID NO17是来自睾丸酮丛毛单胞菌5-MAGAM-4D的酰胺酶的推测的氨基酸序列。
SEQ ID NO18是来自睾丸酮丛毛单胞菌5-MAGAM-4D的7.4kb核酸片段的核酸序列,它包括酰胺酶和腈水合酶以及P7K附属蛋白的完整的编码序列。
SEQ ID NO19是两个引物中的第一个(″引物4″),可用于扩增编码来自睾丸酮丛毛单胞菌5-MAGAM-4D的酰胺酶的核酸片段,以便制备质粒pKP60。
SEQ ID NO20是两个引物中的第二个(″引物5″),可用于扩增编码来自睾丸酮丛毛单胞菌5-MAGAM-4D的酰胺酶的核酸片段,以便制备质粒pKP60。
SEQ ID NO21是两个引物中的第一个(″引物6″),可用于扩增编码来自睾丸酮丛毛单胞菌5-MAGAM-4D的酰胺酶的核酸片段,以便制备质粒pSW133,并且用于扩增核酸片段(SEQ ID NO23),以便制备pSW136。
SEQ ID NO22是两个引物中的第二个(″引物7″),可用于扩增编码来自睾丸酮丛毛单胞菌5-MAGAM-4D的酰胺酶的核酸片段,以便制备质粒pSW133。
SEQ ID NO23是编码来自睾丸酮丛毛单胞菌5-MGAM-4D的酰胺酶,腈水合酶(α-和β-亚基),和附属蛋白P7K的核酸片段,它被用于制备质粒pSW136。
申请人业已按照布达佩斯条约有关用于专利方法目的的微生物保藏的国际认可的规定进行了以下生物学保藏
在本文中,″ATCC″表示国际保藏机构美国典型培养物保藏中心,10801 University Blvd.,Manassas,VA 20110-2209,USA。″国际保藏名称″是在ATCC保藏的培养物的保藏号。
在本文中,″NRRL″表示Northern Regional ResearchLaboratory,Agricultural Research Service Culture CollectionInternational Depository Authority,位于11815 N.UniversityStreet,Peoria,IL 61604 U.S.A。″NRRL No.″是在NRRL保藏的培养物的保藏号。
所列出的保藏物应当在所指明的国际保藏机构保藏至少三十(30)年,并且公众在得到披露它的专利授权之后可以获得。保藏物的可利用性并不构成对实施本发明的许可,这种实施会破坏通过政府行为授予的专利权的破坏。
发明的详细说明本发明提供了编码来自睾丸酮丛毛单胞菌5-MAGAM-4D(ATCC55744)的起着催化剂作用的三种肽(腈水合酶的α和β亚基和酰胺酶)的分离的多核苷酸和核酸序列。在共同表达时腈水合酶的α和β亚基能任选将腈水合为相应的酰胺,而酰胺酶能将酰胺水解成相应的羧酸。本发明还提供了能表达所述多肽的转化过的微生物宿主细胞。本发明还提供了使用转化过的微生物生产多肽催化剂的方法,以及将所述催化剂用于将腈转化成相应的酰胺和/或羧酸,或用于将酰胺转化成相应的羧酸的方法。
定义在本说明书中使用了多种术语和缩写。使用以下定义,除非另有说明。
术语″催化剂″,″酶催化剂″或″微生物细胞催化剂″表示具有腈水合酶活性,酰胺酶活性,或具有组合的腈水合酶和酰胺酶活性的多肽(或蛋白)。所述催化剂可以是完整微生物细胞,透化的微生物细胞,微生物细胞提取物的一种或多种细胞成分,部分纯化的酶,或纯化的酶形式。
术语″热稳定性″表示尽管暴露于特定温度,仍然保持活性的酶。
术语″睾丸酮丛毛单胞菌″表示睾丸酮丛毛单胞菌5-MGAM-4D(ATCC 55744)。
术语″恶臭假单胞菌5B″表示恶臭假单胞菌NRRL-18668。
术语″大肠杆菌SW132″表示用质粒pSW132转化过的并且具有ATCC保藏号PTA-5073的大肠杆菌菌株。
术语″pSW132″表示包括编码睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶α-和β-亚基的DNA片段加上0.9kb的受T7启动子控制的下游DNA的质粒。所述0.9kb的下游DNA编码附属蛋白(″P7K″),可用于腈水合酶的重组表达。大肠杆菌菌株SW132携带质粒pSW132,并且它的ATCC保藏号为PTA-5073。
术语″大肠杆菌SW137″表示用质粒pSW137转化过的并且具有ATCC保藏号PTA-5074的大肠杆菌菌株。
术语″pSW137″表示包括编码睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶α-和β-亚基的DNA片段和0.9kb的受trc启动子控制的下游DNA的质粒。0.9kb的下游DNA编码附属蛋白(″P7K″),可用于重组表达腈水合酶。大肠杆菌菌株SW137携带质粒pSW137,并且ATCC为保藏号PTA-5074。
″开放读框″被缩写成ORF。
″聚合酶链反应″被缩写成PCR。
在本文中,″分离的核酸片段″或″分离的多核苷酸″是单链或双链RNA或DNA的聚合物,任选包括合成的,非天然的或改变了的核苷酸碱基。DNA聚合物形式的分离的核酸片段可以由cDNA,基因组DNA,或合成DNA的一个或多个片段组成。
术语″附属核酸″表示0.9kb序列(SEQ ID NO10),它位于腈水合酶α和β亚基基因的下游,它包括编码可用于加强腈水合酶的重组表达的多肽(SEQ ID NO14)的开放读框(SEQ ID NO13)。
术语″互补的″用于表示能够彼此杂交的核苷酸碱基之间的关系。例如,对于DNA来说,腺嘌呤互补于胸腺嘧啶,而胞嘧啶互补于鸟嘌呤。因此,本发明还包括互补于在所附序列表中示出的完整序列的分离的核酸片段。
正如本领域所公知的,术语″百分同一性″是两种或两种以上多肽序列或两种或两种以上多核苷酸序列之间的关系,它是通过比较这些序列确定的。在本领域中,″同一性″还表示多肽或多核苷酸序列之间的序列相关程度,例如可以通过这些序列串之间的匹配程度确定。″同一性″和″相似性″可以通过已知方法方便地计算,这些方法包括,但不局限于在以下文献中所披露的Computational Molecular Biology(Lesk,A.M.,ed.)Oxford University Press,NY(1988);BiocomputingInformatics and Genome Projects(Smith,D.W.,ed.)Academic Press,NY(1993);Computer Analysis of SequenceData,Part I(Griffin,A.M.,and Griffin,H.G.,eds.)HumanaPress,NJ(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987);and SequenceAnalysis Primer(Gribskov,M.and Devereux,J.,eds.)StocktonPress,NY(1991)。确定同一性的优选方法被设计成能提供检测序列之间的最佳匹配。测定同一性和相似性的方法是用可公开获得的计算机程序编辑的。序列比对和同一性百分比计算可以用LASERGENE生物信息计算软件包(DNASTARInc.,Madison,WI)的Megalign程序进行。所述序列的多种比对可以用CLUSTAL比对方法(Higgins andSharp CABIOS.5151-153(1989))进行,使用预设参数(GAPPENALTY=10,GAP LENGTH PENALTY=10)。利用CLUSTAL方法的用于成对比对的预设参数通常为KTUPLE 1,GAP PENALTY=3,WINDOW=5,而DIAGONALS SAVED=5。
″密码子简并性″表示遗传密码允许核苷酸序列改变而又不影响所编码多肽的氨基酸序列的性质。因此,本发明涉及编码SEQ ID NOs4,6,14,和17所示本发明微生物多肽的氨基酸序列的全部或主要部分的任何核酸片段。本领域技术人员十分熟悉由特定宿主细胞在使用核苷酸密码子编码特定氨基酸方面所表现出来的″密码子偏倚″。因此,在合成用于改善在宿主细胞中的表达的基因时,需要设计所述基因,以便它的密码子选择的频率接近宿主细胞的优选的密码子选择的频率。
″合成基因″可以是由寡核苷酸基本单位组装的,这些基本单位是使用本领域技术人员所公知的方法化学合成的。将这些基本单位连接在一起并且退火,以便形成基因片段,这些片段随后酶促组装以构建完整基因。用于表示DNA序列的″化学合成的″,表示所述组成核苷酸是在体外组装的。DNA的人工化学合成可以使用业已完善的方法实现,或自动化学合成可以使用多种商业化仪器中的一种进行。因此,对所述基因进行修饰,以便根据核苷酸序列的优化获得最佳基因表达,以便体现宿主细胞的密码子偏倚。本领域技术人员理解成功的基因表达可能性,如果密码子选择偏向宿主偏好的密码子。优选的密码子的确定可以根据源于宿主细胞的基因的测定,其中,可以获得序列信息。
″基因″表示核酸片段,它能表达特定的蛋白,包括位于编码序列前面的调控序列(5′非编码序列)和位于编码序列后面的调控序列(3′非编码序列)。″天然基因″表示自然界中与它自身的调控序列一起出现的基因。″嵌合基因″表示除了天然基因以外的任何基因,包括在自然状态下不是一起出现的调控序列和编码序列。因此,嵌合基因可以包括来自不同来源的调控序列和编码序列,或来自相同来源的调控序列和编码序列,但是排列方式与天然排列方式不同。″内源基因″表示处在生物的基因组中的天然位点上的天然基因。″外源″基因表示正常情况下不存在于宿主生物中的基因,但是所述基因是通过基因转移导入宿主生物的。外源基因包括插入非天然生物中的天然基因或嵌合基因。″转基因″是业已通过转化方法导入基因组的基因。
″编码序列″表示编码特定氨基酸序列的DNA序列。″合适的调控序列″表示位于编码序列上游(5′非编码序列),内部,或下游(3′非编码序列)的核苷酸序列,并且它能影响相关的编码序列的转录,RNA加工或稳定性,或翻译。调控序列可以包括启动子,翻译前导序列,内含子,聚腺苷酸化识别序列,RNA加工位点,效应物结合位点和茎-环结构。
″启动子″表示能控制编码序列或功能性RNA表达的DNA序列。一般,编码序列位于启动子序列的3′侧,启动子可以完全来自天然基因,或者由来自自然界的不同启动子的不同元件组成,或者甚至包括合成DNA片段。本领域技术人员可以理解的是,不同的启动子可以指导基因在不同类型的组织或细胞,或在发育的不同阶段,或针对不同的环境或生理学条件表达。能够导致基因在大部分细胞类型中在大多数时间中表达的启动子,通常被称作″组成型启动子″。还应当理解的是,由于在大部分场合下,调控序列的确切边界尚未完全确定,不同长度的DNA片段可能具有相同的启动子活性。
术语″可操作地连接的″表示核酸序列缔合在单一核酸片段上,以便一个的功能受到另一个的影响。例如,当启动子能够影响编码序列的表达时,它就是与编码序列可操作地连接的(即,所述编码序列受所述启动子的转录控制)。编码序列可以沿有义或反义方向可操作地与调控序列连接。
在本文中,术语″表达″,表示来自本发明的核酸片段的有义(mRNA)或反义RNA的转录和稳定积累。表达还可以表示mRNA翻译成多肽。
″转化″表示核酸片段转移到宿主生物的基因组中,导致遗传学上稳定的遗传。包括转化的核酸片段的宿主生物被称作″转基因″或″重组″或″转化过的″生物。
术语″碳底物″表示能够由本发明的宿主生物代谢的碳源,并且特别表示选自,但不局限于下组的碳源脂族羧酸或双羧酸,单糖,寡糖,多糖,和一碳底物或它们的混合物。
具有与本发明相关的腈是具有式1R-C≡N或式2N≡C-R-C≡N的腈,其中,N是氮,C是碳,而R选自下组a)C1-C9烷基,它是线性的,分支的或环状的,任选取代的;b)C1-C9链烯基,它是线性的,分支的或环状的,任选取代的;和c)C1-C9芳基,它是任选取代的。式1的R可以用羟基取代。式1的R是在C1,C2,或C3位置上任选用羟基取代的。本发明中特别有用的腈包括,但不局限于,丙烯腈,异丁烯腈,3-羟基丙腈,3-羟基丁腈,3-羟基戊腈,丁腈,己二腈,苄腈,和乙醇腈。
术语″质粒″,″载体″和″盒″表示染色体外元件,它通常携带有不作为细胞的中心代谢的一部分的基因,并且通常是环状双链DNA片段形式的。所述元件可以是自主复制的序列,基因组整合序列,噬菌体或核苷酸序列,线性的或环状的,单链或双链DNA或RNA,可来自任何来源,其中,业已将多种核苷酸序列结合或重组到一个独特的构建体上,该构建体能够将启动子片段和选定的基因产物的DNA序列以及合适的非翻译序列导入细胞。″转化盒″表示包括外源基因,并且具有除了能促进特定宿主细胞转化的外源基因之外的元件的特殊载体。″表达盒″表示包括外源基因,并且具有除了能够增强基因在外源宿主中表达的外源基因之外的元件的特殊载体。
术语″改变了的生物学活性″表示与由微生物核苷酸序列编码的多肽(蛋白)相关的活性,该活性可以通过测定方法测定,其中,所述活性大于或小于与天然微生物序列相关的活性。″增强的生物学活性″表示大于与天然序列相关的活性的改变了的活性。″减弱了的生物学活性″是小于与天然序列相关的活性的改变了的活性。
术语″合适的含水反应混合物″或″合适的反应混合物″表示材料和水,其中腈和/或酰胺底物和酶催化剂接触。本文中披露了合适的含水反应混合物的成分,并且本领域技术人员了解适合这一方法的成分变化的范围。
术语″序列分析软件″表示用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。″序列分析软件″可以是通过商业渠道获得的或独立开发的。典型的序列分析软件包括,但不局限于GCG程序包(Wisconsin Package Version 9.0,Genetics Computer Group(GCG),Madison,WI),BLASTP,BLASTN,BLASTX(Altschul等,J.Mol.Biol.215403-410(1990),和DNASTAR(DNASTAR,Inc.1228S.Park St.Madison,W1 53715USA),和采用了Smith-Waterman算法的FASTA程序(W.R.Pearson,Gomput.MeShods Genome Res.,[Proc.Inl.Symp.](1994),Meeting Date 1992,111-20.Editor(s)Suhai,Sandor.PublisherPlenum,New York,NY)。术语″MEME″表示基于隐藏马尔可夫模型的用于鉴定保守性诊断基序的软件程序(Timothy L.Bailey and Charles Elkan,Fitting a mixturemodel by expectation maximization to discover motifs inbiopolymers,Proceedings of the Second InternationalConference on Intelligent Systems for Molecular Biology,pp.28-36,AAAI Press,Menlo Park,CA(1994))。″MAST″(TimothyL.Bailey and Michael Gribskov,″Combining evidence usingp-valuesapplication to sequence homology searches″Bioinformatics,Vol.14,pp.48-54(1998))是采用来自MEME程序的输出结果,并且在诸如EMBL和SwissProt的蛋白数据库中检索鉴定的基序的程序。在本申请范围内,可以理解的是,当序列分析软件被用于分析时,分析的结果是基于参考的程序的″预设值″的,除非另有说明。在本文中,″预设值″表示任何设定的值或参数,它是在软件第一次初始化时最初加载的。
本发明所采用的标准重组DNA和分子克隆技术为本领域所熟知,并且披露于以下文献中Sambrook,J.,Fritsch,E.F.andManiatis,T.,Molecular CloningA Laboratory Manual,SecondEdition,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY(1989)(以下称之作″Maniatis″);和Silhavy,T.J.,Bennan,M.L.and Enquist,L.W.,Experiments with Gene Fusions,Cold Spring Harbor Laboratory Cold Press Spring Harbor,NY(1984)(以下称之作″Silhavy″);以及Ausubel,F.M.等,CurrentProtocols in Molecular Biology,由Greene Publishing Assoc.andWiley-lnterscience(1987)出版(以下称之作″Ausubel″)。
序列鉴定将来自睾丸酮丛毛单胞菌5-MAGAM-4D的本发明的腈水合酶的α和β亚基和酰胺酶的氨基酸序列与公开的数据库进行比较,发现了最相似的已知序列都来自恶臭假单胞菌5B(NRRL-18668;参见US 5,811,286,和Wu等,Appl.Microbiol.Biotechnol.48704-708(1997))。腈水合酶α-亚基与来自恶臭假单胞菌5B的相应的腈水合酶α-亚基具有大约97.1%的同一性(表1)。腈水合酶β-亚基与来自恶臭假单胞菌5B的相应的腈水合酶β-亚基具有大约82.0%的同一性,最后,酰胺酶与来自恶臭假单胞菌5B的相应的酰胺酶具有大约92.3%的同一性。
表1序列分析结果
a同一性被定义为两种蛋白之间相同氨基酸的百分比。
b相似性被定义为两种蛋白之间相同的或保守的氨基酸的百分比。
c期望值。期望值估算匹配的统计学显著性,对匹配的数量规定特定的得分,在绝对随机地对这种大小的数据库进行检索中预期。
尽管在睾丸酮丛毛单胞菌5-MGAM-4D的腈水合酶和酰胺酶与恶臭假单胞菌5B(NRRL-18668)的相应的酶之间存在序列相似性,所附的实施例证实了睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶(在大肠杆菌转化体SW132中表达)的热稳定性和在反应条件下的稳定性与恶臭假单胞菌5B腈水合酶(在大肠杆菌转化体SW30中表达,Wu等,同上)的不同,并且明显好于后者。
同源物的鉴定本发明的序列可以用作鉴定同源物的杂交试剂。核酸杂交实验的基本成分包括探针,怀疑包括感兴趣的基因或基因片段的样品,以及特定的杂交方法。本发明的探针通常是单链核酸序列,它互补于要检测的核酸序列。探针与要检测的核酸序列是″可杂交″的。探针的长度可以为5个碱基至数万个碱基,并且取决于要进行的具体实验。通常,大约15个碱基-大约30个碱基的探针长度是合适的。只需要探针分子的一部分与要检测的核酸序列互补。另外,探针和靶序列之间的互补性不需要是完全的。在不完全互补的分子之间可以杂交,其结果是,杂交区域的一定比例的碱基不能与正确的互补碱基配对。
杂交方法是相当完善的。通常,探针和样品必须在使核酸能够杂交的条件下混合。这涉及到让所述探针和样品在存在无机或有机盐的条件下,在适当的浓度和温度条件下接触。探针和样品核酸必须接触足够长的时间,使得探针和样品之间的任何可能的杂交能够发生。混合物中探针或靶的浓度将决定发生杂交所必须的时间。探针或靶浓度越高,所需要的杂交培养时间越短。可任选添加离液剂。离液剂通过抑制核酸酶活性稳定核酸。另外,离液剂使得短的寡核苷酸探针能够在室温下进行灵敏的和严格的杂交(Van Ness and Chen,Nucl.AcidsRes.,195143-5151,(1991))。合适的离液剂包括盐酸胍,硫氰酸胍,硫氰酸钠,四氯乙酸锂,高锰酸钠,四氯乙酸铷,碘化钾,和三氟乙酸铯等。通常,离液剂以大约3M的最终浓度存在。如果需要,可以将甲酰胺添加到杂交混合物中,通常为30-50%(v/v)。
可以采用各种杂交溶液,通常这些溶液占极性有机溶剂的大约20-60%的体积,优选30%。常见的杂交溶液采用大约30-50%v/v甲酰胺,大约0.15-1M氯化钠,大约0.05-0.1M缓冲液,如柠檬酸钠,Tris-HCl,PIPES或HEPES(pH范围为大约6-9),大约0.05-0.2%洗涤剂,如十二烷基硫酸钠,或0.5-20mM EDTA,FICOLL(大约300-500千道尔顿),聚乙烯吡咯烷酮(大约250-500kdal),和血清白蛋白。在典型的杂交溶液中还包括未标记过的载体核酸,浓度为0.1-5mg/mL,片段化的核酸DNA,例如,小牛胸腺或鲑鱼精子DNA,或酵母RNA,并且任选含有大约0.5-2%wt./vol的甘氨酸。还可以使用其他添加剂,如体积排阻剂,它包括多种极性水溶性或可膨胀的试剂,如聚乙二醇,阴离子聚合物,如聚丙烯酸酯或聚甲基丙烯酸酯,和阴离子糖类聚合物,如硫酸葡聚糖。
核酸杂交适用于多种测定形式。最适合的方案之一是夹心测定形式。夹心测定特别适用于在非变性条件下杂交。夹心类型的测定的主要成分是固体支持物。固体支持物在它上面吸附了或共价偶联了固定化的核酸探针,这些探针是未标记过的,并且互补于序列的一部分。
微生物重组表达本发明序列的基因和基因产物可以是在异源宿主细胞中生产的,特别是在微生物宿主细胞中生产的。在重组微生物宿主中的表达可用于表达各种途径中间产物;用于调节业已存在于宿主中的途径,或用于利用所述宿主合成迄今为止不可能合成的新的产物。
用于表达本发明的基因和核酸片段表达的优选的异源宿主细胞是广泛存在于真菌或细菌家族中的微生物宿主,并且它能够在大范围的温度,pH值,和溶剂耐受性条件下生长。例如,预计任何细菌,酵母,和丝状真菌都是适合本发明核酸片段表达的宿主。无论细胞饲料如何,转录,翻译和蛋白合成装置都是相同的,功能基因的表达与用于产生细胞生物物质的碳源无关。大规模微生物生长和功能基因表达可以使用多种简单的或复杂的碳水化合物,有机酸和醇,饱和烃,如对于光合或化学自养宿主来说的甲烷或二氧化碳。不过,可以通过特殊生长条件调控,抑制或阻遏所述功能基因,这些条件包括氮,磷,硫,氧,碳,或任何包括小的无机离子的微量养分的形式和用量。另外,功能基因的调控可以通过使用或不使用特殊调控分子而实现,这些调控分子被添加到培养物中,并且通常不被认为是养分或能源。
宿主菌株的例子包括,但不局限于细菌,真菌,或酵母菌物种,如曲霉属,木霉属,糖酵母属,毕赤酵母属,假丝酵母属,汉逊酵母属,沙门氏菌属,芽孢杆菌属,不动杆菌属,发酵单胞菌属,土壤杆菌属,赤细菌属,绿菌属,色素菌属,黄杆菌属,噬细胞菌属,红细菌属,红球菌属,链霉菌属,短杆菌属,棒状杆菌属,分支杆菌属,异常球菌属,埃希氏菌属,欧文氏菌属,泛菌属,假单胞菌属,鞘氨醇单胞菌属,甲基单胞菌属,甲基细菌属,甲基球菌属,甲基弯曲菌属,甲基微菌属,甲基孢囊菌属,甲基杆菌属,产碱杆菌属,集胞蓝细菌属,聚球蓝细菌属,鱼腥蓝细菌属,硫杆菌属,甲烷杆菌属,克氏杆菌属,粘球菌属,和葡萄球菌属。
包括能指导外源蛋白高水平表达的调控序列的微生物表达系统和表达载体为本领域技术人员所公知。它们中的任意一种都可用于构建用来表达本发明的腈水合酶,酰胺酶,和PK7的嵌合基因。然后可以通过转化将所述嵌合基因导入合适的微生物,以便提供所述酶的高水平表达。
因此,预计,例如,将受合适的启动子控制的编码本发明细菌酶的嵌合基因导入,会表现出增强了的腈向酰胺和/或羧酸的转化。预计,它可用于在天然宿主细胞,以及在异源宿主中表达本发明的基因。将本发明的基因导入天然宿主,会导致现有腈水合酶和酰胺酶活性水平的改变。另外,还可将本发明的基因导入非天然宿主细菌,其中,可以操作现有的腈-酰胺-羧酸途径。
用于转化合适宿主细胞的载体或盒为本领域所熟知。通常,所述载体或盒包括指导相关基因转录和翻译的序列,选择标记,和能够进行自主复制或染色体整合的序列。合适的载体包括基因的5′区,它具有转录起始控制作用,以及DNA片段的3′区,它能控制转录终止。最优选的是,这两种控制区来自与转化过的宿主细胞同源的基因,不过,可以理解的是,这些控制区不一定来自被选择用作生产宿主的特定物种的天然的基因。
用于驱动本发明的ORF在需要的宿主细胞中表达的起始控制区或启动子是多种多样的,并且为本领域技术人员所熟知。实际上,能够驱动这些基因的任何启动子都适用于本发明,包括,但不局限于CYC1,HIS3,GAL1,GAL10,ADH1,PGK,PHO5,GAPDH,ADC1,TRP1,URA3,LEU2,ENO,TPI(可用于在糖酵母属中表达);AOX1(可用于在毕赤酵母中表达);和lac,ara,tet,trp,IPL,IPR,T7,tac,和trc(可用于在大肠杆菌中表达)以及amy,apr,npr启动子和各种噬菌体启动子可用于在芽孢杆菌属中表达。
终止控制区还可以来自优选宿主的各种天然基因。终止位点可任选是不必要的;不过,如果包括它,是最优选的。
操作遗传途径的方法是本领域中常见的和众所周知的。可以通过多种方法对特定途径中的选定的基因进行上调和下调。另外,可以通过基因破坏和类似技术消除或增强竞争途径。
一旦鉴定了关键的遗传途径,并且进行了测序,就可以上调特定基因,以便增加该途径的产物。例如,可以通过诸如pBR322的多拷贝质粒将额外拷贝的靶基因导入宿主细胞。另外,可以对靶基因进行修饰,以便它受非天然启动子的控制。如果需要一种途径在细胞周期或发酵过程的特定点工作,可以用受调控的或诱导型启动子替代靶基因的天然启动子。类似地,在某些场合下,可以对所述天然或内源启动子进行修饰,以便增强基因表达。例如,可以通过突变,缺失和/或取代在体内改变内源启动子(参见,Kmiec,US 5,565,350;Zarling等,PCT/US93/03868)。
另外,可能必须减弱或消除在一种途径或能够起着能量或碳的竞争接收器作用的竞争途径上的某些基因的表达。业已研究了用于这一目的的下调基因的方法。当要破坏的基因的序列是已知的时候,基因下调的最有效的方法之一是定向的基因破坏,其中,将外源DNA插入结构基因,以便破坏转录。这一目的可以通过制备遗传盒实现,它包括要插入的DNA(通常是遗传标记),其旁侧是与要破坏的基因的部分高度同源的序列。将所述盒导入宿主细胞,通过细胞的天然DNA复制机制导致了外源DNA插入结构基因(Hamilton等,J.Bacteriol.1714617-4622(1989);Balbas等,Gene 136211-213(1993);Gueldener等,Nucleic Acids Res.242519-2524(1996);和Smith等,Methods Mol.Cell.Biol.5270-277(1996))。
反义技术是下调基因的另一种方法,其中,靶基因的序列是已知的。为了实现这一目的,对来自需要的基因的核酸片段进行克隆,并且可操作地与启动子连接,以便可以转录RNA的反义链。然后将该构建体导入宿主细胞,并且产生RNA的反义链。反义RNA能通过积累编码感兴趣的蛋白的mRNA抑制基因表达。本领域技术人员可以理解的是,特殊因素与利用反义技术减弱特定基因的表达相关。例如,反义基因的适当的表达水平,可能需要使用不同的嵌合基因,采用本领域技术人员所公知的不同的调控元件。
尽管当序列已知时,定向的基因破坏和反义技术提供了下调基因的有效方式,业已开发了其他特异性较低的方法,这些方法不是基于序列的。例如,细胞可以暴露于UV辐射,然后筛选需要的表现型。用化学试剂进行的诱变同样能有效产生突变体,并且通常使用包括能影响非复制DNA的化合物的物质,如HNO2和NH2OH,以及能影响复制DNA的试剂,如吖啶染料,特别是用于导致移码突变。利用辐射或化学试剂产生突变体的具体方法在本领域中有大量的记载(例如,参见ThomasD.Brock in BiotechnologyA Textbook ofIndustrial Microbiology.Second Edition(1989)SinauerAssociates,Inc.,Sunderland,MA.(以下称之作″Brock″),orDeshpande,Mukund V.,Appl.Biochem.Biotechnol.,36227(1992)(以下称之作″Deshpande″))。
基因破坏的另一种非特异性方法是使用可转座元件或转座子。转座子是能随机插入DNA的遗传元件,但是,随后可以根据要测定的序列回收,以便确定是否发生了插入。体外和体内转座方法都是已知的,这两种方法都涉及可转座元件与转座酶的组合使用。当可转座元件或转座子与核酸片段在存在转座酶的条件下接触时,可转座元件能随机插入核酸片段。该技术可用于随机诱变和基因分离,因为可以根据可转座元件的序列鉴定破坏的基因。用于体外转座的试剂盒可以通过商业渠道获得(例如,参见The Primer Island Transposition试剂盒,可以从PerkinElmer Applied Biosystems,Branchburg获得,NJ,基于酵母Ty1元件;The Genome Priming系统,可以从New EnglandBiolabs,Beverly,MA获得;基于细菌转座子Tn7;和EZ∷TNTransposon Insertion系统,可以从Epicentre Technologies,Madison,Wi获得,基于Tn5细菌可转座元件)。
生物催化剂的工业生产本发明披露的利用携带腈水合酶催化剂的转化体制备酰胺的生物催化剂(由α和β亚基的基因编码,并且任选由附属蛋白P7K的基因编码),以及用于利用本发明所披露的酰胺酶由酰胺制备羧酸的商业化生产,可以利用多种培养方法进行。特定基因产物的大规模生产可以通过分批和连续培养方法生产。
典型的分批培养方法是封闭的系统,其中,培养基的组成是在培养开始时确定的,并且在培养过程中不进行人工改变。因此,在培养过程开始时,用需要的生物接种所述培养基,并且在不对该系统增加任何物质的情况下让它生长或进行代谢活动。不过,通常,“分批”培养是针对碳源的添加而言的分批,并且通常试图控制诸如pH和氧浓度的因素。在分批系统中,该系统的代谢物和生物物质组成一致地改变,直到培养结束。在分批培养中,细胞通过静止停滞期到高速生长对数期并最终到达稳定期,其中,在稳定期生长速度降低或停止。如果不进行处理。处在静止期的细胞最终会死亡。对数期的细胞通常决定最终产物或在某些系统中的中间产物的产量。静止期或指数期后生产可以在其他系统中获得。
标准分批系统的变化形式是补料分批系统。补料分批培养方法同样适用于本发明,并且包括典型的分批系统,所不同的是,随着培养的进行,以增量形式添加底物。当代谢物抑制倾向于抑制细胞的代谢以及当培养基中需要具有有限量的底物时,可以使用补料分批系统。要测定补料分批系统的实际底物浓度是困难的,因此,根据可测定因素,如pH,溶解的氧气,以及诸如CO2的废气的分压的变化进行估算。分批和补料分批培养方法是公知的,并且为本领域所熟知,其例子可以参见Brock(同上)和Deshpande(同上)。
生物催化剂的商业化生产还可以通过连续培养实现。连续培养是一种开放系统,其中,将特定的培养基连续地添加到生物反应器中,并且同时将等量的条件培养基取出进行加工。连续培养通常将细胞保持在恒定的高液相密度下,其中,细胞主要是在对数期生长。
连续或半连续培养可以调节能够影响细胞生长或最终产物浓度的一种因素或任意数目的因素。例如,一种方法能保持限制养分,如碳源或氮含量处在固定比例上,并且允许所有其他参数处在适当水平上。在其他系统中,可以连续地改变影响生长的多种因素,同时保持细胞浓度恒定,细胞浓度是通过培养基浊度测量的。连续系统试图保持稳态生长条件,因此,通过取出培养基所导致的细胞减少,必须与培养物中的细胞生长速度平衡。调节连续培养方法的养分和生长因子的方法,以及用于使产物形成速度最大化的方法在工业微生物学领域中是众所周知的,并且由Brock,同上详细披露了多种方法。
本发明的发酵培养基必须包括合适的碳底物。合适的碳底物可以包括,但不局限于脂族羧酸和二羧酸(如乳酸或琥珀酸),甘油,单糖(如葡萄糖和果糖),二糖(如乳糖或蔗糖),寡糖(如可溶性淀粉),多糖(如淀粉或纤维素或它们的混合物),以及来自可再生原料(如干酪乳清渗透物,玉米浆,甜菜糖浆,和大麦芽)的未纯化的混合物。另外,所述碳底物还可以是一碳底物,如二氧化碳,甲烷或甲醇,业已证实了它们可以代谢转化成关键的生物化学中间产物。除了一碳和二碳底物之外,还了解嗜甲基生物可以利用多种其他含碳化合物,如甲胺,葡糖胺,和多种氨基酸的代谢活性。例如,已知嗜甲基酵母可以利用来自甲胺的碳形成海藻糖或甘油(Bellion等,Microb.Growth C1 Compd.,[Int.Symp.],7th(1993),415-32.Editor(s)Murrell,J.Collin;Kelly,Don P.PublisherIntercept,Andover,UK)。类似地,各种假丝酵母物种能代谢丙氨酸或油酸(Sulter等,Arch.Microbiol.153485-489(1990))。因此,预计用于本发明的碳源可能包括多种含碳底物,并且只受所使用的微生物的限制。
腈向酰胺或羧酸的生物催化转化含有脂族或芳香族腈的含水反应混合物是通过将腈与合适的酶催化剂的含水悬浮液混合制备的。可以将完整的微生物细胞用作催化剂,而不进行任何预处理,如透化或加热。另外,可以将细胞固定在聚合物基质(例如,藻酸盐,角叉藻聚糖,聚乙烯醇,或聚丙烯酰胺凝胶(PAG))中,或固定在可溶性和不可溶性支持物上(例如,硅藻土,硅石),以便有利于催化剂的回收和再利用。将细胞固定在聚合物基质中或固定在可溶性和不可溶性支持物上的方法业已作过广泛的报道,并且为本领域技术人员所公知。所述酶还可以从微生物细胞中分离,并且直接用作催化剂,或者可以将所述酶固定在聚合物基质中或固定在可溶性和不可溶性支持物上。这些方法业已进行过广泛报道,并且为本领域技术人员所公知(Methods in Biotechnology,Vol.1Immobilization of Enzymes and Cells;Gordon F.Bickerstaff,Editor;Humana Press,Totowa,NJ,USA;1997)。
固定化的或未固定化的完整的微生物细胞,其包括编码具有腈水合酶活性或酰胺酶活性的多肽的基因,或包括编码分别具有腈水合酶和酰胺酶活性的多肽的组合的基因,都可用作催化剂,而不进行任何预处理,如透化,冻融或加热。另外,可以通过本领域技术人员所熟知的方法对微生物细胞进行透化(例如,用甲苯,洗涤剂,或冻融进行处理),以便提高材料向细胞中扩散以及从细胞中扩散出去的速度。用于透化微生物细胞的方法为本领域技术人员所熟知(Felix,H.,Anal.Biochem.,120211-234(1982))。
在本发明中被用作原材料的脂族或芳香族腈只是中度水溶性的。它们的溶解度还取决于溶液的温度和在水相中的盐浓度;任选添加缓冲剂,或通过水解相应的酰胺产生羧酸的铵盐是反应混合物中两种可溶的盐的来源。在本发明中,以高于起始脂族或芳香族腈的溶解度极限的浓度水合或水解反应产物,是利用最初由两种相组成的反应混合物实现的水相(包括酶催化剂和溶解的脂族或芳香族腈)和有机相(未溶解的脂族或芳香族腈,任选溶解在不与水相混溶的有机溶剂中)。随着反应的进行,脂族或芳香族腈溶解到水相中,最终产生了产物混合物,根据该产物在水中的溶解度,以及不与水混溶的任选的有机溶液的存在或缺乏,该混合物可以是单相的。
双相反应混合物的水相可至少包括足以导致以下结果的水a)将脂族或芳香族腈完全转化成相应的酰胺或羧酸(取决于是否仅存在活性腈水合酶或是存在活性腈水合酶和酰胺酶的组合),和b)保持酶催化剂的水解活性。该反应还可以通过以与酶促水合或水解反应速度大致相等的速度将脂族或芳香族腈添加到反应混合物中而进行,以便保持单一相含水反应混合物,以便避免在高的原材料浓度下产生酶的底物抑制作用的潜在问题。
在相应的脂族或芳香族腈完全转化时,在产物混合物的溶液中脂族或芳香族酰胺或羧酸的最终浓度可以在0.001M至脂族或芳香族腈在产物混合物中的溶解度极限的范围内。产物能够在反应过程中从反应混合物中沉淀出来,使得酰胺或羧酸能够以超过所述产物在反应混合物中的溶解度的量产生。通常,脂族或芳香族酰胺或羧酸产物在产物混合物中的浓度为0.001M-7.0M。脂族或芳香族酰胺或羧酸还可以从产物混合物中分离(在除去催化剂之后),当所述反应产物是羧酸时,任选通过用浓HCl将反应混合物的pH调节到2.0-2.5,用氯化钠饱和所得到的溶液,并且用合适的有机溶剂,如乙酸乙酯,乙基醚,甲基异丁酮或二氯甲烷提取脂族或芳香族酰胺或羧酸。然后合并有机提取物,用合适的干燥剂(例如硫酸镁)搅拌,过滤,并且除去溶剂(例如通过旋转蒸发),以便以高产量和高纯度(通常纯度为98-99%)生产需要的产物。如果需要,还可以通过重结晶或蒸馏进一步纯化所述产物。
反应混合物中酶催化剂的浓度取决于酶催化剂的比催化活性,并且进行选择,以便获得需要的反应速度。在水解反应中被用作催化剂的微生物细胞的湿细胞重量通常为每毫升的总的反应体积0.001克-0.300克湿细胞,优选每毫升0.002克-0.050克湿细胞;可以按上述方法任选固定所述细胞。所述微生物细胞的比活性(IU/克干细胞重量)是通过使用已知重量的微生物细胞催化剂,在25℃下测定0.10-0.50M的腈底物溶液转化成希望的酰胺或羧酸产物的速度确定的。酶活性的IU被定义为每分钟将一微摩尔底物转化成产物所需要的酶活性的量。
选择水解反应的温度,以便优化反应速度和酶催化剂的稳定性。反应温度可以从略高于反应混合物的凝固点(大约0℃)-65℃,优选的反应温度范围为5℃-45℃。酶催化剂溶液或悬浮液可以通过将未固定的或固定化的细胞悬浮在蒸馏水,或悬浮在缓冲剂的含水反应混合物中而制备,所述缓冲剂能够将反应的起始pH保持在5.0-10.0,优选6.0-8.0,或者通过将固定化的酶催化剂悬浮在类似混合物中,或者通过在类似的混合物中制备细胞提取物,部分纯化的或纯化的酶,或可溶形式的固定化的酶的溶液。在添加腈并且反应进行之后,反应混合物的pH可能因为来自相应的脂族或芳香族腈的腈的腈官能团的羧酸的铵盐的形成而改变(此时使用组合的腈水合酶和酰胺酶)。所述反应可以在不进行pH控制的情况下完全转化腈,或者可以在反应过程中添加合适的酸或碱,以便保持理想的pH。
实施例在下面的实施例中将对本发明作进一步的说明,这些实施例示出了本发明的优选实施方案。通过以上讨论和下面的实施例,本领域技术人员可以确定本发明的基本特征,并且在不超出本发明的构思和范围的前提下,可以对本发明进行各种改变和改进,以便使它适合各种用途和条件。
在以下实施例中,腈的回收百分比,和相应的酰胺和羧酸产物的百分产率是基于存在于反应混合物中的腈的最初浓度的,并且是使用折射率检测器通过HPLC确定的。对3-羟基戊腈,己二腈,丁腈,苄腈,和异丁烯腈,及其相应的反应产物的分析,是使用Supelco LC-18-DB柱(直径为15cm×4.6mm)进行的,在25℃下预置柱,并且存在于7.5%甲醇水溶液中的10mM乙酸,10mM乙酸钠作为洗脱剂以1.5mL/分钟的速度进行洗脱。对乙醇腈,丙烯腈,3-HPN,3-HBN,及其相应的反应产物的分析,是通过HPLC进行的,使用Bio-Rad HPX-87H有机酸分析柱(直径30cm×7.8mm),在50℃预置柱,并且用0.010N H2SO4作为洗脱剂以1mL/分钟的速度洗脱。
一般方法用于实施例中的标准重组DNA和分子克隆技术为本领域所熟知,并且由Maniatis(同上)和Ausubel(同上)披露。
适用于保持和生长细菌培养物的材料和方法为本领域所熟知。适用于以下实施例中的技术可以在以下文献中查阅到Manual ofMethods for General Bacteriology(Phillip Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg and G.Briggs Philips,eds.,American Societyfor Microbiology,Washington,DC(1994))或参见Brock的文献,同上。
在以下说明中的缩写相当于以下测量单位,技术,特性,或化合物″sec″表示秒,″min″表示分钟,″h″表示小时,″d″表示天″mL″表示毫升,″L″表示升,″mM″表示毫摩尔,″M″表示摩尔,″mmol″表示毫摩尔,″rpm″表示每分钟转数,″slpm″表示每分钟标准升,″psig″表示磅/平方英寸,而″wt″表示重量。″HPLC″表示高效液相层析法,″ca″表示大约,″O.D.″表示在特定波长下的光学密度,″dcw″表示干细胞重量,而″IU″表示国际单位。
实施例1鉴定编码睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶的基因组DNA片段在振荡下,在37℃下让睾丸酮丛毛单胞菌5-MGAM-4D(ATCC55744)在LB培养基中生长。使用Puregene DNA分离试剂盒,按照生产商的说明(Gentra Systems,Minneapolis,MN)制备基因组DNA。对EcoRI限制的基因组DNA进行Southern分析(Southern等,J.Mol.Biol.,98503(1975)),用编码腈水合酶α和β亚基(US 5,811,286)的恶臭假单胞菌NRRL-18668基因(SEQ ID NOs1和2)作探针。探针的标记,杂交和检测是使用ECL随机启动标记和检测系统第II版,按照生产商(Amersham International,Buckinghamshire,UK)的说明进行的。α(SEQ ID NO1)和β(SEQ ID NO2)探针各自表现出对相同的5.7kb EcoRI DNA片段的阳性杂交。
实施例2克隆编码睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶的基因组DNA片段制备来自睾丸酮丛毛单胞菌5-MGAM-4D的基因组DNA(实施例1),用EcoRI限制性内切,并且进行标准琼脂糖凝胶电泳。分离大约5-7kb的DNA片段,并且连接到EcoRI限制的pUC19(New EnglandBiolabs,Beverly,MA)上。对该质粒文库进行铺板,并且用恶臭假单胞菌NRRL-18668腈水合酶α-亚基基因探针(SEQ ID NO1)筛选。用ECL随机启动标记和检测系统第II版按照生产商(AmershamInternational)的说明进行探针标记,杂交和检测。分离阳性杂交菌落,并且确定含有5.7kb的插入片段(pKP57)。
实施例3测定编码睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶的基因的核苷酸序列pKP57(实施例2)插入片段的核苷酸序列是使用ABI 377-XL DNA测序仪和BigDye Terminator Cycle测序化学进行的。对所获得的GenBank数据库进行的BlastN分析(Altschul等,Nucleic AcidsRes.,253389-3402(1997)),证实了编码腈水合酶α和β亚基的完整的基因和编码酰胺酶的部分基因的存在。编码腈水合酶α和β亚基的pKP57插入片段的核苷酸序列分别在SEQ ID NO3和SEQ IDNO5中示出。α和β亚基的pKP57插入片段的推测的氨基酸序列分别在SEQ ID NO4和SEQ ID NO6中示出。
BlastP分析是利用腈水合酶α和β亚基的推测的氨基酸序列进行的。结果如表1所示。对本发明的腈水合酶α-亚基的氨基酸序列的最接近的匹配是来自恶臭假单胞菌NRRL-18668的腈水合酶α-亚基(97.1%同一性,97.1%相似性,E值=10e-108)。对本发明的腈水合酶β-亚基的氨基酸序列的最接近的匹配是来自恶臭假单胞菌NERL-18668的腈水合酶β-亚基(82.0%同一性,82.5%相似性,E值=6e-92)。
实施例4在大肠杆菌中生产睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶编码来自睾丸酮丛毛单胞菌5-MGAM-4D的腈水合酶α和β亚基的DNA片段(SEQ ID NO7)是通过标准PCR由pKP57获得的,其中使用GeneAmp试剂盒,按照生产商(Roche,Branchburg,NJ)的方法进行,使用引物1(SEQ ID NO8)和引物2(SEQ ID NO9),并且亚克隆到受T7启动子控制的pGEM-T(Promega,Madison,WI)上,以便制备pSW131。通过标准方法用pSW131转化大肠杆菌BL21(DE3)(Novagen,Madison,WI)。携带pSW131的大肠杆菌BL21(DE3)的生长和诱导是基本上按照Novagen推荐的方法进行的。其改进包括在诱导时添加氯化钴和柠檬酸钠,最终浓度分别为0.01mg/ml和0.1mg/ml。在30℃下进行诱导16小时。通过标准SDS-PAGE分析验证α(23kDa)和β(24kDa)蛋白的产生。
实施例5通过转化的大肠杆菌转化3-羟基戊腈(3-HVN)携带pSW131的大肠杆菌BL21(DE3)细胞的生长和诱导是按照实施例4所述进行的。通过离心收集细胞,用缓冲液(0.1M磷酸钾pH7.0)洗涤2次,并且以100mg湿细胞/ml的密度悬浮在缓冲液中。腈水解酶活性测定混合物包括细胞(50mg/mL),3-羟基戊腈(0.3M)和缓冲液(0.1M磷酸钾,pH7.0),在室温下搅拌。HPLC分析证实了17%的3-HVN在15分钟内转化成相应的酰胺(3-羟基戊酰胺)。
实施例6在大肠杆菌中生产高水平的睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶活性需要下游序列包括编码睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶α和β亚基的DNA片段和受T7启动子控制的编码附属蛋白P7K的0.9kb的下游DNA(SEQ ID NO11)的质粒(pSW132;ATCC PTA-5073)是通过用来自pKP57的相应的BamHI/PstI片段取代pSW131上的较小的BamHI/PstI片段构建的。通过标准方法用pSW132转化大肠杆菌BL21(DE3)(Novagen)。携带pSW132的大肠杆菌BL21(DE3)(″大肠杆菌菌株SW132″)的生长和诱导是按实施例4所述方法进行的,并且通过标准SDS-PAGE分析证实α和β蛋白的生产。
还通过标准PCR,使用GeneAmp试剂盒,按照生产商(Roche)的说明从pKP57获得了编码睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶α和β亚基和编码附属蛋白P7K的0.9kb的下游DNA的DNA片段(SEQID NO11),其中使用引物1(SEQ ID NO8)和引物3(SEQ ID NO12),并且亚克隆到受trc启动子控制的pTrcHis2-TOPO上,以便按照生产商(Invitrogen)的说明在大肠杆菌TOP 10中制备pSW137。携带pSW137的大肠杆菌TOP10的生长和诱导是按实施例4所述方法进行的,并且通过标准SDS-PAGE分析证实α和β蛋白的生产。α和β蛋白在携带pSW132的大肠杆菌BL21(DE3)和在携带pSW137的大肠杆菌TOP10中的生产可以与用携带pSW131的大肠杆菌BL21(DE3)中获得的产量(实施例4)进行定量区分。
携带pSW132的大肠杆菌BL21(DE3)的生长和诱导是按实施例4所述方法进行的。然后通过离心收获细胞,用缓冲液(0.1M磷酸钾pH7.0)洗涤两次,并且以100mg湿细胞/ml的密度悬浮在缓冲液中。腈水合酶活性测定混合物包括细胞(2mg/mL),3-羟基戊腈(0.3M)和缓冲液(0.1磷酸钾,pH7.0),在室温下搅拌。HPLC分析证实了3-羟基戊腈在5分钟之内100%转化成3-羟基戊酰胺。类似地,携带pSW137的大肠杆菌TOP10的腈水合酶活性测定证实了3-羟基戊腈在5分钟之内100%转化成3-羟基戊酰胺。将上述结果与用pSW131获得的结果(实施例5)进行比较,证实了腈水合酶β基因的下游的DNA在获得最大腈水合酶活性方面的重要性(表2)。所述下游核苷酸序列(SEQ ID NO10)包括小的开放读框,它的序列如SEQ ID NO13所示。在SEQ ID NO14中示出了推测的氨基酸序列(被称作P7K)。
表2.表达载体pSW131和pSW132的比较
实施例7测定编码睾丸酮丛毛单胞菌5-MGAM-4D酰胺酶的基因的核苷酸序列制备来自睾丸酮丛毛单胞菌5-MGAM-4D的基因组DNA(实施例1),用PstI限制性内切,并且用标准PCR产物进行Southern分析,该产物包括pKP57(实施例2)插入片段的前0.6kb作为探针(SEQ IDNO15)。探针标记,杂交和检测是使用ECL随机启动标记和检测系统第II版,按照生产商(Amersham International)的说明进行的。该探针能够与2.4kb PstI片段杂交。用PstI消化过的基因组DNA进行标准琼脂糖凝胶电泳。分离大小范围为2-4kb的DNA片段,并且连接到PstI限制的pUC19上。对该质粒文库进行铺平板,并且用相同的0.6kb探针(SEQ ID NO15)筛选。探针标记,杂交和检测是使用ECL随机启动标记和检测系统第II版,按照生产商(AmershamInternational)的说明进行的。分离阳性杂交菌落,并且确定它包括2.4kb的插入片段(pKP59)。
核苷酸测序证实了所述插入片段是与预先克隆的EcoRI DNA片段(pKP57)重叠的DNA片段。因此,通过组合来自pKP57和pKP59的核苷酸序列,确定了酰胺酶基因的完整的核苷酸序列(SEQ ID NO16)。在SEQ ID NO17中示出了推测的酰胺酶氨基酸序列。在SEQ ID NO18中示出了来自睾丸酮丛毛单胞菌5-MGAM-4D的7.4kb DNA片段的核苷酸序列,其中包括酰胺酶和腈水合酶的完整的编码序列。
用推测的酰胺酶氨基酸序列(SEQ ID NO17;表1)进行BlastP分析。最接近的公知的匹配是与来自恶臭假单胞菌NRRL-18668的酰胺酶的序列的匹配(92.3%同一性,92.5%相似性,E值=0)。
实施例8在大肠杆菌生产睾丸酮丛毛单胞菌5-MGAM-4D酰胺酶通过标准PCR,使用GeneAmp试剂盒,按照生产商(Roche)的说明从基因组DNA获得了编码来自睾丸酮丛毛单胞菌5-MGAM-4D的酰胺酶的DNA片段,其中使用引物4(SEQ ID NO19)和引物5(SEQ IDNO20),并且亚克隆到受T7启动子控制的pGEM-T(Promega)上,以便制备pKP60。按照标准方法用pKP60转化大肠杆菌BL21(DE3)(Novagen)。携带pKP60的大肠杆菌BL21(DE3)的生长和诱导是按照Novagen的说明进行的,并且通过标准SDS-PAGE分析证实了酰胺酶蛋白的生产。
还通过标准PCR获得了编码来自睾丸酮丛毛单胞菌5-MGAM-4D的酰胺酶的DNA片段,其中使用引物6(SEQ ID NO21)和引物7(SEQID NO22),并且亚克隆到受trc启动子控制的pTrcHis2 TOPO上,以便按照生产商(Invitrogen)的说明在大肠杆菌TOP10中制备pSW133。携带pSW133的大肠杆菌TOP10的生长和诱导是按照Invitrogen的方法进行的,并且通过标准SDS-PAGE分析证实了酰胺酶蛋白的生产。
实施例9睾丸酮丛毛单胞菌5-MGAM-4D腈水合酶和酰胺酶在大肠杆菌中的共同生产通过标准PCR,使用GeneAmp试剂盒,按照生产商(Roche)的说明,从基因组DNA获得了编码来自睾丸酮丛毛单胞菌5-MGAM-4D的酰胺酶,NHaseα和β,和附属蛋白P7K的DNA片段(SEQ ID NO23),其中使用引物6(SEQ ID NO21)和引物3(SEQ ID NO12),并且亚克隆到受trc启动子控制的pTrcHis2-TOPO(Invitrogen)上,以便制备pSW136。
实施例10大肠杆菌SW132细胞的发酵腈水合酶在14L Braun Biostat C发酵罐(B.Braun BiotechInternational Gmbh,Messungen,Germany)中的生产,是在含有葡萄糖,氨,和酵母提取物的矿质培养基中进行的。大肠杆菌菌株SW132(如实施例6所述的携带质粒pSW132的大肠杆菌BL21(DE3))在接种培养物中生长10小时,然后接种到发酵罐中。在ODλ=550为30-35时,将IPTG(1mM)添加到发酵罐中,并且在添加IPTG 5小时之后收获细胞。
发酵方法容器培养基最初是以7.5L的分批制备的,它含有32gKH2PO4,8.0g MgSO4·7H2O,8.0g(NH4)2SO4,50g酵母提取物,和10mL Mazu DF204防泡剂(BASF Corporation,Mount Olive,NJ)。在消毒之后,添加369g葡萄糖溶液(60%w/w),160mL微量元素溶液(表3),和100mg/L氨苄青霉素。将NH4OH(40%w/v)和20%w/v H2SO4用于控制pH。搅拌,通气,pH,压力,溶解氧浓度(DO),和温度的设定点如下面的表4所示。搅拌下将溶解氧的浓度控制在25%的气体饱和,以便首先随氧的需求增加而升高,然后通气。让500mL种子培养物在2L烧瓶中,在36℃下,以300rpm的速度旋转生长10小时,至ODλ=550>2.0。当发酵罐中培养物密度为20-30OD时,添加额外的AMP使它达到100mg/L的浓度。当培养物的浓度为30-35OD时添加IPTG至1mM。以<5g/L开始补充葡萄糖,并且预定的速度如表5所示。如果积累的葡萄糖超过2g/L,降低葡萄糖补料速度。在添加IPTG 5小时之后,将细胞冷却到5-10℃,并且通过离心收获细胞。收获490g(湿细胞)。在表6中示出了生长和腈水合酶生产的动力学。
表3微量元素溶液
表4进行发酵的条件
表5葡萄糖补料方法
表6生长和腈水合酶生产的动力学
实施例11通过未固定的大肠杆菌SW132细胞将腈水合为相应的酰胺向装有磁力搅拌器的20-mL反应容器中添加0.04,0.4,2.0,或5.0mmol的丙烯腈,异丁烯腈,3-羟基丙腈,3-羟基丁腈,3-羟基戊腈,丁腈,己二腈,苄腈,或乙醇腈,并且添加蒸馏过的去离子水,以便将混合物的最终体积调整到3.0mL。然后向反应容器中添加1.0mL的0.44-8.8mg干细胞重量(dcw)/mL的大肠杆菌SW132细胞在0.10M磷酸钾缓冲液(pH7.0,乙醇腈除外,它在pH6.0制备)中的含水悬浮液(按照实施例10的方法制备),并且在25℃下搅拌该混合物。反应混合物样品(0.100mL)与0.400mL的水混合,然后将0.200mL的稀释过的样品(a)与0.200mL的0.200M丁酸钠(丙烯腈和3-羟基戊腈HPLC标准物),0.200M N-乙基乙酰胺(异丁烯腈HPLC标准物),0.200M异丁酸(丁腈和3-羟基丙腈HPLC标准物),或0.200M丙二酸(3-羟基丁腈HPLC标准物)的水溶液混合,或(b)根据标准曲线测定100%腈转化(5-氰基戊酰胺,己二酰胺,苯甲酰胺,2-羟乙酰胺)时的产物。对所得到的混合物进行离心,并且,通过HPLC分析上清液。
所有反应在100%腈转化时都只能产生酰胺作为水解产物,没有腈水解成相应的羧酸。
表7.通过大肠杆菌SW132细胞将腈水合为相应的酰胺
实施例12利用部分纯化的大肠杆菌SW132细胞的蛋白提取物水合3-羟基戊腈将大肠杆菌SW132细胞(0.4874g)悬浮在2.0mL冷却的破碎缓冲液中,该缓冲液包括1mM DTT和0.1mM PMSF,存在于0.1M磷酸钾缓冲液(pH7)中。将悬浮液(200mg湿细胞重量/mL)加载到French Pressure Mini Cell中,并且以16000-17000psi使细胞破碎。通过在38000RCF的速度下离心15分钟将细胞碎片从得到的混合物中除去。回收了大约1.68mL的提取上清液,它的腈水合酶活性等于199mg湿细胞重量/mL细胞悬浮液。
向装有磁力搅拌器的20-mL反应容器中添加0.4mL的大肠杆菌SW132提取上清液,0.6mL的去离子水,和3mL溶解在水中的0.667M3-羟基戊腈。在25℃下搅拌该反应混合物。反应混合物的样品(0.100mL)与0.100mL的水混合,然后将0.200mL稀释过的样品与0.200mL的0.200M丁酸钠(外部标准物)混合,并且通过HPLC分析。120分钟之后,当3-羟基戊腈100%地转化时3-羟基戊酰胺的产率为99%。
实施例13来自睾丸酮丛毛单胞菌5-MAGAM-4D和恶臭假单胞菌5B细胞的腈水合酶的热稳定性比较将大肠杆菌SW30湿细胞(具有来自恶臭假单胞菌5B的活性腈水合酶)或大肠杆菌SW132湿细胞(具有来自睾丸酮丛毛单胞菌5-MAGAM-4D的活性腈水合酶)在0.50M磷酸缓冲液中的44mg干细胞重量/mL悬浮液在水浴中加热到50℃。在预定时间,将50℃细胞悬浮液的等份样品在水浴中迅速冷却到25℃,并且测定这些悬浮液的残余的腈水合酶活性,这是通过将1.0mL的加热/冷却细胞悬浮液的等份样品25℃下搅拌下添加到水中的3.0mL的0.667M 3-羟基戊腈中。在预定时间将反应混合物样品(0.100mL)取出,并且与0.100mL的水混合,然后将0.200mL的稀释样品与0.200mL的0.200M丁酸钠(外部标准物)混合,离心,并且通过HPLC分析上清液。测定3-羟基戊腈在每一种反应中的水合速度,并且计算细胞的残余腈水合酶比活性。在下面的表8中分别示出了大肠杆菌SW30和大肠杆菌SW132的腈水合酶比活性和酶回收的百分比,它们是50℃下时间的函数。
表8.大肠杆菌SW30和大肠杆菌SW132腈水合酶热稳定性的比较
实施例14睾丸酮丛毛单胞菌5-MGAM-4D和恶臭假单胞菌5B腈水合酶将丙烯腈水合为丙烯酰胺的比较向20-mL反应容器(装有磁力搅拌器)中添加0.270g(5.1mmol)的丙烯腈和107.6mg干细胞重量的大肠杆菌SW30湿细胞(表达来自恶臭假单胞菌5B的活性腈水合酶)或4.41mg干细胞重量的大肠杆菌SW132湿细胞(表达睾丸酮丛毛单胞菌5-MGAM-4D的活性腈水合酶)在总体积9.664mL的0.10M磷酸钾缓冲液(pH7.0)中形成的悬浮液;选择每个反应中存在的干细胞重量的量,以在反应混合物中提供大致相等的腈水合酶活性(IU/mL)。丙烯腈的最终浓度为0.51M。在25℃下搅拌该混合物。反应混合物的样品(0.200mL)与0.200mL的溶解在水中的0.200M丁酸钠(HPLC标准物)和0.020mL的6N HCl混合。对所得到的样品进行离心,并且,通过HPLC分析上清液。在表9中示出了反应时间,丙烯腈转化%,和丙烯酰胺的%产率。对于用大肠杆菌SW30作为生物催化剂的反应来说,在反应过程中观察到了腈水合酶活性的丧失,并且在延长的反应时间时获得了腈的不完全转化。
表9.大肠杆菌SW30和大肠杆菌SW132在丙烯腈水合反应方面的比较
实施例15睾丸酮丛毛单胞菌5-MGAM-4D和恶臭假单胞菌5B腈水合酶将3-羟基戊腈水合成3-羟基戊酰胺的比较向20-mL反应容器(装有磁力搅拌器)中添加3.0mL的0.204g(2.0mmol)3-羟基戊腈溶解在蒸馏过的去离子水中形成的溶液和大肠杆菌SW30湿细胞(表达恶臭假单胞菌5B的活性腈水合酶)或大肠杆菌SW132湿细胞(表达睾丸酮丛毛单胞菌5-MGAM-4D的活性腈水合酶)的44mg干细胞重量在0.10M磷酸钾缓冲液(pH7.0)中的1.0mL悬浮液。3-羟基戊腈的最终浓度为0.50M。在25℃下搅拌该混合物。反应混合物的样品(0.100mL)与0.100mL的水,0.200mL的溶解在水中的0.200M丁酸钠(HPLC标准物),0.020mL的6N HCl混合。对所得到的混合物进行离心,并且,通过HPLC分析上清液。在表10中示出了反应时间,3-羟基戊腈转化%,和3-羟基戊酰胺的%产率。对于用SW30作生物催化剂的反应来说,在反应过程中观察到了腈水合酶活性的丧失,并且在延长反应时间时获得了不完全的腈转化。
表10.大肠杆菌SW30和大肠杆菌SW132在3-羟基戊腈反应方面的比较
实施例16由大肠杆菌SW137将3-羟基戊腈水合为3-羟基戊酰胺向4-mL反应容器(装有磁力搅拌器)中添加0.75mL的水溶液,该溶液含有0.404M 3-羟基戊腈和0.25mL的18mg干细胞重量的悬浮液,该悬浮液是将大肠杆菌SW137湿细胞(按实施例6所述方法制备)悬浮在0.10M磷酸钾缓冲液(pH7.0)中制备的。大肠杆菌SW137细胞表达的多肽具有来自睾丸酮丛毛单胞菌5-MGAM-4D的腈水合酶活性。3-羟基戊腈的最终浓度为0.303M。在25℃下搅拌该混合物。反应混合物的样品(0.100mM)与0.100mM的水,溶解于水中的0.200mL的0.200M丁酸钠(HPLC标准物),0.020mL的6N HCl混合。对所得到的混合物进行离心,并且通过HPLC分析上清液。10分钟之后,3-羟基戊腈的转化率为100%,而3-羟基戊酰胺的产率为100%。
实施例17在钙交联的藻酸盐中固定大肠杆菌SW132细胞向200mL培养基瓶(装有磁力搅拌棒,并且容纳有温度为50℃的59.7g蒸馏过的去离子水)缓慢添加3.30g FMC BioPolymerPropanalLF10/60藻酸盐,同时快速搅拌。通过快速搅拌将该混合物加热到75-80℃,直到藻酸盐完全溶解,并且在水浴中将所得到的溶液冷却到25℃。向所述藻酸盐悬浮液中添加40.8g大肠杆菌SW132湿细胞糊(22%干细胞重量)和16.2mL的蒸馏水,同时搅拌。25℃下用注射器将细胞/藻酸盐混合物滴加到的640mL的0.20M乙酸钙缓冲液(pH7.0)中,同时搅拌。在搅拌2小时之后,将缓冲液从所得到的珠(82g)中倒出,然后25℃下将所述珠重新悬浮在200mL的0.20M乙酸钙缓冲液(pH7.0)中。通过搅拌,将4.10g溶解在水中的25%wt戊二醛(GA)添加进去,并且在25℃将所述珠混合1.0小时。然后向该悬浮液中添加16.4g聚乙烯亚胺(PEI)(BASF LupasolPR971L,平均分子量大约为750,000)溶解在水中的12.5wt%的溶液,并且在25℃下将所述珠再混合1小时。然后在25℃下用250mL的0.05M乙酸钙缓冲液(pH7.0)洗涤GA/PEI-交联的珠两次,并且在相同的缓冲液中在5℃下储存。
实施例18通过藻酸盐固定的大肠杆菌SW132细胞在连续的分批反应中通过生物催化剂循环将腈(0.50M-3.0M)水合为相应的酰胺向50-mL有套的反应容器(装配有位于上面的搅拌器)(用循环温度浴将温度控制在25℃或35℃)中,添加4.0g的按实施例17所述方法制备的GA/PEI-交联的大肠杆菌SW132细胞/藻酸盐珠。向该反应容器中添加0.2mL的0.20M乙酸钙缓冲液(pH7.0,在反应混合物中具有2.0mM的最终钙离子浓度),10,20,40或60mmol的丙烯腈,异丁烯腈,或3-羟基戊腈,并且通过添加蒸馏过的去离子水将反应混合物的最终体积调整到20mL。在25℃或35℃下搅拌该混合物。将反应混合物的样品(0.100mL)与0.400mL的水混合,然后将0.200mL的稀释过的样品与0.200mL的0.200M丁酸钠(丙烯腈和3-羟基戊腈HPLC外部标准物)或0.200M N-乙基乙酰胺(异丁烯腈HPLC外部标准物)在水中混合。对所得到的混合物进行离心,并且,通过HPLC分析上清液。
在反应结束时(腈100%转化),将产物混合物从催化剂珠中倒出,并且添加额外的蒸馏过的去离子水,0.2mL的0.20M乙酸钙缓冲液(pH7.0,在反应混合物中的最终钙离子浓度为2.0mM)和10,20,40或60mmol的丙烯腈,异丁烯腈,或3-羟基戊腈与反应heel(来自第一次反应的固定化的细胞催化剂和残余的产物混合物)在25℃或35℃下混合。在第二次反应结束时,将产物混合物倒出,并且按前述方法进行第三次方法。反应时间,丙烯酰胺,甲基丙烯酰胺,或3-羟基戊酰胺的产物产率,以及每-轮反应的生物催化剂活性回收百分比如下面的表11所示。
表11.通过固定化的大肠杆菌SW132细胞在连续分批反应中通过生物催化剂循环将腈(0.50M-3.0M)水合成相应的酰胺
实施例19将大肠杆菌SW132细胞固定在角叉藻聚糖中向装有磁力搅棒并且容纳有56.4g 50℃的水的250mL培养基瓶中缓慢添加2.88gκ-角叉藻聚糖(FMC RG300),同时快速搅拌。快速搅拌下将该混合物加热到75-80℃,直到角叉藻聚糖完全溶解,并且将所得到的溶液在热稳定的水浴中冷冻到55-56℃(大约52℃的胶凝温度)。用15分钟时间将18.6g大肠杆菌SW132湿细胞糊(干细胞重量为22.0)在19.7g 0.35M磷酸钠缓冲液(pH7.3)中的悬浮液加热到50℃,然后添加到温度为55-56℃的角叉藻聚糖溶液中,同时搅拌。然后马上将细胞/角叉藻聚糖混合物缓慢添加到温度为50℃的383mL的大豆油中,同时用位于顶部的搅拌器搅拌。通过控制搅拌速度在所述油中产生了预期大小的细胞/角叉藻聚糖液滴之后,将所述油的温度降低到40-42℃,使所述液滴胶凝,并且将所述油从所得到的珠中倒出。用150mL的0.1M碳酸氢钾缓冲液(pH7.0)洗涤所述珠,然后悬浮在182mL的相同的缓冲液中,并且添加将1.9g戊二醛溶解在水中制备的25wt%的溶液,并且在25℃下混合所述珠1小时。然后向该混合物中添加7.6g聚乙烯亚胺(BASF LupasolPR971L)平均分子量750,000)溶解在水中制成的12.5wt%的溶液,并且在25℃下混合所述珠1小时。然后用0.30M碳酸氢铵(pH7.0)洗涤所述珠两次,并且在5℃下保存所述珠。
实施例20通过角叉藻聚糖-固定的大肠杆菌SW132细胞水合丙烯腈向装有位于顶部的搅拌器的50-mL有夹套的反应容器(用循环温度水浴将温度控制在35℃)中添加4.0g的按实施例19所述方法制备的GA/PEI-交联的大肠杆菌SW132细胞/角叉藻聚糖珠。然后向所述反应容器中添加1.06g的丙烯腈(最终浓度为1.0M),通过添加蒸馏过的去离子水将反应混合物的最终体积调整到20mL,并且在35℃下搅拌该混合物。将反应混合物的样品(0.100mL)与0.400mL的水混合,然后将0.200mL的稀释过的样品与0.200mL的溶解在水中的0.200M丁酸钠(HPLC外部标准物)混合。对所得到的混合物进行离心,并且,通过HPLC分析上清液。在丙烯腈完全转化时,存在丙烯酰胺的定量产率。
实施例21利用来自大肠杆菌SW132细胞的部分纯化的蛋白提取物的固定化的腈水合酶水合丙烯腈在25-mL锥形烧瓶中称取1.0g的环氧乙烷丙烯酸珠(Sigma)。然后向该烧瓶中添加约7.5mL的含有磷酸钾缓冲液(50mM,pH8.0)的溶液,并且通过短时间混合烧瓶中的容纳物将环氧乙烷丙烯酸珠悬浮在该缓冲液中。在终止混合之后,所述球沉淀到烧瓶底部,并且通过吸液管将漂浮到混合物顶部的细小颗粒排出,同时尽可能多地除去上清液,而又不扰动沉淀的珠。再次重复该洗涤过程。然后向所述烧瓶中添加如实施例12所述的1.0mL的大肠杆菌SW132细胞提取上清液,并且用额外的磷酸钾缓冲液将该混合物的最终体积调整到10mL。所得到的混合物在25℃下在旋转平台振荡器上混合16小时,然后将所述混合物转移到装有烧结的床支持物的层析柱上,并且用10mL的磷酸钾缓冲液洗涤固定化的腈水合酶三次,并且在5℃下在相同的缓冲液中保存。
向装有位于顶部的搅拌器的50-mL有夹套的反应容器(通过循环温度水浴将温度控制在35℃)中添加1.0g按上述方法制备的固定化大肠杆菌SW132腈水合酶。然后向该反应容器中添加1.06g的丙烯腈(最终浓度为1.0M),通过添加蒸馏过的去离子水将反应混合物的最终体积调整到20mL,并且在35℃下搅拌该混合物。将反应混合物的样品(0.100mL)与0.400mL的水混合,然后将0.200mL的稀释过的样品与0.200mL的溶解在水中的0.200M丁酸钠(HPLC外部标准物)混合。对所得到的混合物进行离心,并且,通过HPLC分析上清液。在丙烯腈完全转化时,存在丙烯酰胺的定量产率。
序列表<110>E.I.duPont de Nemours and Company.Inc.
<120>来自睾丸酮丛毛单胞菌5-MAGAM-4D的编码腈水合酶和酰胺酶的核酸片段以及表达所述可用于生产酰胺和酸的酶的重组微生物<130>CL2200 PCT<150>10/413,966<151>2003/05/08<160>23<170>Microsoft Office 97<210>1<211>633<212>DNA<213>恶臭假单孢菌5B<400>1atggggcaat cacacacgca tgaccaccat cacgacgggt accaggcacc gcccgaagac 60atcgcgctgc gggtcaaggc cttggagtct ctgctgatcg agaaaggtct tgtcgaccca120gcggccatgg acttggtcgt ccaaacgtat gaacacaagg taggcccccg aaacggcgcc180aaagtcgtgg ccaaggcctg ggtggaccct gcctacaagg cccgtctgct ggcagacgca240actgcggcaa ttgccgagct gggcttctcc ggggtacagg gcgaggacat ggtcattctg300gaaaacaccc ccgccgtcca caacgtcttc gtttgcacct tgtgctcttg ctacccatgg360ccgacgctgg gcttgccccc tgcctggtac aaggccgccg cctaccggtc ccgcatggtg420agcgacccgc gtggggttct cgcggagttc ggcctggtga tccccgccaa caaggaaatc480cgcgtctggg acaccacggc cgaattgcgc tacatggtgc tgccggaacg gcccggaact540gaagcctaca gcgaagaaca actggccgaa ctcgttaccc gcgattcgat gatcggcacc600ggcctgccaa cccaacccac cccatctcat taa 633<210>2
<211>654<212>DNA<213>恶臭假单孢菌5B<400>2atgaatggca ttcacgatac tggcggagca catggttatg ggccggttta cagagaaccg 60aacgaacccg tctttcgcta cgactgggaa aaaacggtca tgtccctgct cccggccctg120ctcgccaacg cgaacttcaa cctcgatgaa tttcggcatt cgatcgagcg aatgggcccg180gcccactatc tggagggaac ctactacgaa cactggcttc atgtctttga gaacctgctg240gtcgagaagg gtgtgctcac ggccacggaa gtcgcgaccg gcaaggctgc gtctggcaag300acggcgacgc gcgtgctgac gccggccatc gtggacgact cgtcagcacc ggggcttctg360cgcccgggag gagggttctc tttttttcct gtgggggaca aggttcgcgt cctcaacaag420aacccggtgg gccatacccg catgccgcgc tacacgcggg caaagtgggg acagtggtca480tcgaccatgg tgtgtttcgt gacgccggac accgcggcac acggaaaggg cgagcagccc540cagcacgttt acaccgtgag tttcacgtcg gtcgaactgt gggggcaaga cgcttcctcg600ccgaaggaca cgattcgcgt cgacttgtgg gatgactacc tggagccagc gtga 654<210>3<211>633<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<220>
<221>CDS<222>(1)..(633)<400>3atg ggg caa tca cac acg cat gac cac cat cac gac ggg tac cag gca 48Met Gly Gln Ser His Thr His Asp His His His Asp Gly Tyr Gln Ala1 5 10 15ccg ccc gaa gac atc gcg ctg cgg gtc aag gcc ttg gag tct ctg ctg 96Pro Pro Glu Asp Ile Ala Leu Arg Val Lys Ala Leu Glu Ser Leu Leu20 25 30atc gag aaa ggt ctt gtc gac cca gcg gcc atg gac ttg gtc gtc caa 144
Ile Glu Lys Gly Leu Val Asp Pro Ala Ala Met Asp Leu Val Val Gln35 40 45acg tat gaa cac aag gta ggc ccc cga aac ggc gcc aaa gtc gtg gcc 192Thr Tyr Glu His Lys Val Gly Pro Arg Asn Gly Ala Lys Val Val Ala50 55 60aag gcc tgg gtg gac cct gcc tac aag gcc cgt ctg ctg gca gac ggc 240Lys Ala Trp Val Asp Pro Ala Tyr Lys Ala Arg Leu Leu Ala Asp Gly65 70 75 80act gcc ggc att gcc gag ctg ggc ttc tcc ggg gta cag ggc gag gac 288Thr Ala Gly Ile Ala Glu Leu Gly Phe Ser Gly Val Gln Gly Glu Asp85 90 95atg gtc att ctg gaa aac acc ccc gcc gtc cac aac gtc gtc gtt tgc 336Met Val Ile Leu Glu Ash Thr Pro Ala Val His Asn Val Val Val Cys100 105 110acc ttg tgc tct tgc tac cca tgg ccg acg ctg ggc ttg ccc cct gcc 384Thr Leu Cys Ser Cys Tyr Pro Trp Pro Thr Leu Gly Leu Pro Pro Ala115 120 125tgg tac aag gcc ccg ccc tac cgg tcc cgc atg gtg agc gac ccg cgt 432Trp Tyr Lys Ala Pro Pro Tyr Arg Ser Arg Met Val Ser Asp Pro Arg130 135 140ggg gtt ctc gcg gag ttc ggc ctg gtg atc ccc gcg aag gaa atc cgc 480Gly Val Leu Ala Glu Phe Gly Leu Val Ile Pro Ala Lys Glu Ile Arg145 150 155 160gtc tgg gac acc acg gcc gaa ttg cgc tac atg gtg ctg ccg gaa cgg 528Val Trp Asp Thr Thr Ala Glu Leu Arg Tyr Met Val Leu Pro Glu Arg165 170 175ccc gcg gga act gaa gcc tac agc gaa gaa caa ctg gcc gaa ctc gtt 576Pro Ala Gly Thr Glu Ala Tyr Ser Glu Glu Gln Leu Ala Glu Leu Val180 185 190acc cgc gat tcg atg atc ggc acc ggc ctg ccc atc caa ccc acc cca 624Thr Arg Asp Ser Met Ile Gly Thr Gly Leu Pro Ile Gln Pro Thr Pro195 200 205tct cat taa 633Ser His210
<210>4<211>210<212>PRT<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>4Met Gly Gln Ser His Thr His Asp His His His Asp Gly Tyr Gln Ala1 5 10 15Pro Pro Glu Asp Ile Ala Leu Arg Val Lys Ala Leu Glu Ser Leu Leu20 25 30Ile Glu Lys Gly Leu Val Asp Pro Ala Ala Met Asp Leu Val Val Gln35 40 45Thr Tyr Glu His Lys Val Gly Pro Arg Asn Gly Ala Lys Val Val Ala50 55 60Lys Ala Trp Val Asp Pro Ala Tyr Lys Ala Arg Leu Leu Ala Asp Gly65 70 75 80Thr Ala Gly Ile Ala Glu Leu Gly Phe Ser Gly Val Gln Gly Glu Asp85 90 95Met Val Ile Leu Glu Asn Thr Pro Ala Val His Asn Val Val Val Cys100 105 110Thr Leu Cys Ser Cys Tyr Pro Trp Pro Thr Leu Gly Leu Pro Pro Ala115 120 125Trp Tyr Lys Ala Pro Pro Tyr Arg Ser Arg Met Val Ser Asp Pro Arg130 135 140Gly Val Leu Ala Glu Phe Gly Leu Val Ile Pro Ala Lys Glu Ile Arg145 150 155 160Val Trp Asp Thr Thr Ala Glu Leu Arg Tyr Met Val Leu Pro Glu Arg
165 170 175Pro Ala Gly Thr Glu Ala Tyr Ser Glu Glu Gln Leu Ala Glu Leu Val180 185 190Thr Arg Asp Ser Met Ile Gly Thr Gly Leu Pro Ile Gln Pro Thr Pro195 200 205Ser His210<210>5<211>657<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<220>
<221>CDS<222>(1)..(657)<400>5atg aat ggc att cac gat act ggg gga gca cat ggt tat ggg ccg gtt 48Met Asn Gly Ile His Asp Thr Gly Gly Ala His Gly Tyr Gly Pro Val1 5 10 15tac aga gaa ccg aac gaa ccc gtc ttt cgc tac gac tgg gaa aaa acg 96Tyr Arg Glu Pro Ash Glu Pro Val Phe Arg Tyr Asp Trp Glu Lys Thr20 25 30gtc atg tcc ctg ttc ccg gcg ctg ttc gcc aac ggc aac ttc aac ctc 144Val Met Ser Leu Phe Pro Ala Leu Phe Ala Asn Gly Asn Phe Asn Leu35 40 45gat gag ttt cga cac ggc atc gag cgc atg aac ccc atc gac tac ctg 192Asp Glu Phe Arg His Gly Ile Glu Arg Met Asn Pro Ile Asp Tyr Leu50 55 60aag gga acc tac tac gaa cac tgg atc cat tcc atc gaa acc ttg ctg 240Lys Gly Thr Tyr Tyr Glu His Trp Ile His Ser Ile Glu Thr Leu Leu65 70 75 80gtc gaa aag ggt gtg ctc acg gca acg gaa ctc gcg acc ggc aag gca 288Val Glu Lys Gly Val Leu Thr Ala Thr Glu Leu Ala Thr Gly Lys Ala
85 90 95tct gac aag aca gcg aca ccg gtg ctg acg ccg gcc atc gtg gac gga 336Ser Gly Lys Thr Ala Thr Pro Val Leu Thr Pro Ala Ile Val Asp Gly100 105 110ctg ctc agc acc ggg gct tct gcc gcc cgg gag gag ggt gcg cgg gcg 384Leu Leu Ser Thr Gly Ala Ser Ala Ala Arg Glu Glu Gly Ala Arg Ala115 120 125cgg ttc gct gtg ggg gac aag gtt cgc gtc ctc aac aag aac ccg gtg 432Arg Phe Ala Val Gly Asp Lys Val Arg Val Leu Asn Lys Asn Pro Val130 135 140ggc cat acc cgc atg ccg cgc tac acg cgg ggc aaa gtg ggg aca gtg 480Gly His Thr Arg Met Pro Arg Tyr Thr Arg Gly Lys Val Gly Thr Val145 150 155 160gtc atc gac cat ggt gtg ttc gtg acg ccg gac acc gcg gca cac gga 528Val Ile Asp His Gly Val Phe Val Thr Pro Asp Thr Ala Ala His Gly165 170 175aag ggc gag cac ccc cag cac gtt tac acc gtg agt ttc acg tcg gtc 576Lys Gly Glu His Pro Gln His Val Tyr Thr Val Ser Phe Thr Ser Val180 185 190gaa ctg tgg ggg caa gac gcc tcc tcg ccg aag gac acg att cgc gtc 624Glu Leu Trp Gly Gln Asp Ala Ser Ser Pro Lys Asp Thr Ile Arg Val195 200 205gac ttg tgg gat gac tac ctg gag cca gcg tga 657Asp Leu Trp Asp Asp Tyr Leu Glu Pro Ala210 215<210>6<211>218<212>PRT<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>6Met Asn Gly Ile His Asp Thr Gly Gly Ala His Gly Tyr Gly Pro Val1 5 10 15Tyr Arg Glu Pro Asn Glu Pro Val Phe Arg Tyr Asp Trp Glu Lys Thr20 25 30
Val Met Ser Leu Phe Pro Ala Leu Phe Ala Asn Gly Asn Phe Asn Leu35 40 45Asp Glu Phe Arg His Gly Ile Glu Arg Met Asn Pro Ile Asp Tyr Leu50 55 60Lys Gly Thr Tyr Tyr Glu His Trp Ile His Ser Ile Glu Thr Leu Leu65 70 75 80Val Glu Lys Gly Val Leu Thr Ala Thr Glu Leu Ala Thr Gly Lys Ala85 90 95Ser Gly Lys Thr Ala Thr Pro Val Leu Thr Pro Ala Ile Val Asp Gly100 105 110Leu Leu Ser Thr Gly Ala Ser Ala Ala Arg Glu Glu Gly Ala Arg Ala115 120 125Arg Phe Ala Val Gly Asp Lys Val Arg Val Leu Asn Lys Asn Pro Val130 135 140Gly His Thr Arg Met Pro Arg Tyr Thr Arg Gly Lys Val Gly Thr Val145 150 155 160Val Ile Asp His Gly Val Phe Val Thr Pro Asp Thr Ala Ala His Gly165 170 175Lys Gly Glu His Pro Gln His Val Tyr Thr Val Ser Phe Thr Ser Val180 185 190Glu Leu Trp Gly Gln Asp Ala Ser Ser Pro Lys Asp Thr Ile Arg Val195 200 205Asp Leu Trp Asp Asp Tyr Leu Glu Pro Ala210 215
<210>7<211>1386<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>7tcgatgccga gttgaagtcg ctgtacccct tttttcaacc acaccaggag aaccgcacca 60tggggcaatc acacacgcat gaccaccatc acgacgggta ccaggcaccg cccgaagaca120tcgcgctgcg ggtcaaggcc ttggagtctc tgctgatcga gaaaggtctt gtcgacccag180cggccatgga cttggtcgtc caaacgtatg aacacaaggt aggcccccga aacggcgcca240aagtcgtggc caaggcctgg gtggaccctg cctacaaggc ccgtctgctg gcagacggca300ctgccggcat tgccgagctg ggcttctccg gggtacaggg cgaggacatg gtcattctgg360aaaacacccc cgccgtccac aacgtcgtcg tttgcacctt gtgctcttgc tacccatggc420cgacgctggg cttgccccct gcctggtaca aggccccgcc ctaccggtcc cgcatggtga480gcgacccgcg tggggttctc gcggagttcg gcctggtgat ccccgcgaag gaaatccgcg540tctgggacac cacggccgaa ttgcgctaca tggtgctgcc ggaacggccc gcgggaactg600aagcctacag cgaagaacaa ctggccgaac tcgttacccg cgattcgatg atcggcaccg660gcctgcccat ccaacccacc ccatctcatt aaggagttcg tcatgaatgg cattcacgat720actgggggag cacatggtta tgggccggtt tacagagaac cgaacgaacc cgtctttcgc780tacgactggg aaaaaacggt catgtccctg ttcccggcgc tgttcgccaa cggcaacttc840aacctcgatg agtttcgaca cggcatcgag cgcatgaacc ccatcgacta cctgaaggga900acctactacg aacactggat ccattccatc gaaaccttgc tggtcgaaaa gggtgtgctc960acggcaacgg aactcgcgac cggcaaggca tctggcaaga cagcgacacc ggtgctgacg 1020ccggccatcg tggacggact gctcagcacc ggggcttctg ccgcccggga ggagggtgcg 1080cgggcgcggt tcgctgtggg ggacaaggtt cgcgtcctca acaagaaccc ggtgggccat 1140acccgcatgc cgcgctacac gcggggcaaa gtggggacag tggtcatcga ccatggtgtg 1200
ttcgtgacgc cggacaccgc ggcacacgga aagggcgagc acccccagca cgtttacacc 1260gtgagtttca cgtcggtcga actgtggggg caagacgcct cctcgccgaa ggacacgatt 1320cgcgtcgact tgtgggatga ctacctggag ccagcgtgat catgaaagac gaacggtttc 1380cattgc 1386<210>8<211>23<212>DNA<213>人工序列<220>
<223>引物1<400>8tcgatgccga gttgaagtcg ctg 23<210>9<211>23<212>DNA<213>人工序列<220>
<223>引物2<400>9gcaatggaaa ccgttcgtct ttc 23<210>10<211>923<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>10tcatgaaaga cgaacggttt ccattgccag agggttcgct gaaggacctc gatggccctg 60tgtttgacga gccttggcag tcccaggcgt ttgccttggt ggtcagcatg cacaaggccg120gtctctttca gtggaaagac tgggccgaga ccttcaccgc cgaaatcgac gcttccccgg180ctctgcccgg cgaaagcgtc aacgacacct actaccggca atgggtgtcg gcgctggaaa240agttggtggc gtcgctgggg cttgtgacgg gtggagacgt caactcgcgc gcacaggagt300
ggaaacaggc ccacctcaac accccacatg ggcacccgat cctgctggcc catgcgcttt360gcccgccagc gatcgacccc aagcacaagc acgagccaaa acgctcaccg atcaaggtcg420ttgccgcaat ggcttgagat ccactgtcct gtttccctac cttgaatgga gtaaaccatg480agttcatttt ctaccactgc cgtccccgcc gcccagcgcc tgagcgccac gcgcagctta540ctgttgcaac tgtccgctgg cgccgcgctg ggcctggtcg tcctgtacgg cgtggctttt600gccgaaagcc cgcttgcgca caacgccgcg cacgatgttc gccacgtgac ggtcaagcct660tgtcactaac tgtggcccac ccccgccgcg ctgcgcgcga ccccctccag ggggcaaacc720gagtggcccg gcggagccgg ttccaccgcg ttcccggtgg ggtgcactgc tggcgttgcg780ggtcttgttt cggctggatg gtttcttgac ggagccacac cgtcgctcat ctgtatatgg840agagggtcat gatttttcga cgcttgatct gggcggcgct ggccgtggcc ttgctggtgg900gcagtttgca gtcgggtctg cag923<210>11<211>2223<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>11atggggcaat cacacacgca tgaccaccat cacgacgggt accaggcacc gcccgaagac 60atcgcgctgc gggtcaaggc cttggagtct ctgctgatcg agaaaggtct tgtcgaccca120gcggccatgg acttggtcgt ccaaacgtat gaacacaagg taggcccccg aaacggcgcc180aaagtcgtgg ccaaggcctg ggtggaccct gcctacaagg cccgtctgct ggcagacggc240actgccggca ttgccgagct gggcttctcc ggggtacagg gcgaggacat ggtcattctg300gaaaacaccc ccgccgtcca caacgtcgtc gtttgcacct tgtgctcttg ctacccatgg360ccgacgctgg gcttgccccc tgcctggtac aaggccccgc cctaccggtc ccgcatggtg420agcgacccgc gtggggttct cgcggagttc ggcctggtga tccccgcgaa ggaaatccgc480gtctgggaca ccacggccga attgcgctac atggtgctgc cggaacggcc cgcgggaact540
gaagcctaca gcgaagaaca actggccgaa ctcgttaccc gcgattcgat gatcggcacc600ggcctgccca tccaacccac cccatctcat taaggagttc gtcatgaatg gcattcacga660tactggggga gcacatggtt atgggccggt ttacagagaa ccgaacgaac ccgtctttcg720ctacgactgg gaaaaaacgg tcatgtccct gttcccggcg ctgttcgcca acggcaactt780caacctcgat gagtttcgac acggcatcga gcgcatgaac cccatcgact acctgaaggg840aacctactac gaacactgga tccattccat cgaaaccttg ctggtcgaaa agggtgtgct900cacggcaacg gaactcgcga ccggcaaggc atctggcaag acagcgacac cggtgctgac960gccggccatc gtggacggac tgctcagcac cggggcttct gccgcccggg aggagggtgc 1020gcgggcgcgg ttcgctgtgg gggacaaggt tcgcgtcctc aacaagaacc cggtgggcca 1080tacccgcatg ccgcgctaca cgcggggcaa agtggggaca gtggtcatcg accatggtgt 1140gttcgtgacg ccggacaccg cggcacacgg aaagggcgag cacccccagc acgtttacac 1200cgtgagtttc acgtcggtcg aactgtgggg gcaagacgcc tcctcgccga aggacacgat 1260tcgcgtcgac ttgtgggatg actacctgga gccagcgtga tcatgaaaga cgaacggttt 1320ccattgccag agggttcgct gaaggacctc gatggccctg tgtttgacga gccttggcag 1380tcccaggcgt ttgccttggt ggtcagcatg cacaaggccg gtctctttca gtggaaagac 1440tgggccgaga ccttcaccgc cgaaatcgac gcttccccgg ctctgcccgg cgaaagcgtc 1500aacgacacct actaccggca atgggtgtcg gcgctggaaa agttggtggc gtcgctgggg 1560cttgtgacgg gtggagacgt caactcgcgc gcacaggagt ggaaacaggc ccacctcaac 1620accccacatg ggcacccgat cctgctggcc catgcgcttt gcccgccagc gatcgacccc 1680aagcacaagc acgagccaaa acgctcaccg atcaaggtcg ttgccgcaat ggcttgagat 1740ccactgtcct gtttccctac cttgaatgga gtaaaccatg agttcatttt ctaccactgc 1800cgtccccgcc gcccagcgcc tgagcgccac gcgcagctta ctgttgcaac tgtccgctgg 1860cgccgcgctg ggcctggtcg tcctgtacgg cgtggctttt gccgaaagcc cgcttgcgca 1920caacgccgcg cacgatgttc gccacgtgac ggtcaagcct tgtcactaac tgtggcccac 1980
ccccgccgcg ctgcgcgcga ccccctccag ggggcaaacc gagtggcccg gcggagccgg 2040ttccaccgcg ttcccggtgg ggtgcactgc tggcgttgcg ggtcttgttt cggctggatg 2100gtttcttgac ggagccacac cgtcgctcat ctgtatatgg agagggtcat gatttttcga 2160cgcttgatct gggcggcgct ggccgtggcc ttgctggtgg gcagtttgca gtcgggtctg 2220cag 2223<210>12<211>30<212>DNA<213>人工序列<220>
<223>引物3<400>12ctgaagcttc aaggtaggga aacaggacag 30<210>13<211>216<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<220>
<221>CDS<222>(1)..(216)<400>13atg gcc ctg tgt ttg acg agc ctt ggc agt ccc agg cgt ttg cct tgg 48Met Ala Leu Cys Leu Thr Ser Leu Gly Ser Pro Arg Arg Leu Pro Trp1 5 10 15tgg tca gca tgc aca agg ccg gtc tct ttc agt gga aag act ggg ccg 96Trp Ser Ala Cys Thr Arg Pro Val Ser Phe Ser Gly Lys Thr Gly Pro20 25 30aga cct tca ccg ccg aaa tcg acg ctt ccc cgg ctc tgc ccg gcg aaa 144Arg Pro Ser Pro Pro Lys Ser Thr Leu Pro Arg Leu Cys Pro Ala Lys35 40 45gcg tca acg aca cct act acc ggc aat ggg tgt cgg cgc tgg aaa agt 192Ala Ser Thr Thr Pro Thr Thr Gly Ash Gly Cys Arg Arg Trp Lys Ser
50 55 60tgg tgg cgt cgc tgg ggc ttg tga 216Trp Trp Arg Arg Trp Gly Leu65 70<210>14<211>71<212>PRT<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>14Met Ala Leu Cys Leu Thr Ser Leu Gly Ser Pro Arg Arg Leu Pro Trp1 5 10 15Trp Ser Ala Cys Thr Arg Pro Val Ser Phe Ser Gly Lys Thr Gly Pro20 25 30Arg Pro Ser Pro Pro Lys Ser Thr Leu Pro Arg Leu Cys Pro Ala Lys35 40 45Ala Ser Thr Thr Pro Thr Thr Gly Ash Gly Cys Arg Arg Trp Lys Ser50 55 60Trp Trp Arg Arg Trp Gly Leu65 70<210>15<211>669<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>15gaattcgcct atggcgtcat cactccgaag tcgcgcaacc cctgggaccc gggaagaaca 60ccgggtggct ccagcggcgg ctcggcggcc acggtcgcag cctgcggcgt ctacttggcg120accggcaccg acaccggtgg atccgttcgc atcccttcgt cgatgtgcaa caccgtaggc180ctgaagccaa cctacgggcg cgtgagccgt gccggtgtga gttcactttc ctggagcctg240
gaccatccag gcccgatcac gcgcaccgtg gaagacacgg cgctcagcct tcaggtgatg300gctggcttcg atccagccga ccgcggctcg ttggatgagc cggtgcccag ctatgccgaa360gggctcggcc aaggcgtgaa aggcctgcgc gtgggcgtgc cgaagaacta cttcttcgac420cgcgtggacc cggaagttga aagtgcggtt cgtgccgcca tcgatcaact gaaagagctg480ggcgccgaac tggtggaagt cgaagtgccc atggccgagc agatcatccc ggtggagttc540gggatcgtgc tacccgaagc cagcgcctac caccgcacga tgctgcgcga gtcacccgag600ctctacaccg ccgatgtccg catactgctg gaactcggaa atctagtcac cgccaccgac660tacctgcag669<210>16<211>1407<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<220>
<221>CDS<222>(1)..(1407)<400>16atg agt tcg cta acc cgc ctc acc ctc gcg caa gtt gcg cag aaa ctt 48Met Ser Ser Leu Thr Arg Leu Thr Leu Ala Gln Val Ala Gln Lys Leu1 5 10 15aag gca cgg gaa gtc tcc gcc gtt gaa gtt ctg gac gcc tgt ctg acg 96Lys Ala Arg Glu Val Ser Ala Val Glu Val Leu Asp Ala Cys Leu Thr20 25 30cag gtg cgc tcc acc gaa aaa cag atc agt gcg tac gtg tgc gtg ctg 144Gln Val Arg Ser Thr Glu Lys Gln Ile Ser Ala Tyr Val Cys Val Leu35 40 45gag gat cag gcc cgt gca gca gcc cag caa gct gac gcc gac atc agc 192Glu Asp Gln Ala Arg Ala Ala Ala Gln Gln Ala Asp Ala Asp Ile Ser50 55 60gcc ggg cgc tgg aaa ggc ccg ctg cat ggc gtg cct gta gcg gtc aag 240Ala Gly Arg Trp Lys Gly Pro Leu His Gly Val Pro Val Ala Val Lys65 70 75 80
gac tta tac gac atc gct ggc gta ccc acc acg gca tcg tcg cgc cag 288Asp Leu Tyr Asp Ile Ala Gly Val Pro Thr Thr Ala Ser Ser Arg Gln85 90 95cgc acg aat tgg acg ccg cag caa gac tgc gcc gta gtc cgg cgc ttg 336Arg Thr Asn Trp Thr Pro Gln Gln Asp Cys Ala ValVal Arg Arg Leu100 105 110aaa gac gca ggt gcc gtt atc ctt ggc aag acc cat acg cac gaa ttc 384Lys Asp Ala Gly Ala Val Ile Leu Gly Lys Thr His Thr His Glu Phe115 120 125gcc tat ggc gtc atc act ccg aag tcg cgc aac ccc tgg gac ccg gga 432Ala Tyr Gly Val Ile Thr Pro Lys Ser Arg Asn Pro Trp Asp Pro Gly130 135 140aga aca ccg ggt ggc tcc agc ggc ggc tcg gcg gcc acg gtc gca gcc 480Arg Thr Pro Gly Gly Ser Ser Gly Gly Ser Ala Ala Thr Val Ala Ala145 150 155 160tgc ggc gtc tac ttg gcg acc ggc acc gac acc ggt gga tcc gtt cgc 528Cys Gly Val Tyr Leu Ala Thr Gly Thr Asp Thr Gly Gly Ser Val Arg165 170 175atc cct tcg tcg atg tgc aac acc gta ggc ctg aag cca acc tac ggg 576Ile Pro Ser Ser Met Cys Asn Thr Val Gly Leu Lys Pro Thr Tyr Gly180 185 190cgc gtg agc cgt gcc ggt gtg agt tca ctt tcc tgg agc ctg gac cat 624Arg Val Ser Arg Ala Gly Val Ser Ser Leu Ser Trp Ser Leu Asp His195 200 205cca ggc ccg atc acg cgc acc gtg gaa gac acg gcg ctc agc ctt cag 672Pro Gly Pro Ile Thr Arg Thr Val Glu Asp Thr Ala Leu Ser Leu Gln210 215 220gtg atg gct ggc ttc gat cca gcc gac cgc ggc tcg ttg gat gag ccg 720Val Met Ala Gly Phe Asp Pro Ala Asp Arg Gly Ser Leu Asp Glu Pro225 230 235 240gtg ccc agc tat gcc gaa ggg ctc ggc caa ggc gtg aaa ggc ctg cgc 768Val Pro Ser Tyr Ala Glu Gly Leu Gly Gln Gly ValLys Gly Leu Arg245 250 255gtg ggc gtg ccg aag aac tac ttc ttc gac cgc gtg gac ccg gaa gtt 816Val Gly Val Pro Lys Asn Tyr Phe Phe Asp Arg Val Asp Pro Glu Val260 265 270
gaa agt gcg gtt cgt gcc gcc atc gat caa ctg aaa gag ctg ggc gcc 864Glu Ser Ala Val Arg Ala Ala Ile Asp Gln Leu Lys Glu Leu Gly Ala275 280 285gaa ctg gtg gaa gtc gaa gtg ccc atg gcc gag cag atc atc ccg gtg 912Glu Leu Val Glu Val Glu Val Pro Met Ala Glu Gln Ile Ile Pro Val290 295 300gag ttc ggg atc gtg cta ccc gaa gcc agc gcc tac cac cgc acg atg 960Glu Phe Gly Ile Val Leu Pro Glu Ala Ser Ala Tyr His Arg Thr Met305 310 315 320ctg cgc gag tca ccc gag ctc tac acc gcc gat gtc cgc ata ctg ctg 1008Leu Arg Glu Ser Pro Glu Leu Tyr Thr Ala Asp Val Arg Ile Leu Leu325 330 335gaa ctc gga aat cta gtc acc gcc acc gac tac ctg cag gcg cag cgc 1056Glu Leu Gly Asn Leu Val Thr Ala Thr Asp Tyr Leu Gln Ala Gln Arg340 345 350gtc cgt acg ctg atg cag cgc gcg gtg gcc gag atg ttc cag cgc atc 1104Val Arg Thr Leu Met Gln Arg Ala Val Ala Glu Met Phe Gln Arg Ile355 360 365gat gtg ctg atc gca ccc aca ctg ccc atc ccg gct gct cgc agc ggg 1152Asp Val Leu Ile Ala Pro Thr Leu Pro Ile Pro Ala Ala Arg Ser Gly370 375 380gag gag gtc cac aca tgg ccg gac ggc acg gta gag gcg ttg ttc atg 1200Glu Glu Val His Thr Trp Pro Asp Gly Thr Val Glu Ala Leu Phe Met385 390 395 400gcc tat acg cgc ttc acc tcg ttc ggc aac gtg aca gga tta ccc acg 1248Ala Tyr Thr Arg Phe Thr Ser Phe Gly Ash Val Thr Gly Leu Pro Thr405 410 415ctg aac ctg ccc tgt ggt ttc tcc aag gat ggg ttg ccg atc ggc atg 1296Leu Asn Leu Pro Cys Gly Phe Ser Lys Asp Gly Leu Pro Ile Gly Met420 425 430cag atc acc ggc cgg ccg ctg gac gag aag acc ctg ctg cgt gct ggg 1344Gln Ile Thr Gly Arg Pro Leu Asp Glu Lys Thr Leu Leu Arg Ala Gly435 440 445ctg gcc tac gag aaa gcc acg acc tgg cac cag cgt cat ccg gaa ctg 1392Leu Ala Tyr Glu Lys Ala Thr Thr Trp His Gln Arg His Pro Glu Leu450 455 460
atc gga gcg ggc tga1407Ile Gly Ala Gly465<210>17<211>468<212>PRT<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>17Met Ser Ser Leu Thr Arg Leu Thr Leu Ala Gln Val Ala Gln Lys Leu1 5 10 15Lys Ala Arg Glu Val Ser Ala Val Glu Val Leu Asp Ala Cys Leu Thr20 25 30Gln Val Arg Ser Thr Glu Lys Gln He Ser Ala Tyr Val Cys Val Leu35 40 45Glu Asp Gln Ala Arg Ala Ala Ala Gln Gln Ala Asp Ala Asp Ile Ser50 55 60Ala Gly Arg Trp Lys Gly Pro Leu His Gly Val Pro Val Ala Val Lys65 70 75 80Asp Leu Tyr Asp Ile Ala Gly Val Pro Thr Thr Ala Ser Ser Arg Gln85 90 95Arg Thr Asn Trp Thr Pro Gln Gln Asp Cys Ala Val Val Arg Arg Leu100 105 110Lys Asp Ala Gly Ala ValIle Leu Gly Lys Thr His Thr His Glu Phe115 120 125Ala Tyr Gly Val Ile Thr Pro Lys Ser Arg Asn Pro Trp Asp Pro Gly130 135 140
Arg Thr Pro Gly Gly Ser Ser Gly Gly Ser Ala Ala Thr Val Ala Ala145 150 155 160Cys Gly Val Tyr Leu Ala Thr Gly Thr Asp Thr Gly Gly Ser Val Arg165 170 175Ile Pro Ser Ser Met Cys Asn Thr Val Gly Leu Lys Pro Thr Tyr Gly180 185 190Arg Val Ser Arg Ala Gly Val Ser Ser Leu Ser Trp Ser Leu Asp His195 200 205Pro Gly Pro Ile Thr Arg Thr Val Glu Asp Thr Ala Leu Ser Leu Gln210 215 220Val Met Ala Gly Phe Asp Pro Ala Asp Arg Gly Ser Leu Asp Glu Pro225 230 235 240Val Pro Ser Tyr Ala Glu Gly Leu Gly Gln Gly Val Lys Gly Leu Arg245 250 255Val Gly Val Pro Lys Asn Tyr Phe Phe Asp Arg Val Asp Pro Glu Val260 265 270Glu Ser Ala Val Arg Ala Ala Ile Asp Gln Leu Lys Glu Leu Gly Ala275 280 285Glu Leu Val Glu Val Glu Val Pro Met Ala Glu Gln Ile Ile Pro Val290 295 300Glu Phe Gly Ile Val Leu Pro Glu Ala Ser Ala Tyr His Arg Thr Met305 310 315 320Leu Arg Glu Ser Pro Glu Leu Tyr Thr Ala Asp Val Arg Ile Leu Leu325 330 335
Glu Leu Gly Asn Leu Val Thr Ala Thr Asp Tyr Leu Gln Ala Gln Arg340 345 350Val Arg Thr Leu Met Gln Arg Ala Val Ala Glu Met Phe Gln Arg Ile355 360 365Asp Val Leu Ile Ala Pro Thr Leu Pro Ile Pro Ala Ala Arg Ser Gly370 375 380Glu Glu Val His Thr Trp Pro Asp Gly Thr Val Glu Ala Leu Phe Met385 390 395 400Ala Tyr Thr Arg Phe Thr Ser Phe Gly Asn Val Thr Gly Leu Pro Thr405 410 415Leu Asn Leu Pro Cys Gly Phe Ser Lys Asp Gly Leu Pro Ile Gly Met420 425 430Gln Ile Thr Gly Arg Pro Leu Asp Glu Lys Thr Leu Leu Arg Ala Gly435 440 445Leu Ala Tyr Glu Lys Ala Thr Thr Trp His Gln Arg His Pro Glu Leu450 455 460Ile Gly Ala Gly465<210>18<211>7415<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>18ctgcagagtg catggcatcg agctggcggg cgctccagct gctggggttg cgccgcatgc 60cccacagcag ctgcctgagc gtcttgcggc cgccagcgcc cagcgcggct cgcaccgcct120gcgcgtcggt ggccatctcc gcgcggcgca cctggtccat cgcctcgatg gccatcgaga180
cgacgtgaaa gcggtcgtag ctgatctgcg cctcgggcag cgccagcgcc acgcccttgg240cgtaggctgc gctcatgtcc atgcacacgt gccgcacctg ggcgggatcg ccgccatggg300ccttcagatc ctcggcgaac tccaccaccg tgcggtgctc gcgcccctcg gtggcgaaca360gcagccgctt gcgatccagg tcgtgcacga cggtgatgta gtgctgcccg cgccgcaggc420tggtctcgtc gatgcccacc gtgcgcacgc cggcgaagtc ttccagcgca cgcgcctgcg480cgacgtagaa ctcgatgcgc cgccacagcc gcttgtcctt gcagcgcagc aactcggcgg540cctggcgcac cggcaggtcc aggcacaagg tcagcgccag cgcttcgaac gccgcggtga600agcccgagcc cggacgcgcc cagggcacgg ccacctgcgt ggtcttgccg caggcaccgc660aggccacgcg cggcacgtcg cagtgcagcc aggcctcgaa ctggaagaag tccaggtgcc720gccaggatcg gcgcagccgg tcgtgcaccg gttgcgtggc cgcaccgcat gccgggcagg780cgagcctgct ggtgtggcag ccgatctcga agtcgatacg ccgcttggcc gtgtcgagcc840tgacgtcatc gacgacccac ggcggctgca agcccagcgc gctggtgaac agagcttcta900cggcaatgcc catggctcat cctcctgatc aaacacgcct cgtggacatg tgcacaggcc960ggccagcggc ctgcacacat gcccaccggg ctcgacgacc aggagtcatt gtgactgttg 1020ggttccacac gaaatgacga aggaccccta gtgtgcgggg ttatcgtacc ggtgagaacc 1080cgacacgatg gcaaggtttt gaccaacatg ctaaaaggcc cattcaaacc aactaccccg 1140gagccagcca tgccacgatc cctactcacc gacgctgacg tgcgttcggt cagcgattcc 1200gtcgccctcg gcctgccgtc cgaacgcatg gcgtcccttg ccgaggcgtt caacctgatg 1260gtgctgccga ccctccagca actcgatgcg gtcaataccg gtgaaatcca gccggcacct 1320gccttcgacc cgcgctggaa ggaggtgcag tcatgagttc gctaacccgc ctcaccctcg 1380cgcaagttgc gcagaaactt aaggcacggg aagtctccgc cgttgaagtt ctggacgcct 1440gtctgacgca ggtgcgctcc accgaaaaac agatcagtgc gtacgtgtgc gtgctggagg 1500atcaggcccg tgcagcagcc cagcaagctg acgccgacat cagcgccggg cgctggaaag 1560gcccgctgca tggcgtgcct gtagcggtca aggacttata cgacatcgct ggcgtaccca 1620
ccacggcatc gtcgcgccag cgcacgaatt ggacgccgca gcaagactgc gccgtagtcc 1680ggcgcttgaa agacgcaggt gccgttatcc ttggcaagac ccatacgcac gaattcgcct 1740atggcgtcat cactccgaag tcgcgcaacc cctgggaccc gggaagaaca ccgggtggct 1800ccagcggcgg ctcggcggcc acggtcgcag cctgcggcgt ctacttggcg accggcaccg 1860acaccggtgg atccgttcgc atcccttcgt cgatgtgcaa caccgtaggc ctgaagccaa 1920cctacgggcg cgtgagccgt gccggtgtga gttcactttc ctggagcctg gaccatccag 1980gcccgatcac gcgcaccgtg gaagacacgg cgctcagcct tcaggtgatg gctggcttcg 2040atccagccga ccgcggctcg ttggatgagc cggtgcccag ctatgccgaa gggctcggcc 2100aaggcgtgaa aggcctgcgc gtgggcgtgc cgaagaacta cttcttcgac cgcgtggacc 2160cggaagttga aagtgcggtt cgtgccgcca tcgatcaact gaaagagctg ggcgccgaac 2220tggtggaagt cgaagtgccc atggccgagc agatcatccc ggtggagttc gggatcgtgc 2280tacccgaagc cagcgcctac caccgcacga tgctgcgcga gtcacccgag ctctacaccg 2340ccgatgtccg catactgctg gaactcggaa atctagtcac cgccaccgac tacctgcagg 2400cgcagcgcgt ccgtacgctg atgcagcgcg cggtggccga gatgttccag cgcatcgatg 2460tgctgatcgc acccacactg cccatcccgg ctgctcgcag cggggaggag gtccacacat 2520ggccggacgg cacggtagag gcgttgttca tggcctatac gcgcttcacc tcgttcggca 2580acgtgacagg attacccacg ctgaacctgc cctgtggttt ctccaaggat gggttgccga 2640tcggcatgca gatcaccggc cggccgctgg acgagaagac cctgctgcgt gctgggctgg 2700cctacgagaa agccacgacc tggcaccagc gtcatccgga actgatcgga gcgggctgag 2760ctgcaagaaa gcaggcgcgg cggcgcacga cccattgtgc taccgctgcg tctgcctgaa 2820gtggccgaga ccaagcagaa gaaggaggtg acatagcctc ctacaatctg ccgtcttctc 2880ggagccctct ggatgctcga agttctttgc atggggttgc gccgggagcg caatctgcaa 2940ggtggcattg gccttcagtg tcgatgccga gttgaagtcg ctgtacccct tttttcaacc 3000acaccaggag aaccgcacca tggggcaatc acacacgcat gaccaccatc acgacgggta 3060
ccaggcaccg cccgaagaca tcgcgctgcg ggtcaaggcc ttggagtctc tgctgatcga 3120gaaaggtctt gtcgacccag cggccatgga cttggtcgtc caaacgtatg aacacaaggt 3180aggcccccga aacggcgcca aagtcgtggc caaggcctgg gtggaccctg cctacaaggc 3240ccgtctgctg gcagacggca ctgccggcat tgccgagctg ggcttctccg gggtacaggg 3300cgaggacatg gtcattctgg aaaacacccc cgccgtccac aacgtcgtcg tttgcacctt 3360gtgctcttgc tacccatggc cgacgctggg cttgccccct gcctggtaca aggccccgcc 3420ctaccggtcc cgcatggtga gcgacccgcg tggggttctc gcggagttcg gcctggtgat 3480ccccgcgaag gaaatccgcg tctgggacac cacggccgaa ttgcgctaca tggtgctgcc 3540ggaacggccc gcgggaactg aagcctacag cgaagaacaa ctggccgaac tcgttacccg 3600cgattcgatg atcggcaccg gcctgcccat ccaacccacc ccatctcatt aaggagttcg 3660tcatgaatgg cattcacgat actgggggag cacatggtta tgggccggtt tacagagaac 3720cgaacgaacc cgtctttcgc tacgactggg aaaaaacggt catgtccctg ttcccggcgc 3780tgttcgccaa cggcaacttc aacctcgatg agtttcgaca cggcatcgag cgcatgaacc 3840ccatcgacta cctgaaggga acctactacg aacactggat ccattccatc gaaaccttgc 3900tggtcgaaaa gggtgtgctc acggcaacgg aactcgcgac cggcaaggca tctggcaaga 3960cagcgacacc ggtgctgacg ccggccatcg tggacggact gctcagcacc ggggcttctg 4020ccgcccggga ggagggtgcg cgggcgcggt tcgctgtggg ggacaaggtt cgcgtcctca 4080acaagaaccc ggtgggccat acccgcatgc cgcgctacac gcggggcaaa gtggggacag 4140tggtcatcga ccatggtgtg ttcgtgacgc cggacaccgc ggcacacgga aagggcgagc 4200acccccagca cgtttacacc gtgagtttca cgtcggtcga actgtggggg caagacgcct 4260cctcgccgaa ggacacgatt cgcgtcgact tgtgggatga ctacctggag ccagcgtgat 4320catgaaagac gaacggtttc cattgccaga gggttcgctg aaggacctcg atggccctgt 4380gtttgacgag ccttggcagt cccaggcgtt tgccttggtg gtcagcatgc acaaggccgg 4440tctctttcag tggaaagact gggccgagac cttcaccgcc gaaatcgacg cttccccggc 4500
tctgcccggc gaaagcgtca acgacaccta ctaccggcaa tgggtgtcgg cgctggaaaa 4560gttggtggcg tcgctggggc ttgtgacggg tggagacgtc aactcgcgcg cacaggagtg 4620gaaacaggcc cacctcaaca ccccacatgg gcacccgatc ctgctggccc atgcgctttg 4680cccgccagcg atcgacccca agcacaagca cgagccaaaa cgctcaccga tcaaggtcgt 4740tgccgcaatg gcttgagatc cactgtcctg tttccctacc ttgaatggag taaaccatga 4800gttcattttc taccactgcc gtccccgccg cccagcgcct gagcgccacg cgcagcttac 4860tgttgcaact gtccgctggc gccgcgctgg gcctggtcgt cctgtacggc gtggcttttg 4920ccgaaagccc gcttgcgcac aacgccgcgc acgatgttcg ccacgtgacg gtcaagcctt 4980gtcactaact gtggcccacc cccgccgcgc tgcgcgcgac cccctccagg gggcaaaccg 5040agtggcccgg cggagccggt tccaccgcgt tcccggtggg gtgcactgct ggcgttgcgg 5100gtcttgtttc ggctggatgg tttcttgacg gagccacacc gtcgctcatc tgtatatgga 5160gagggtcatg atttttcgac gcttgatctg ggcggcgctg gccgtggcct tgctggtggg 5220cagtttgcag tcgggtctgc agcagttgca gaccgtgccc atcatcctgg cggccgaggt 5280gtttgagggc cagaaggtgg ccgcgcccga gccggtggca acaccggccg gtgcggctgc 5340gcacgtccat gcggacggtg cgacacacga ccatggcgac gccgccgaag cctgggcgcc 5400cgccgacggg gtggagcgcc acttctggac ctgggtggcc aatgtgctgc acgcgttcag 5460catggcgctg ctggtgctgg ccgtgatggc ggtgtgccag tggcgcggca gcgccttgcg 5520cgctgtgcct ttggccgcct gggtggccgc cgccggttgg ctgagctttc acttctggcc 5580ttcgctgggc ctgcacgccg agatccccgg catggatgcc gcccggctgg gttcacgcca 5640gggctggtgg gtgctcgcgg cgggcggtgc ggcgctggcc tgtgcgtcgg tggcgctgat 5700gcgcagcccc ctgcgctggg ccgctgcaat ggcttgtctg gcgctgccct tcgtggtggg 5760cgcgccgcac atcgtggccg acccgctggc cggtttcacg ggtgaggctc aggcggcgct 5820gcgtgaactg ggccgccagt tcatctgggc caccacctgg ttgtcgctgt cgttctgggt 5880gagtatgggc gtggtggccg gtctggcctt ccagcgctgg ctgagccccg ccgtggcggc 5940
gctgctgcag cgcacggaca ccgcccgggc cccagccatg gagacgccgc gataagcgac 6000gtcaacgcaa gggtcgtgcg gggtgctgat ctgaaccgcc tttttttttg aggaggctct 6060tttccctgag aggatagagc catgagcaag aagtcgaacc agttttcacc cgaagtgcgc 6120gagcgtgctg ttcgcatggt gctggagcac cgaggcgagt acccatctct gtgggccgcc 6180atcgattcga tcgcgcccaa gatcggttgt gtgccgcaga ccctgcatac ctgggtcaag 6240cgtgtcgagg tcgacagcgg cgtgcgtgag ggcgtcagca cttccgagct gcagcgtctg 6300aaggagctcg aacgcgagaa caaggagctg cgcaaggcca acgagatctt gaagctggcc 6360agcgcgtttt tcgcccaggc ggagctcgac cgccgtctga agccctgaag ggcttcatcg 6420accagtatcg acaggcctac ggggtcgagt cgatctgcaa ggtgttgcag gtcgccccgt 6480caggctattg gcgccacgcc gctcaacaac gcaaccccca actgcgctgt ccgtgcgctc 6540aacgtgacga caccctggtg gcgcacattg aacgcgtctg gcaggccaac atgcgggtct 6600atggcgccga caaggtctgg aagcaaatga accgcgaggg cattgtggtg gcgcgctgca 6660cggtcgagcg gctgatgcgg cgcctgcgct tgcagggcgt gcgccgtggc aaggtggtgc 6720gtaccaccat cagcgatggt cgggcgccgt gcccgctgga ccgggtcaac cgggtgttca 6780gagcagaccg gcccaaccag ctctgggtct cggacttcac ctacgtgtcg acctggcagg 6840gctggctgta cgtggccttc gtgatcgatg tgtacgcccg gcgcatcgtg ggctggcggg 6900taagcagttc gatgcgcacg gacttcgtgc tcgatgccct ggaacaggcg ctgtatgcgc 6960gccagcctga gcgcgatggc agcctggttt gccactccga cagggggtcg caatacgtca 7020gcatccgcta caccgagcga ctggcccagg ccggtatcga gccctcggtg ggcagcaaag 7080gtgacagcta cgacaacgcg ctggccgaga cgatcaacgg gctgtacaag gccgaattga 7140tccatcggcg agccccatgg aggaccaagg agtcggtgga gctggctacc ctcccatggg 7200tgtcatggtt caaccaccac cggctgctcg aacccatcgg ctacatcccg ccggccgagg 7260ctgaggcaaa ctactaccgg caactcgcca atcaggcctc catggtggtg gcctgactta 7320aaccaaccgg cctccacgat tcccggggcg gttcaagagc ctcctatttc ctgtccaata 7380
ggagcccgta tgagcagtca acgttacccg aattc 7415<210>19<211>31<212>DNA<213>人工序列<220>
<223>引物4<400>19ttatctagac ccgcgctgga aggaggtgca g 31<210>20<211>29<212>DNA<213>人工序列<220>
<223>引物5<400>20cagaagcttt cttgcagctc agcccgctc29<210>21<211>33<212>DNA<213>人工序列<220>
<223>引物6<400>21tatgaattca tgagttcgct aacccgcctc acc 33<210>22<211>40<212>DNA<213>人工序列<220>
<223>引物7
<400>22tagcggccgc ttagcccgct ccgatcagtt ccggatgacg 40<210>23<211>3449<212>DNA<213>睾丸酮丛毛单胞菌5-MAGAM-4D<400>23tatgaattca tgagttcgct aacccgcctc accctcgcgc aagttgcgca gaaacttaag 60gcacgggaag tctccgccgt tgaagttctg gacgcctgtc tgacgcaggt gcgctccacc120gaaaaacaga tcagtgcgta cgtgtgcgtg ctggaggatc aggcccgtgc agcagcccag180caagctgacg ccgacatcag cgccgggcgc tggaaaggcc cgctgcatgg cgtgcctgta240gcggtcaagg acttatacga catcgctggc gtacccacca cggcatcgtc gcgccagcgc300acgaattgga cgccgcagca agactgcgcc gtagtccggc gcttgaaaga cgcaggtgcc360gttatccttg gcaagaccca tacgcacgaa ttcgcctatg gcgtcatcac tccgaagtcg420cgcaacccct gggacccggg aagaacaccg ggtggctcca gcggcggctc ggcggccacg480gtcgcagcct gcggcgtcta cttggcgacc ggcaccgaca ccggtggatc cgttcgcatc540ccttcgtcga tgtgcaacac cgtaggcctg aagccaacct acgggcgcgt gagccgtgcc600ggtgtgagtt cactttcctg gagcctggac catccaggcc cgatcacgcg caccgtggaa660gacacggcgc tcagccttca ggtgatggct ggcttcgatc cagccgaccg cggctcgttg720gatgagccgg tgcccagcta tgccgaaggg ctcggccaag gcgtgaaagg cctgcgcgtg780ggcgtgccga agaactactt cttcgaccgc gtggacccgg aagttgaaag tgcggttcgt840gccgccatcg atcaactgaa agagctgggc gccgaactgg tggaagtcga agtgcccatg900gccgagcaga tcatcccggt ggagttcggg atcgtgctac ccgaagccag cgcctaccac960cgcacgatgc tgcgcgagtc acccgagctc tacaccgccg atgtccgcat actgctggaa 1020ctcggaaatc tagtcaccgc caccgactac ctgcaggcgc agcgcgtccg tacgctgatg 1080cagcgcgcgg tggccgagat gttccagcgc atcgatgtgc tgatcgcacc cacactgccc 1140
atcccggctg ctcgcagcgg ggaggaggtc cacacatggc cggacggcac ggtagaggcg 1200ttgttcatgg cctatacgcg cttcacctcg ttcggcaacg tgacaggatt acccacgctg 1260aacctgccct gtggtttctc caaggatggg ttgccgatcg gcatgcagat caccggccgg 1320ccgctggacg agaagaccct gctgcgtgct gggctggcct acgagaaagc cacgacctgg 1380caccagcgtc atccggaact gatcggagcg ggctgagctg caagaaagca ggcgcggcgg 1440cgcacgaccc attgtgctac cgctgcgtct gcctgaagtg gccgagacca agcagaagaa 1500ggaggtgaca tagcctccta caatctgccg tcttctcgga gccctctgga tgctcgaagt 1560tctttgcatg gggttgcgcc gggagcgcaa tctgcaaggt ggcattggcc ttcagtgtcg 1620atgccgagtt gaagtcgctg tacccctttt ttcaaccaca ccaggagaac cgcaccatgg 1680ggcaatcaca cacgcatgac caccatcacg acgggtacca ggcaccgccc gaagacatcg 1740cgctgcgggt caaggccttg gagtctctgc tgatcgagaa aggtcttgtc gacccagcgg 1800ccatggactt ggtcgtccaa acgtatgaac acaaggtagg cccccgaaac ggcgccaaag 1860tcgtggccaa ggcctgggtg gaccctgcct acaaggcccg tctgctggca gacggcactg 1920ccggcattgc cgagctgggc ttctccgggg tacagggcga ggacatggtc attctggaaa 1980acacccccgc cgtccacaac gtcgtcgttt gcaccttgtg ctcttgctac ccatggccga 2040cgctgggctt gccccctgcc tggtacaagg ccccgcccta ccggtcccgc atggtgagcg 2100acccgcgtgg ggttctcgcg gagttcggcc tggtgatccc cgcgaaggaa atccgcgtct 2160gggacaccac ggccgaattg cgctacatgg tgctgccgga acggcccgcg ggaactgaag 2220cctacagcga agaacaactg gccgaactcg ttacccgcga ttcgatgatc ggcaccggcc 2280tgcccatcca acccacccca tctcattaag gagttcgtca tgaatggcat tcacgatact 2340gggggagcac atggttatgg gccggtttac agagaaccga acgaacccgt ctttcgctac 2400gactgggaaa aaacggtcat gtccctgttc ccggcgctgt tcgccaacgg caacttcaac 2460ctcgatgagt ttcgacacgg catcgagcgc atgaacccca tcgactacct gaagggaacc 2520tactacgaac actggatcca ttccatcgaa accttgctgg tcgaaaaggg tgtgctcacg 2580
gcaacggaac tcgcgaccgg caaggcatct ggcaagacag cgacaccggt gctgacgccg 2640gccatcgtgg acggactgct cagcaccggg gcttctgccg cccgggagga gggtgcgcgg 2700gcgcggttcg ctgtggggga caaggttcgc gtcctcaaca agaacccggt gggccatacc 2760cgcatgccgc gctacacgcg gggcaaagtg gggacagtgg tcatcgacca tggtgtgttc 2820gtgacgccgg acaccgcggc acacggaaag ggcgagcacc cccagcacgt ttacaccgtg 2880agtttcacgt cggtcgaact gtgggggcaa gacgcctcct cgccgaagga cacgattcgc 2940gtcgacttgt gggatgacta cctggagcca gcgtgatcat gaaagacgaa cggtttccat 3000tgccagaggg ttcgctgaag gacctcgatg gccctgtgtt tgacgagcct tggcagtccc 3060aggcgtttgc cttggtggtc agcatgcaca aggccggtct ctttcagtgg aaagactggg 3120ccgagacctt caccgccgaa atcgacgctt ccccggctct gcccggcgaa agcgtcaacg 3180acacctacta ccggcaatgg gtgtcggcgc tggaaaagtt ggtggcgtcg ctggggcttg 3240tgacgggtgg agacgtcaac tcgcgcgcac aggagtggaa acaggcccac ctcaacaccc 3300cacatgggca cccgatcctg ctggcccatg cgctttgccc gccagcgatc gaccccaagc 3360acaagcacga gccaaaacgc tcaccgatca aggtcgttgc cgcaatggct tgagatccac 3420tgtcctgttt ccctaccttg aagcttcag 3449
权利要求
1.一种编码包括腈水合酶的α-亚基的多肽的分离的多核苷酸,所述多肽具有SEQ ID NO4所示的氨基酸序列。
2.分离的多核苷酸,它编码的多肽与SEQ ID NO4所示的来自睾丸酮丛毛单胞菌5-MAGAM-4D的腈水合酶的多肽α-亚基具有90%同一性。
3.分离的多核苷酸,编码包括腈水合酶的α-亚基的多肽,所述分离的多核苷酸具有SEQ ID NO3所示的核酸序列。
4.一种多肽,所述多肽具有SEQ ID NO4所示的氨基酸序列。
5.分离的多核苷酸,编码包括腈水合酶的β-亚基的多肽,所述多肽具有SEQ ID NO6所示的氨基酸序列。
6.分离的多核苷酸,编码腈水合酶的β-亚基的多肽,所述分离的多核苷酸具有SEQ ID NO5所示的核酸序列。
7.分离的多核苷酸,它所编码的多肽与SEQ ID NO6所示的多肽具有80%同一性,其中,所述多肽是来自睾丸酮丛毛单胞菌5-MAGAM-4D的腈水合酶的β-亚基。
8.一种多肽,所述多肽具有SEQ ID NO6所示的氨基酸序列。
9.编码腈水合酶的α-和β-亚基的分离的多核苷酸,所述分离的多核苷酸具有SEQ ID NO7所示的核酸序列。
10.编码腈水合酶的α-和β-亚基和副属蛋白的分离的多核苷酸,所述分离的多核苷酸具有SEQ ID NO11所示的核酸序列。
11.分离的多核苷酸,编码包括酰胺酶的多肽,所述多肽具有SEQID NO17所示的氨基酸序列。
12.分离的多核苷酸,它所编码的多肽具有酰胺酶活性,并且与SEQ ID NO17所示的来自睾丸酮丛毛单胞菌5-MGAM-4D的多肽具有95%同一性。
13.分离的多核苷酸,编码包括酰胺酶的多肽,所述分离的多核苷酸具有SEQ ID NO16所示的核酸序列。
14.一种多肽,所述多肽具有SEQ ID NO17所示的氨基酸序列。
15.分离的多核苷酸,编码包括附属蛋白的多肽,所述多肽具有SEQ ID NO14所示的氨基酸序列。
16.分离的多核苷酸,编码包括附属蛋白的多肽,所述分离的多核苷酸具有SEQ ID NO13所示的核酸序列。
17.一种多肽,所述多肽具有SEQ ID NO14所示的氨基酸序列。
18.编码腈水合酶的α-和β-亚基,附属蛋白,和酰胺酶的分离的多核苷酸,所述腈水合酶的α-和β-亚基,附属蛋白,和酰胺酶是由SEQID NO23所示的核酸序列编码的。
19.包括权利要求1-3,5-7,9-13,15-16,或18中任意一项的核酸的表达载体。
20.包含在被命名为ATCC PTA-5073的大肠杆菌SW132中的表达载体。
21.包含在被命名为ATCC PTA-5074的大肠杆菌SW137中的表达载体。
22.转化过的微生物宿主细胞,包括权利要求19的表达载体。
23.转化过的微生物宿主细胞,包括权利要求20或21的表达载体。
24.如权利要求24的转化过的微生物宿主细胞,其中,所述微生物宿主细胞是a)选自下组的细菌埃希氏菌属,假单胞菌属,红球菌属,不动杆菌属,芽孢杆菌属,和链霉菌属;b)选自下组的酵母毕赤酵母属,汉逊酵母属,和糖酵母属;或c)选自下组的丝状真菌曲霉属,脉孢菌属,和青霉属。
25.如权利要求20的转化过的微生物宿主细胞,其中,所述微生物宿主细胞是大肠杆菌。
26.一种纯化的转化过的微生物宿主细胞,选自被命名为ATCCPTA-5073的大肠杆菌SW132和被命名为ATCC PTA-5074的大肠杆菌SW137。
27.一种生产多肽的方法,包括a)在合适条件下培养包括权利要求19所示表达载体的转化过的微生物宿主细胞;和b)回收在步骤a)中所生产的多肽。
28.一种用于将包括一个或多个腈官能团的底物转化成酰胺的方法,该方法包括a)在合适的反应条件下让表达由SEQ ID NO11所示核酸序列编码的腈水合酶多肽的转化过的微生物宿主细胞与包括一个或多个腈官能团的底物接触;和b)回收在步骤a)中所生产的酰胺。
29.如权利要求29的方法,其中,所述包括至少一个腈官能团的底物是具有式1R-C≡N或式2N≡C-R-C≡N的腈,其中,N是氮,C是碳,而R是a)C1-C9烷基,它是线性的,分支的,或环状的,任选取代的;b)C1-C9链烯基,它是线性的,分支的,或环状的,任选取代的;或c)C1-C9芳基,它是任选取代的。
30.如权利要求30的方法,其中,所述腈是2-羟基腈,3-羟基腈,或4-羟基腈。
31.如权利要求30的方法,其中,式2的R是线性的,或分支的C1-C4烷基。
32.如权利要求32的方法,其中,所述腈选自下组丙二腈,己二腈,戊二腈,和2-甲基戊二腈。
33.如权利要求30的方法,其中,式1的R是线性的,或分支的C1-C4链烯基。
34.如权利要求34的方法,其中,所述腈是丙烯腈或异丁烯腈。
35.一种将异丁烯腈水合为甲基丙烯酰胺的方法,包括a)让异丁烯腈在合适的反应条件下与来自睾丸酮丛毛单胞菌5-MGAM-4D的具有腈水合酶活性的催化剂接触。
36.如权利要求36的方法,其中,还包括b)回收在步骤a)中生产的甲基丙烯酰胺。
37.一种将丙烯腈水合为丙烯酰胺的方法,包括a)让丙烯腈在合适的反应条件下与来自睾丸酮丛毛单胞菌5-MAGAM-4D的具有腈水合酶活性的催化剂接触。
38.如权利要求38的方法,还包括b)回收在步骤a)中产生的丙烯酰胺。
全文摘要
本发明涉及来自睾丸酮丛毛单胞菌(Comamonastestosteroni)5-MAGAM-4D的编码腈水合酶(NHase)或酰胺酶(Am)的基因的分离,测序,和重组表达,其中,Nhase可用于催化某些腈水合成相应的酰胺,而酰胺酶被用于将某些酰胺水解成相应的羧酸。还提供了包括用于表达来自睾丸酮丛毛单胞菌5-MAGAM-4D的腈水合酶或酰胺酶的多核苷酸的转化过的宿主细胞。
文档编号C12N1/21GK1816621SQ200480019318
公开日2006年8月9日 申请日期2004年5月7日 优先权日2003年5月8日
发明者M·S·佩恩, R·迪科西莫, J·E·加瓦甘, R·D·法伦 申请人:纳幕尔杜邦公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1