HMG-CoA还原酶抑制剂的制备方法

文档序号:589195阅读:405来源:国知局
专利名称:HMG-CoA还原酶抑制剂的制备方法
技术领域
本发明涉及与抑制羟甲基戊二酸单酰CoA(HMG-CoA)还原酶,具有降低血清胆固醇作用的化合物的制备有关的DNA,及用该DNA制备该化合物的方法。
已经有几篇关于通过微生物,从通式(V-a)(式中,R1同前)表示的化合物(以下叫做化合物(V-a)), 或通式(V-b)表示的化合物(V-a)的内酯体(以下叫做化合物(V-b)), 生成化合物(VI-a)或化合物(VI-b)的方法的报道。
也就是,(特开昭57-50894)中叙述了应用丝状菌的方法,(特开平7-184670)(WO96/40863)中叙述了应用放线菌的方法,另外(特许第2672551号)中叙述了应用基因重组放线菌的方法。但是,众所周知由于丝状菌和放线菌通过伸长菌丝而进行生长,在发酵罐中增殖时,将导致培养液的粘度增加。
因此,培养液中的氧容易不足,因培养液变得不均一而容易导致反应效率降低。为了消除这种氧不足,保持培养液的均一,必须提高发酵罐的搅拌速度,但增加搅拌速度容易绞断菌丝,使微生物的活性降低(发酵工学的基础,p169-190,P.F.Stansbury,A.Whitaker著,学会出版中心,(1998))。
本发明的目的是提供编码新型羟化酶的DNA,及抑制羟甲基戊二酸单酰CoA(HMG-CoA)还原酶,并具有降低血清胆固醇作用的化合物在工业上有利的制备方法。
本发明者们考虑到,如果能够应用不形成菌丝的微生物,进行化合物(I-a)或化合物(I-b)的羟化,就能回避因菌丝形成造成的培养液不均一,及由此导致的反应效率降低等负面影响,所以在工业上是有利的。于是进行了深入研究,完成了本发明。
也就是说,本发明涉及以下(1)-(39)。
以下通式中,只要没有特殊说明,R1表示氢原子、取代或未取代的烷基或碱金属,R2表示取代或未取代的烷基或者取代或未取代的芳基。
(1)芽孢杆菌(Bacillus)属微生物来源的蛋白质,且具有这样的活性从通式(I-a)表示的化合物(以下叫做化合物(I-a)), 或通式(I-b)表示的化合物(I-a)的内酯体(以下叫做化合物(I-b)), 生成通式(II-a)表示的化合物(以下叫做化合物(II-a)), 或通式(II-b)表示的化合物(II-a)的内酯体(以下叫做化合物(II-b))。 (2)芽孢杆菌属微生物来源的蛋白质,且具有这样的活性从通式(III-a)表示的化合物(以下叫做化合物(III-a)), 或通式(III-b)表示的化合物(III-a)的内酯体(以下叫做化合物(III-b)), 生成通式(IV-a)表示的化合物(以下叫做化合物(IV-a)), 或通式(IV-b)表示的化合物(IV-a)的内酯体(以下叫做化合物(IV-b))。 (3)芽孢杆菌属微生物来源的蛋白质,且具有这样的活性从通式(V-a)表示的化合物(以下叫做化合物(V-a)), 或通式(V-b)表示的化合物(V-a)的内酯体(以下叫做化合物(V-b)), 生成通式(VI-a)表示的化合物(以下叫做化合物(VI-a)), 或通式(VI-b)表示的化合物(VI-a)的内酯体(以下叫做化合物(VI-b))。 (4)芽孢杆菌属微生物来源的蛋白质,且具有这样的活性从通式(VII-a)表示的化合物(以下叫做化合物(VII-a)), 或通式(VII-b)表示的化合物(VII-a)的内酯体(以下叫做化合物(VII-b)), 生成通式(VIII-a)表示的化合物(以下叫做化合物(VIII-a)), 或通式(VIII-b)表示的化合物(VIII-a)的内酯体(以下叫做化合物(VIII-b))。 (5)上述(1)-(4)中任一项所述的蛋白质,其中芽孢杆菌属的微生物选自枯草芽孢杆菌(B.subtilis)、巨大芽孢杆菌(B.megaterium)、侧孢芽孢杆菌(B.laterosporus)、球形芽孢杆菌(B.sphaericus)、短小芽孢杆菌(B.pumilus)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、蜡样芽孢杆菌(B.cereus)、栗褐芽孢杆菌(B.badius)、短芽孢杆菌(B.brevis)、蜂房芽孢杆菌(B.alvei)、环状芽孢杆菌(B.circulans)和浸麻芽孢杆菌(B.macerans)。
(6)上述(1)-(5)中任一项所述的蛋白质,其中芽孢杆菌属的微生物选自枯草芽孢杆菌ATCC6051株、巨大芽孢杆菌ATCC10778株、巨大芽孢杆菌ATCC11562株、巨大芽孢杆菌ATCC13402株、巨大芽孢杆菌ATCC15177株、巨大芽孢杆菌ATCC15450株、巨大芽孢杆菌ATCC19213株、巨大芽孢杆菌IAM1032株、侧孢芽孢杆菌ATCC 4517株、短小芽孢杆菌FERM BP-2064株、栗褐芽孢杆菌ATCC14574株、短芽孢杆菌NRRL B-8029株、蜂房芽孢杆菌ATCC6344株、环状芽孢杆菌NTCT-2610株及浸麻芽孢杆菌NCIMB-9368株。
(7)上述(1)-(5)中任一项所述的蛋白质,其中芽孢杆菌属的微生物选自芽孢杆菌属FERM BP-6029株和芽孢杆菌属FERM BP-6030株。
(8)蛋白质,具有序列号1记载的氨基酸序列。
(9)蛋白质,具有序列号1记载的氨基酸序列中1个以上的氨基酸发生缺失、置换或添加了的氨基酸序列,且具有从化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)的活性。
(10)上述(9)的蛋白质,具有序列号42或45记载的氨基酸序列。
(11)上述(9)的蛋白质,其中化合物(I-a)是化合物(III-a),化合物(I-b)是化合物(III-b),化合物(II-a)是化合物(IV-a),化合物(II-b)是化合物(IV-b)。
(12)上述(9)的蛋白质,其中化合物(I-a)是化合物(V-a),化合物(I-b)是化合物(V-b),化合物(II-a)是化合物(VI-a),化合物(II-b)是化合物(VI-b)。
(13)上述(9)的蛋白质,其中化合物(I-a)是化合物(VII-a),化合物(I-b)是化合物(VII-b),化合物(II-a)是化合物(VIII-a),化合物(II-b)是化合物(VIII-b)。
(14)分离纯化得到的DNA,具有序列号2记载的碱基序列。
(15)分离纯化得到的DNA,能与上述(14)的DNA在严格条件下进行杂交,且能编码具有从化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)活性的蛋白质。
(16)上述(15)的DNA,具有的碱基序列选自由序列号41、43及44记载的碱基序列构成的组。
(17)分离纯化得到的DNA,编码上述(1)-(12)中任一项记载的蛋白质。
(18)上述(15)的DNA,其中化合物(I-a)是化合物(III-a),化合物(I-b)是化合物(III-b),化合物(II-a)是化合物(IV-a),化合物(II-b)是化合物(IV-b)。
(19)上述(15)的DNA,其中化合物(I-a)是化合物(V-a),化合物(I-b)是化合物(V-b),化合物(II-a)是化合物(VI-a),化合物(II-b)是化合物(VI-b)。
(20)上述(15)的DNA,其中化合物(I-a)是化合物(VII-a),化合物(I-b)是化合物(VII-b),化合物(II-a)是化合物(VIII-a),化合物(II-b)是化合物(VIII-b)。
(21)重组DNA载体,它包含上述(14)-(20)中任一项记载的DNA。
(22)将上述(21)的重组DNA载体导入宿主细胞而得到的转化体。
(23)上述(22)的转化体,转化体属于选自埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、棒状杆菌属(Corynebacterium)和链霉菌属(Streptomyces)的微生物。
(24)上述(22)或(23)的转化体,转化体属于选自大肠杆菌(Escherichia coli)、枯草芽孢杆菌(Bacillus Subtilis)、巨大芽孢杆菌(Bacillus megaterium)、谷氨酸棒杆菌(Corynebacterium glutamicum)、产氨棒杆菌(Corynebacteriumammoniagenes)、美棒杆菌(Corynebacterium callunae)和浅青紫链霉菌(Streptomyces lividans)的微生物。
(25)化合物(II-a)或化合物(II-b)的制备方法,其特征在于,用上述(22)-(24)中任一项所述的转化体、该转化体的培养物或该培养物的处理物作为酶源,使化合物(I-a)或化合物(I-b)存在于水性介质中,并使化合物(II-a)或化合物(II-b)在水性介质中生成、蓄积,然后从该水性介质中提取化合物(II-a)或化合物(II-b)。
(26)化合物(IV-a)或化合物(IV-b)的制备方法,其特征在于,用上述(22)-(24)中任一项所述的转化体、该转化体的培养物或该培养物的处理物作为酶源,使化合物(III-a)或化合物(III-b)存在于水性介质中,并使化合物(IV-a)或化合物(IV-b)在水性介质中生成、蓄积,然后从该水性介质中提取化合物(IV-a)或化合物(IV-b)。
(27)化合物(VI-a)或化合物(VI-b)的制备方法,其特征在于,用上述(22)-(24)中任一项所述的转化体、该转化体的培养物或该培养物的处理物作为酶源,使化合物(V-a)或化合物(V-b)存在于水性介质中,并使化合物(VI-a)或化合物(VI-b)在水性介质中生成、蓄积,然后从该水性介质中提取化合物(VI-a)或化合物(VI-b)。
(28)化合物(VIII-a)或化合物(VIII-b)的制备方法,其特征在于,用上述(22)-(24)中任一项所述的转化体、该转化体的培养物或该培养物的处理物作为酶源,使化合物(VII-a)或化合物(VII-b)存在于水性介质中,并使化合物(VIII-a)或化合物(VIII-b)在水性介质中生成、蓄积,然后从该水性介质中提取化合物(VIII-a)或化合物(VIII-b)。
(29)上述(25)的制备方法,其中化合物(II-b)是由化合物(II-a)形成内酯而得到的化合物(II-b)。
(30)上述(25)的制备方法,其中化合物(II-a)是使化合物(II-b)的内酯开环而得到的化合物(II-a)。
(31)上述(26)的制备方法,其中化合物(IV-b)是由化合物(IV-a)形成内酯而得到的化合物(IV-b)。
(32)上述(26)的制备方法,其中化合物(IV-a)是使化合物(IV-b)的内酯开环而得到的化合物(IV-a)。
(33)上述(27)的制备方法,其中化合物(VI-b)是由化合物(VI-a)形成内酯而得到的化合物(VI-b)。
(34)上述(27)的制备方法,其中化合物(VI-a)是使化合物(VI-b)的内酯开环而得到的化合物(VI-a)。
(35)上述(28)的制备方法,其中化合物(VIII-b)是由化合物(VIII-a)形成内酯而得到的化合物(VIII-b)。
(36)上述(28)的制备方法,其中化合物(VIII-a)是使化合物(VIII-b)的内酯开环而得到的化合物(VIII-a)。
(37)上述(25)-(28)中任一项所述的制造方法,其中转化体培养物的处理物是选自培养菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂处理物、该菌体的酶处理物、该菌体的超声波处理物、该菌体的机械磨碎物、该菌体的溶剂处理物等菌体处理物,菌体的蛋白级分物,菌体及菌体处理物的固定化物的处理物。
(38)该蛋白质的制备方法,其特征在于,在培养基中培养上述(22)-(24)中任一项所述的转化体,让上述(1)-(12)中任一项所述的蛋白质在培养物中生成、蓄积,然后从该培养物中提取该蛋白质。
(39)相当于选自由序列号2、41、43及44记载的碱基序列构成的组的碱基序列中连续5-60个碱基构成的序列的寡核苷酸或相当于与该寡核苷酸互补的序列的寡核苷酸。
以下,对本发明进行详细说明。I.yjiB基因的获得可以利用已经确定的枯草杆菌染色体碱基序列的信息(http//www.pasteur.fr/Bio/SubtiList.html)以及由该碱基序列所推测出的枯草杆菌yjiB基因的信息,用PCR法(Science,230,1350(1985))克隆,获得本发明的DNA。
具体地,可以通过以下方法来获得。
将枯草杆菌,如枯草芽孢杆菌ATCC15563株在适于枯草杆菌的培养基中按常规方法进行培养,如应用LB液体培养基(1升水中含细菌用胰化蛋白胨(Difco公司制)10g,酵母提取物(Difco公司制)5g,NaCl5g,并调至pH 7.2的培养基)。培养后,通过离心从培养物中收集菌体。
按众知的方法(例如,《分子克隆》第二版),从所得菌体中分离纯化染色体DNA。
利用序列号2记载的碱基序列信息,用DNA合成仪合成正向引物和反向引物,引物中包含与编码本发明蛋白质的DNA区域相对应的碱基序列。
通过PCR方法扩增后,为了能将该扩增的DNA片段导入质粒,优选在正向引物和反向引物5′末端添加适当的限制酶切位点,如BamHI、EcoR I等的限制酶切位点。
作为正向引物和反向引物的组合,如具有序列号13和14组合的碱基序列的DNA等。
以染色体DNA作模板,应用这些引物、TaKaRa LA-PCR TM KitVer.2(宝酒造社制)或Expand TM High-Fidelity PCR System(ベ-リンガ-·マンハィム公司制),用DNA Thermal Cycler(Perkin-Elmer日本公司制)进行PCR。
进行PCR时可应用如下的方法。即,当上述引物为2kb以下的DNA片段时,以94℃30秒、55℃30秒-1分钟、72℃2分钟构成的反应程序作为1个循环。当上述引物为超过2kb的DNA片段时,以98℃20秒、68℃3分钟构成的反应程序作为1个循环。每种情况均进行30个循环后,72℃反应7分钟。
在与上述引物赋予的限制酶切位点相同的位点,对扩增的DNA片段进行酶切后,通过琼脂糖电泳、蔗糖密度梯度超速离心等手段分离、回收该DNA片段。
用该回收的DNA片段,应用《分子克隆》第二版、CurrentProtocols in Molecular Biology,Supplement 1-38,John Wileyand Sons(1987-1997)(以下略作Current Protocols in MolecularBiology Supplement)或DNA Cloning 1Core Techniques,APractical Approach,Second Edition,Oxford University Press(1995)等记载的方法,或应用市售的试剂盒,如SuperScriptPlasmid System for cDNA Synthesis and Plasmid Cloning(LifeTechnologies公司制)和ZAP-cDNA Synthesis Kit(Stratagene公司制)制作克隆载体,用制备的克隆载体转化大肠杆菌,如大肠杆菌DH5α株(可从东洋纺购入)。
用于转化大肠杆菌的克隆载体,只要能在大肠杆菌K12株中进行自主复制,噬菌体载体、质粒载体均可以应用,也可应用大肠杆菌的表达载体作为克隆载体。具体而言,可应用ZAP Express(Stratagene公司制,Strategies,5,58(1992))、pBluescript II SK(+)(Nucleic Acids Research,17,9494(1989))、Lamda ZAP II(Stratagene公司制)、λgt10、λgt11(DNA Cloning,A PracticalApproach,1,49(1985))、λTriplEx(Clontech公司制)、λExCell(Pharmacia公司制)、pT7T318U(Pharmacia公司制)、pcD2(H.0kayama and P.Berg;Mol.Cell.Biol.,3,280(1983))、pMW218(和光纯药社制)、pUC118、pSTV28(宝酒造社制)、pEG400(J.Bac.,172,2392(1990))、pHMV1520(MoBiTec公司制)、pQE-30(QIAGEN公司制)等。
应用常规方法,如《分子克隆》第二版、Current Protocols inMolecular Biology Supplement,DNA Cloning 1Core Techniques,A Practical Approach,Second Edition,0xford University Press(1995)等记载的方法,可从所得转化体中获得含有目的DNA的质粒。
通过该方法可获得含有编码催化由化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)反应的蛋白质的DNA的质粒。
作为该质粒,如后述的pSyjiB。
除上述方法之外,通过用适当的载体,以大肠杆菌作宿主,制作枯草杆菌的染色体文库,对该文库的各株,通过检测由化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)的活性的方法,也可以从该文库中获得含有编码催化由化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)反应的蛋白质的DNA的质粒。
利用上述得到的基因的碱基序列等,通过与上述同样的方法,可从其它原核生物或植物中获得该DNA的同源物。
应用由上述方法得到的本发明DNA及DNA片段,通过常规方法可制备出具有本发明DNA的一部分序列的反义寡核苷酸、有义寡核苷酸等寡核苷酸,或含有RNA的寡核苷酸。另外,以上面得到的DNA序列信息为基础,应用上述DNA合成仪,也可合成这些寡核苷酸。
作为该寡核苷酸,例如具有与上述DNA具有的碱基序列中连续5-60个碱基相同序列的DNA或具有该DNA互补序列的DNA。另外,具有这些DNA互补序列的RNA也是本发明的寡核苷酸。
作为该寡核苷酸,例如具有与序列号2、41、43或44表示的碱基序列中连续的5-60个碱基相同序列的DNA或具有该DNA互补序列的DNA。作为正向引物和反向引物使用时,优选二者的解链温度(Tm)及碱基数没有极端变化的上述寡核苷酸。具体而言,例如具有上述序列号3-39所示碱基序列的寡核苷酸。
再者,这些寡核苷酸的衍生物(以下,叫做寡核苷酸衍生物)也可用作本发明的寡核苷酸。
作为寡核苷酸衍生物,例如寡核苷酸中的磷酸二酯键转变为磷酸硫酯键的寡核苷酸衍生物,寡核苷酸中的磷酸二酯键转变为N3′-P5′磷酰胺键的寡核苷酸衍生物,寡核苷酸中的核糖与磷酸二酯键转变为肽核酸键的寡核苷酸衍生物,寡核苷酸中尿嘧啶置换为C-5丙炔基尿嘧啶的寡核苷酸衍生物,寡核苷酸中尿嘧啶置换为C-5噻唑尿嘧啶的寡核苷酸衍生物,寡核苷酸中胞嘧啶置换为C-5丙炔基胞嘧啶的寡核苷酸衍生物,寡核苷酸中胞嘧啶置换为吩噁嗪修饰的胞嘧啶(phenoxazine-modified cytosine)的寡核苷酸衍生物,寡核苷酸中的核糖置换成2′-O-丙基核糖的寡核苷酸衍生物或寡核苷酸中的核糖置换成2′-甲氧乙氧核糖的寡核苷酸衍生物等(细胞工学,16,1463(1997))。II催化由化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)反应的蛋白质的制备方法为了使如上述得到的DNA在宿主细胞中表达,首先,用限制酶类或DNA酶类将目的DNA片段酶切成包含该基因的适当长度的DNA片段后,插入到表达载体中的启动子的下游,然后将该表达载体导入到适于表达该表达载体的宿主细胞中。
宿主细胞有细菌、酵母、动物细胞、昆虫细胞等,能表达目的基因的均能使用。
表达载体可使用在上述宿主细胞中能自主复制、整合到染色体中,在能转录上述目的DNA的位置含有启动子的载体。
用细菌等原核生物作宿主细胞时,用于表达上述DNA的表达载体,优选在该细胞内能进行自主复制的同时,由启动子、核糖体结合序列、上述DNA及转录终止序列构成的重组载体。也可包含启动子的调控基因。
表达载体例如pBTrp2、pBTacl、pBTac2(均购自ベ-リンガ-マンハィム公司)、pKK233-2(Pharmacia公司制)、pSE280(Invitrogen公司制)、pGEMEX-1(Promega公司制)、pQE-8(QIAGEN公司制)、pQE-30(QIAGEN公司制)、pKYP10(特开昭58-110600)、pKYP200(Agricultural Biological Chemistry,48,669(1984))、pLSA1(Agric.Biol.Chem.,53,277(1989))、pGEL1(Proc.Natl.Acad.Sci.USA,82,4306(1985))、pBluescriptII SK(+)、pBluescript II SK(-)(Stratagene公司制)、pTrS30(FERM BP-5407)、pTrS32(FERM BP-5408)、pGEX(Pharmacia公司制)、pET-3(Novagen公司制)、pTerm2(US4686191、US4939094、US5160735)、pSupex、pUB110、pTP5、pC194、pUC18(gene,33,103(1985))、pUC19(Gene,33,103(1985))、pSTV28(宝酒造社制)、pSTV29(宝酒造社制)、pUC118(宝酒造社制)、pPA1(特开昭63-233798)、pEG400(J.Bacteriol.,172,2392(1990))、pQE-30(QIAGEN公司制)、PHY300(宝酒造社制)、pHW1520(MoBiTec公司制)等。
启动子只要可以在宿主细胞中表达,可使用任意一种启动子。例如,trp启动子(P trp)、lac启动子(P lac)、PL启动子、PR启动子、PSE启动子等来源于大肠杆菌和噬菌体的启动子,SP01启动子、SP02启动子、penP启动子等。另外,也可应用将2个P trp串连在一起的启动子(P trp×2)、tac启动子、let I启动子、lacT7启动子等人为设计改变的启动子等。还可使用能在芽孢杆菌属细菌中表达的xylA启动子和能在棒状杆菌属细菌中表达的P54-6启动子等。
作为核糖体结合序列,只要能在宿主细胞中表达,可使用任意一种核糖体结合序列,但优选使用将Shine-Dalgarno序列与起始密码子间调整到适当距离(如6-18个碱基)的质粒。
为了有效进行转录、翻译,也可以表达催化由化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)反应的蛋白质的N末端或缺失其一部分的蛋白质与表达载体编码的蛋白质的N末端部分融合的蛋白质。这样的例子如后述的pWyjiB。
转录终止序列对目的DNA的表达未必是必不可少的,但优选在结构基因的正下游设置转录终止序列。
原核生物例如属于埃希氏菌属、棒状杆菌属、短杆菌属、芽孢杆菌属、微杆菌属、沙雷氏菌属、假单胞菌属、土壤杆菌属、脂环酸杆菌属、鱼腥蓝细菌属、组囊蓝细菌属、节杆菌属、固氮菌属、着色菌属、欧文氏菌属、甲基杆菌属、席蓝细菌属、红细菌属、红假单胞菌属、红螺菌属、链霉菌属、聚球蓝细菌属、发酵单胞菌属等的微生物,优选属于埃希氏菌属、棒状杆菌属、短杆菌属、芽孢杆菌属、假单胞菌属、土壤杆菌属、脂环酸杆菌属、鱼腥蓝细菌属、组囊蓝细菌属、节杆菌属、固氮菌属、着色菌属、欧文氏菌属、甲基杆菌属、席蓝细菌属、红细菌属、红假单胞菌属、红螺菌属、链霉菌属、聚球蓝细菌属、发酵单胞菌属等的微生物。
作为该微生物的具体实例,如大肠杆菌XL1-Blue、大肠杆菌XL2-Blue、大肠杆菌DH1、大肠杆菌DH5α、大肠杆菌MC1000、大肠杆菌KY3276、大肠杆菌W1485、大肠杆菌JM109、大肠杆菌HB101、大肠杆菌No.49、大肠杆菌W3110、大肠杆菌NY49、大肠杆菌MP347、大肠杆菌NM522、枯草芽孢杆菌ATCC33712、巨大芽孢杆菌、芽孢杆菌属FERM BP-6030、解淀粉芽孢杆菌、产氨棒杆菌、immariophilum短杆菌(Brevibacterium immariophilum)ATCC14068、解糖短杆菌ATCC14066、黄色短杆菌ATCC14067、谷氨酸棒杆菌ATCC13869、谷氨酸棒杆菌ATCC13032、谷氨酸棒杆菌ATCC14297、嗜乙酰乙酸棒杆菌ATCC13870,美棒杆菌ATCC15991,嗜氨微杆菌ATCC15354、无花果沙雷氏菌属、居泉沙雷氏菌属,液化沙雷氏菌属,粘质沙雷氏菌属,假单胞菌属D-0110、放射形土壤杆菌,发根土壤杆菌,悬钩子土壤杆菌,柱孢鱼腥蓝细菌,桶形鱼腥蓝细菌,水华鱼腥蓝细菌、金黄节杆菌、柠檬节杆菌、球形节杆菌、烃谷氨酸节杆菌(Arthrobacterhydrocarboglutamicus)、迈索尔节杆菌、烟草节杆菌、石蜡节杆菌、原玻璃蝇节杆菌、玫瑰色石蜡节杆菌、硫磺节杆菌、产脲节杆菌、巴氏着色菌、微温着色菌、酒色着色菌、沃氏着色菌、河流着色菌、噬夏孢欧文氏菌、胡萝卜软腐欧文氏菌、菠萝欧文氏菌、草生欧文氏菌、斑点欧文氏菌、土生欧文氏菌(Erwina terreus)、罗得西亚甲基杆菌、扭脱甲基杆菌、席蓝细菌属ATCC29409、荚膜红细菌、类球红细菌、生芽红细菌、海红菌、血色红假单胞菌、深红红螺菌、需盐红螺菌、盐场红螺菌、产二素链霉菌、金霉素链霉菌、金色链霉菌、杀真菌素链霉菌、灰产色链霉菌、灰色链霉菌、浅青紫链霉菌、橄榄灰链霉菌、枝链霉菌、田无链霉菌、酒红链霉菌、运动发酵单胞菌。
作为导入重组载体的方法,只要是将DNA导入上述宿主细胞的方法,可用任何一种方法。例如,应用钙离子的方法(Proc.Natl.Acad.Sci.USA,69,2110(1972))、原生质体法(特开昭63-248394)、电穿孔法或记载于Gene,17,107(1982)和Molecular and General Genetics,168,111(1979)中的方法。
应用酵母作宿主细胞时,表达载体例如,YEp13(ATCC37115)、YEp24(ATCC37051)、YCp50(ATCC37419)、pHS19、pHS15等。
作为启动子,只要能在酵母中表达即可,例如PH05启动子、PGK启动子、GAP启动子、ADH启动子、gal 1启动子、gal 10启动子、热休克蛋白质启动子、MFα1启动子、CUP1启动子等启动子。
作为酵母菌株例如啤酒酵母(Saccharomyces cerevisiae)、栗酒裂殖酵母(Schizosaccharomyces pombe)、乳克鲁维氏酵母(Kluyveromyces lactis)、茁芽丝孢酵母(TrichosporonPullulans)、河岸许旺氏酵母(Schwanniomyces alluvius)等。
导入重组载体的方法,只要是将DNA导入酵母的方法,任何一种方法均可,例如电穿孔法(Methods.Enzymol.,194,182(1990))、原生质球法(Proc.Natl.Acad.Sci.USA,75,1929(1978))、醋酸锂法(J.Bacteriol.,153,163(1983);Proc.Natl.Acad.Sci.USA,75,1929(1978))记载的方法等。
应用动物细胞作宿主细胞时,表达载体如pcDNA I、pcDM8(购自フナコシ公司)、pAGE107(特开平3-22979;Cytotechnology,3,133(1990))、pAS3-3(特开平3-227075)、pCDM8(Nature,329,840(1987))、pcDNAI/Amp(Invitrogen公司制)、pREP4(Invitrogen公司制)、pAGE103(J.Biochem.,101,1307(1987))、pAGE210等。
启动子只要能在动物细胞中表达即可,例如可使用巨细胞病毒(人CMV)的IE(immediate early)基因的启动子、SV40的早期启动子、逆转录病毒的启动子、金属硫蛋白启动子、热休克启动子、SRα启动子等。另外,可将人CMV的IE基因的增强子与启动子一起使用。
作为动物细胞,例如Namalwa细胞、HBT5637(特开昭63-299)、COSl细胞、COS7细胞、CH0细胞等。
将重组载体导入动物细胞的方法,只要是能将DNA导入动物细胞的方法即可。例如电穿孔法(Cytotechnology,3,133(1990)),磷酸钙法(特开平2-227075),脂转染法(Proc.Natl.Acad.Sci.,USA,84,7413(1987),Virology,52,456(1973))记载的方法等。转化体的获得及培养可按照特开平2-227075号公报或特开平2-257891号公报记载的方法进行。
应用昆虫细胞作宿主时,可应用Baculovirus ExpressionVectors,A Laboratory Manunal、 Current Protocols in MolecularBi lolgy supplement 1-38(1987-1997),Bio/Technology,6,47(1988)等记载的方法,表达蛋白质。
即,将重组基因的导入载体和杆状病毒共导入昆虫细胞,在该昆虫细胞培养上清液中得到重组病毒以后,再用重组病毒感染昆虫细胞,并表达蛋白质。
作为该方法中所使用的基因导入载体,如pVL1392,pVL1393,pBlueBacIII(均由Invitrogen公司制)等。
杆状病毒可使用感染夜盗蛾科昆虫的病毒苜蓿银纹夜蛾核型多角体病毒(Autographa californica nuclear polyhedrosis virus)等。
昆虫细胞可使用草地夜蛾(Spodoptera frugiperda)的卵巢细胞Sf9,Sf21(Baculovirus Expression Vectors,A LaboratoryManunal,W.H.Freeman and Company,New York,(1992)),粉纹夜蛾(Trichoplusia ni) 的卵巢细胞High5(Invitrogen公司制)等。
为了制备重组病毒,作为上述重组基因的导入载体和杆状病毒共导入昆虫细胞的方法,例如磷酸钙法(特开平2-227075),脂转染法(Proc.Natl.Acad.Sci.USA,84,7413(1987))等。
作为基因的表达方法,除直接表达以外,可按照《分子克隆》第二版中记载的方法,进行分泌生产、融合蛋白的表达等。
应用酵母、动物细胞或昆虫细胞进行表达时,可得到添加了糖或糖链的蛋白质。
通过在培养基中培养如上得到的转化体,在培养物中生成、蓄积催化由化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)反应的蛋白质,并从该培养物中提取该蛋白质,可制备出催化由化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)反应的蛋白质。
本发明中,制备催化由化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)反应的蛋白质时所用的转化体在培养基中的培养方法,可以使用培养转化体宿主时所采用的常规方法。
本发明的转化体为大肠杆菌等原核生物、酵母菌等真核生物时,培养这些微生物所用的培养基只要是含有该微生物可以利用的碳源、氮源、无机盐类等,能有效地培养转化体的培养基,无论天然培养基、合成培养基均可应用。
碳源只要是各种微生物可以利用的物质即可,可使用葡萄糖、果糖、蔗糖、含有这些糖的糖蜜、淀粉或淀粉水解物等碳水化合物,醋酸、丙酸等有机酸,乙醇、丙醇等醇类。
作为氮源,可应用氨、氯化铵、硫酸铵、醋酸铵、磷酸铵等各种无机酸和有机酸的铵盐,其它含氮的化合物,以及蛋白胨、肉汁、酵母提取物、玉米浸渍液、酪蛋白水解物、大豆粕及大豆粕水解物、各种发酵菌体及其消化物等。
作为无机物,可使用磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠、硫酸亚铁、硫酸锰、硫酸铜、碳酸钙等。
培养在振荡培养或深部通气搅拌培养等有氧条件下进行。培养温度为15-50℃,培养时间通常为16小时-7天。培养中pH保持在3.0-9.0。可用无机或有机酸、碱溶液、尿素、碳酸钙、氨等调整pH值。
另外,培养过程中必要时可向培养基中加入氨苄青霉素和四环素等抗生素。
用诱导性启动子作为启动子的表达载体转化得到的微生物在培养时,必要时也可以向培养基中加入诱导物。例如,培养用lac启动子的表达载体转化得到的微生物时,可以向培养基中加入异丙基-β-D-硫代吡喃半乳糖苷(IPTG);培养用trp启动子的表达载体转化得到的微生物时,可以向培养基中加入吲哚丙烯酸(IAA)等;培养用xylA启动子的表达载体转化得到的微生物时,可以向培养基中加入木糖。
培养以动物细胞作宿主细胞所得到的转化体的培养基可以使用通常惯用的RPMT1640培养基(The Journal of the American MedicalAssociation,199,519(1967)),Eagle的MEM培养基(Science,122,501(1952)),DEME培养基(Virology,8,396(1959)),199培养基(Proceeding of the Society for the Biological Medicine,73,1(1950))或者向这些培养基中添加了胎牛血清的培养基等。
通常在pH6-8、30-40℃、5%CO2存在等条件下培养1-7天。
另外,在培养过程中必要时也可以向培养基中加入卡那霉素、青霉素等抗生素。
培养以昆虫细胞作宿主细胞所得到的转化体的培养基可以使用通常惯用的TNM-FH培养基(Pharmingen公司制)、Sf-900IISFM培养基(GibcolBRL公司制)、ExCe11400、ExCe11405(均由JRHBiosciences公司制)、Grace′s Insect Medium(Grace,T.C.C.,Nature,195,788(1962))等。
通常在pH6-7、25-30℃等条件下培养1-5天。
另外,在培养过程中必要时也可以向培养基中加入庆大霉素等抗生素。
由本发明的转化体培养物中分离纯化催化由化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)反应的蛋白质时,可以用通常的分离、纯化方法。
例如,本发明的蛋白质在细胞内以溶解状态表达时,培养终止后,通过离心回收细胞,悬浮到水性缓冲液中,然后用超声破碎仪、弗氏压碎机、Manton-Gaulin匀浆器、Dyno碾磨机等将细胞破碎,得到无细胞提取液。将该无细胞提取液离心获得的上清液通过常规的酶分离、纯化方法,可以得到纯化标准品,即单独或组合使用溶剂抽提法,硫酸铵盐析法,脱盐法,有机溶剂沉淀法,使用二乙氨基乙基(DEAE)-Sepharose、DIATON HPA-75(三菱化成社制)等树脂的阴离子交换色谱法,使用S-Sepharose FF(Pharmacia公司制)等树脂的阳离子交换色谱法,使用丁基-Sepharose、苯基-Sepharose等树脂的疏水性色谱法,使用分子筛的凝胶过滤法,亲和色谱法,聚焦色谱法,等电聚焦电泳等电泳法等方法。
另外,蛋白质在细胞内以不溶解状态表达时,同样在回收细胞后将之破碎,通过离心,从沉淀部分用常规方法回收该蛋白质。用蛋白质变性剂使回收的蛋白质不溶物可溶化。将该可溶化液用不合蛋白质变性剂或蛋白质变性剂的浓度达不到使蛋白质变性的程度的稀溶液进行稀释或进行透析,使蛋白质形成正常的立体结构后,用与上述同样的分离纯化方法得到纯化标准品。
当本发明的蛋白质或其糖修饰体等衍生物分泌到细胞外时,可从培养上清液中回收该蛋白质或其糖修饰体等的衍生物。即,用与上述同样的离心等方法处理该培养物,获得可溶性组分,用与上述同样的分离纯化方法从该可溶性组分获得纯化标准品。
如此所得的蛋白质,例如具有序列号1、42或45所示氨基酸序列的蛋白质。另外,通过上述方法表达的蛋白质也可通过Fmoc法(芴基甲氧基羰基法)、tBoc法(叔丁氧基羰基法)等化学合成方法进行制备。另外,该蛋白质也可用桑和贸易(美国Advanced chemTech公司制)、Perkin-Elmer日本公司(美国Perkin-Elmer公司制)、Pharmacia Biotech公司(瑞典Pharmacia Biotech公司制)、ァロカ(美国Protein Technology Instrument公司制)、クラボゥ(美国Synthecell-Vega公司制)、日本PerSeptive Limited(美国PerSeptive公司制)、岛津制作所等的肽合成仪进行合成。III.化合物(II-a)或化合物(II-b)的制备上述II中获得的转化体按上述II的方法培养而得的细胞、该细胞的培养物、该培养物的处理物、或从该细胞提取出的酶等作为酶源,使化合物(I-a)或化合物(I-b)存在于水性介质中,并使化合物(II-a)或化合物(II-b)在该水性介质中生成、蓄积,通过从该水性介质中提取化合物(II-a)或化合物(II-b)就可制备出化合物(II-a)或化合物(II-b)。
细胞培养物的处理物例如该细胞的干燥物、该细胞的冷冻干燥物、该细胞的表面活性剂处理物、该细胞的酶处理物、该细胞的超声波破碎物、该细胞的机械磨碎物、该细胞的溶剂处理物等细胞处理物,该细胞的蛋白级分物,该细胞及该细胞处理物的固定化物等。
从化合物(I-a)或化合物(I-b)向化合物(II-a)或化合物(II-b)的转换方法可采用(a)(b)任一种方法,(a)向培养细胞的培养基中预先添加化合物(I-a)或化合物(I-b)的方法,(b)培养过程中添加化合物(I-a)或化合物(I-b)的方法。另外,也可采用使培养细胞而得的酶源在水性介质中作用于化合物(I-a)或化合物(I-b)的方法。
向培养细胞的培养基中添加化合物(I-a)或化合物(I-b)时,无论在培养开始还是培养过程中添加,添加化合物(I-a)或化合物(I-b)的量为每1ml培养基0.1-10mg,优选0.2-1mg。优选将化合物(I-a)或化合物(I-b)溶解到水或甲醇、乙醇等有机溶剂中后添加到培养基中。
采用使培养细胞而得的酶源在水性介质中作用于化合物(I-a)或化合物(I-b)的方法时,所用酶源的量根据该酶源的比活性而变化。例如,用细胞的培养物或细胞或者它们的处理物作为酶源时,每1mg化合物(I-a)或化合物(I-b)添加该酶源5-1000mg,优选添加10-400mg。反应优选在水性介质中20-50℃进行,特别优选在25-37℃进行。反应时间根据所用酶源的量及比活性等而变化,通常是2-150小时,优选6-120小时。
水性介质例如水、磷酸缓冲液、HEPES(N-2羟乙基哌嗪-N-乙磺酸)缓冲液、Tris(三(羟甲基)氨基甲烷)盐酸缓冲液等缓冲液。可向该缓冲液中添加有机溶剂,只要不阻碍反应即可。有机溶剂例如丙酮、乙酸乙酯、二甲基亚砜、二甲苯、甲醇、乙醇、丁醇等。有机溶剂和水性介质的混合液,例如在应用化合物(I-b)时优选应用。
将化合物(I-a)或化合物(I-b)添加到水性介质中时,将化合物(I-a)或化合物(I-b)溶解到可以溶解化合物(I-a)或化合物(I-b)的水性介质中,然后添加到水性介质中。可向溶解的该水性介质中添加有机溶剂,只要不阻碍反应即可。有机溶剂例如丙酮、乙酸乙酯、二甲基亚砜、二甲苯、甲醇、乙醇、丁醇等。
应用后述例举的内酯体开环方法,可容易地由化合物(I-b)或化合物(II-b)分别转换成化合物(I-a)或化合物(II-a)。另外,应用后述例举的内酯体生成方法,可容易地由化合物(I-a)或化合物(II-a)分别转换成化合物(I-b)或化合物(II-b)。
内酯体开环方法例如将化合物(I-b)或化合物(II-b)溶解到水性介质中,添加酸或碱的方法。水性介质如水、磷酸缓冲液、Tris缓冲液等含有不阻碍反应的盐类的水溶液。该水溶液中可含有不阻碍反应的浓度的甲醇、乙醇、乙酸乙酯等有机溶剂。酸例如醋酸、盐酸、硫酸等,碱例如氢氧化钠、氢氧化钾、氨等。
内酯体生成方法例如将化合物(I-a)或化合物(II-a)溶解到非水系溶剂中,添加酸或碱催化剂的方法。非水系溶剂只要是实质上不含水的有机溶剂,能溶解化合物(I-a)或化合物(II-a)即可。非水系溶剂例如二氯甲烷、乙酸乙酯等。作为催化剂,只要能催化内酯化反应,不对底物和反应产物产生内酯化以外的作用即可采用任何一种催化剂。该催化剂例如三氟醋酸和对甲苯磺酸等。反应温度无特别限制,但优选0-100℃,特别优选20-80℃。
从反应溶液提取化合物(II-a)或化合物(II-b)可以采用通常有机合成化学中采用的方法,例如用有机溶剂萃取、结晶、薄层色谱、高效液相色谱等。
本发明所得化合物(II-a)或化合物(II-b)的定性或定量方法只要是对化合物(II-a)和/或化合物(II-b)能进行定性或定量的方法,任一种方法均可。例如,13C-NMR谱、1H-NMR谱、质谱、高效液相色谱(HPLC)等方法。
本发明的化合物(I-a)、化合物(I-b)、化合物(II-a)和化合物(II-b)中,可以存在光学异构体等立体异构体,本发明包含连同这些异构体在内的所有可能的异构体及其混合物。
化合物(I-a)优选化合物(III-a)、更优选化合物(V-a)、特别优选化合物(VII-a)。
化合物(I-b)优选化合物(III-b)、更优选化合物(V-b)、特别优选化合物(VII-b)。
化合物(II-a)优选化合物(IV-a)、更优选化合物(VI-a)、特别优选化合物(VIII-a)。
化合物(II-b)优选化合物(IV-b)、更优选化合物(VI-b)、特别优选化合物(VIII-b)。
烷基为直链或支链状的,碳数为1-10,优选1-6的烷基,例如甲基、乙基、丙基、异丙基、丁基、异丁基、仲丁基、叔丁基、戊基、新戊基、己基、异己基、庚基、4,4-二甲基戊基、辛基、2,2,4-三甲基戊基、壬基、癸基、它们的各种支链异构体等。
芳香基例如苯基、萘基等。
取代烷基的取代基相同或不同,例如1-3个卤素、羟基、氨基、烷氧基、芳香基等。
取代芳香基的取代基相同或不同,例如1-3个卤素、羟基、氨基、烷基、烷氧基等。
烷氧基中的烷基部分与上述的烷基同义。
碱金属表示锂、钠、钾、铷、铯、钫等各元素。
以下是本发明的实施例,但本发明并不局限于这些实施例。
将化合物(VII-b)(Sigma公司制)100mg溶解到9.5ml甲醇中,加入1mol/l氢氧化钠0.5ml,室温振荡1小时。将所得溶液干燥固化,加入5ml去离子水溶解,用1mol/l盐酸约0.1ml调pH值到7左右,再加入去离子水4.9ml,得到终浓度为10mg/ml的化合物(VII-a)(式中R为钠的化合物)10mL。
将枯草芽孢杆菌Marburg 168株(ATCC15563株)1接种环接种到10ml的LB液体培养基中,30℃培养一晚。培养后,通过将所得培养液离心,得到菌体。
用常规方法从该菌体中分离、纯化出染色体DNA。
用DNA合成仪合成具有序列号3和4、序列号5和6、序列号7和8、序列号9和10、序列号11和12、序列号13和14、序列号15和16的碱基序列组合的正向引物和反向引物。
以染色体DNA作模板,用这些引物和TaKaRa LA-PCR TM KitVer.2(宝酒造社制),Expand TM High-Fidelity PCR System(ベ-リンガ-·マ ンィム公司制)或Taq DNA聚合酶(Boelinnger公司制),用DNA Thermal Cycler(Perkin Elmer日本公司制)进行PCR。
PCR在下述条件下进行2kb以下的DNA片段以94℃30秒、55℃30秒、72℃2分钟构成的反应程序为一个循环,超过2kb的DNA片段以98℃20秒、68℃3分钟构成的反应程序为一个循环,进行30个循环后,在72℃反应7分钟。
分别用限制酶EcoR I和Sal I酶切用PCR扩增的DNA片段中,应用序列号3和4的引物组合扩增出的DNA片段(含bioI基因),用限制酶Xbal和SmaI酶切应用序列号5和6的引物组合扩增出的DNA片段(含cypA基因),用限制酶SmaI和SalI酶切应用序列号7和8的引物组合扩增出的DNA片段(含cypX基因),用限制酶EcoRI和Sal I酶切应用序列号9和10的引物组合扩增出的DNA片段(含pksS基因),用限制酶XbaI和Bgl II酶切应用序列号11和12的引物组合扩增出的DNA片段(含yet0基因),用限制酶XbaI和SmaI酶切应用序列号13和14的引物组合扩增出的DNA片段(含yjiB基因),用限制酶XbaI和SmaI酶切应用序列号15和16的引物组合扩增出的DNA片段(含yrhJ基因)。
酶切后,将这些限制酶处理的DNA片段进行琼脂糖凝胶电泳,得到各限制酶处理的DNA片段。
用限制酶Sal I和EcoR I酶切载体质粒pUC119(宝酒造社制)后,进行琼脂糖凝胶电泳,得到Sal I-EcoR I处理的pUC119片段。同样用限制酶Sal I和SmaI酶切载体质粒pUC119后,进行琼脂糖凝胶电泳,得到Sal I-SmaI处理的pUC119片段。
用限制酶XbaI和SmaI酶切pSTV28(宝酒造社制)后,进行琼脂糖凝胶电泳,得到XbaI-SmaI处理的pSTV28片段。同样,用限制酶XbaI和BamH I酶切pSTV28后,进行琼脂糖凝胶电泳,得到XbaI-BamH I处理的pSTV28片段。
分别将上述所得EcoR I-Sal I处理的DNA片段(应用序列号3和4的引物组合进行PCR扩增)与Sal I-EcoR I处理的pUC119片段混合,XbaI-SmaI处理的DNA片段(应用序列号5和6的引物组合进行PCR扩增)与XbaI-SmaI处理的pSTV28片段混合,SmaI-SalI处理的DNA片段(应用序列号7和8的引物组合进行PCR扩增)与Sal I-SmaI处理的pUC119片段混合,EcoR I-Sal I处理的DNA片段(应用序列号9和10的引物组合进行PCR扩增)与Sal I-EcoR I处理的pUC119片段混合,XbaI-Bgl II处理的DNA片段(应用序列号11和12的引物组合进行PCR扩增)与XbaI-BamH I处理的pSTV28片段混合,XbaI-SmaI处理的DNA片段(应用序列号13和14的引物组合进行PCR扩增)与XbaI-SmaI处理的pSTV28片段混合,XbaI-SmaI处理的DNA片段(应用序列号15和16的引物组合进行PCR扩增)与XbaI-SmaI处理的pSTV28片段混合,然后进行乙醇沉淀,得到的DNA沉淀物溶解于5μl蒸馏水,并进行连接反应,分别得到各重组DNA。
用该重组DNA按照常规方法转化大肠杆菌(购自东洋纺)DH5α株,然后将转化体涂到LB琼脂培养基上,用pUC119作为载体质粒时,涂到含氨苄青霉素100μg/ml的LB琼脂培养基(1L中有细菌用胰化蛋白胨(Difco公司制)10g,细菌用酵母提取物(Difco公司制)5g,NaCl 5g,用1mol/l NaOH调pH到7.4,含琼脂1.5%),用pSTV28作为载体质粒时,涂到含氯霉素25μg/ml的LB琼脂培养基上,25℃培养2天。
挑选数个长出的氨苄青霉素抗性或氯霉素抗性的转化体菌落,接种到含氨苄青霉素100μg/ml或氯霉素25μg/ml的LB液体培养基(1L中有细菌用胰化蛋白胨(Difco公司制)10g,细菌用酵母提取物(Difco公司制)5g,NaCl 5g,用1mol/l NaOH调pH到7.4)10ml上,25℃振荡培养2天。
将所得培养液离心,得到菌体。
用常规方法从该菌体中分离纯化质粒。
用各种限制酶酶切分离纯化出的质粒,进行酶切鉴定并测定碱基序列,根据结果判定该质粒中插入了目的DNA片段。分别将EcoR I-Sal I处理的DNA片段(应用序列号3和4的引物组合进行PCR扩增)与Sal I-EcoR I处理的pUC119片段连接所得的质粒命名为pUbioI,XbaI-SmaI处理的DNA片段(应用序列号5和6的引物组合进行PCR扩增)与XbaI-SmaI处理的pSTV28片段连接所得的质粒命名为pScypA,SmaI-SalI处理的DNA片段(应用序列号7和8的引物组合进行PCR扩增)与Sal I-SmaI处理的pUC119片段连接所得的质粒命名为pUcypX,EcoR I-Sal I处理的DNA片段(应用序列号9和10的引物组合进行PCR扩增)与Sal I-EcoR I处理的pUC119片段连接所得的质粒命名为pUpksS,XbaI-Bgl II处理的DNA片段(应用序列号11和12的引物组合进行PCR扩增)与XbaI-BamH I处理的pSTV28片段连接所得的质粒命名为pSyetO,XbaI-SmaI处理的DNA片段(应用序列号13和14的引物组合进行PCR扩增)与XbaI-SmaI处理的pSTV28片段连接所得的质粒命名为pSyjiB,XbaI-SmaI处理的DNA片段(应用序列号15和16的引物组合进行PCR扩增)与XbaI-SmaI处理的pSTV28片段连接所得的质粒命名为pSyrhJ。
分别将含有这些质粒的大肠杆菌DH5α、含有pUC119或pSTV28的大肠杆菌DH5α及不含质粒的大肠杆菌DH5α接种到LB液体培养基3ml(添加载体质粒具有的抗药性基因所对应的药物)中,28℃振荡培养12小时。将该培养液0.5ml接种到含1%葡萄糖、CaCO31%的LB液体培养基(添加抗药性基因所对应的药物)中,28℃振荡培养12小时。取1ml培养液放入到阿氏试管中(Assist公司制),添加葡萄糖和先前得到的化合物(VII-a)(R1为钠的化合物),使终浓度分别达1%和100mg/l,28℃振荡培养24小时。反应终止后,通过离心去除菌体,向所得反应上清液中加入等量的乙酸乙酯,充分振荡。通过离心从该溶液分离出上层的乙酸乙酯层,将乙酸乙酯层用离心蒸发仪干燥。将干燥物溶解到最初培养上清液1/5量的甲醇中,进行HPLC分析(柱Intersil ODS-2(5μm,4×250mm,GL science公司制),柱温度60℃,移动相乙腈∶水∶磷酸=55∶45∶0.05,流速0.9ml/min,检测波长237nm),进行化合物(VIII-a)(式中,R1为钠的化合物)的检测、定量。结果如表1所示。
表1质粒 化合物(VIII-a)(mg/l)无 0pUC119 0pSTV28 0pUbioI 0pScypA 0pUcypX 0pUpksS 0pSyetO 0pSyjiB 0.6pSyrhJ 0实施例2 枯草杆菌作宿主时yjiB基因的表达以及该基因编码的蛋白质活性的确认用DNA合成仪合成具有序列号17和18、序列号19和20、序列号21和22、序列号23和24、序列号25和26、序列号27和28、序列号29和30的碱基序列组合的正向引物和反向引物。
以实施例1中获得的枯草杆菌染色体DNA作模板,用这些引物和TaKaRa LA-PCR TM Kit Ver.2(宝酒造社制)、Expand TM High-Fidelity PCR System(ベ-リンガ-·マンハィム公司制)或Taq DNA聚合酶(Boelinnger公司制),用DNA Thermal Cycler(Perkin Elmer日本公司制)进行PCR。
PCR在下述条件下进行2kb以下的DNA片段以94℃30秒、55℃30秒、72℃2分钟构成的反应程序为一个循环,超过2kb的DNA片段以98℃20秒、68℃3分钟构成的反应程序为一个循环,进行30个循环后,在72℃反应7分钟。
分别用限制酶Spe I和BamH I酶切在PCR扩增的DNA片段中,应用序列号17和18的引物组合扩增出的DNA片段(含bioI基因),用限制酶Spe I和BamH I酶切应用序列号19和20的引物组合扩增出的DNA片段(含cypA基因),用限制酶Spe I和Nru I酶切应用序列号21和22的引物组合扩增出的DNA片段(含cypX基因),用限制酶Spe I和BamH I酶切应用序列号23和24的引物组合扩增出的DNA片段(含pksS基因),用限制酶Spe I和BamH I酶切应用序列号25和26的引物组合扩增出的DNA片段(含yetO基因),用限制酶Spe I和BamH I酶切应用序列号27和28的引物组合扩增出的DNA片段(含yjiB基因),用限制酶Spe I和BamH I酶切应用序列号29和30的引物组合扩增出的DNA片段(含yrhJ基因)。
酶切后,将这些限制酶处理的DNA片段进行琼脂糖凝胶电泳,得到各限制酶处理的DNA片段。
用限制酶Spe I和BamH I酶切载体质粒pWH1520(MoBiTec公司制)后,进行琼脂糖凝胶电泳,得到Spe I-BamH I处理的pWH1520片段。同样用限制性酶Spe I和Nru I酶切载体质粒pWH1520后,进行琼脂糖凝胶电泳,得到Spe I-Nru I处理的pWH1520片段。
分别将上述得到的Spe I-BamH I处理DNA片段(用序列号17和18、19和20、23和24、25和26、27和28、29和30的引物组合进行PCR扩增)与Spe I-BamH I处理的pWF1520片段混合,Spe I-NruI处理的DNA片段(用序列号21和22的引物组合进行PCR扩增)与Spe I-Nru I处理的pWF1520片段混合,然后乙醇沉淀,将所得DNA沉淀物溶解到5μl蒸馏水中,进行连接反应,获得各个的重组DNA。
应用重组DNA按照常规方法转化大肠杆菌(购自东洋纺)DH5α株,然后涂到含四环素10μg/ml的LB琼脂培养基上,25℃培养2天。将所得培养液离心,得到菌体。
用常规方法从该菌体中分离纯化质粒。
用各种限制酶酶切分离纯化出的质粒,进行酶切鉴定并测定碱基序列,根据结果判定该质粒中插入了目的DNA片段。分别将应用序列号17和18的引物组合进行PCR扩增的DNA片段与pWH1520连接所得的质粒命名为pWbioI,应用序列号19和20的引物组合进行PCR扩增的DNA片段与pWH1520连接所得的质粒命名为pWcypA,应用序列号21和22的引物组合进行PCR扩增的DNA片段与pWH1520连接所得的质粒命名为pWcypX,应用序列号23和24的引物组合进行扩增的DNA片段与pWH1520连接所得的质粒命名为pWpksS,应用序列号25和26的引物组合进行扩增的DNA片段与pWH1520连接所得的质粒命名为pWyetO,应用序列号27和28的引物组合进行扩增的DNA片段与pWH1520连接所得的质粒命名为pWyjiB,应用序列号29和30的引物组合进行扩增的DNA片段与pWH1520连接所得的质粒命名为pWyrhJ。
按照S.chang and S.N.cohen(S.chang and S.N.cohenMol.Gen.Genet.,168,111(1979))等的方法,将所得质粒及载体质粒pWH1520导入枯草芽孢杆菌ATCC33712株中。
即,将ATCC33712株接种到装有5ml Pen培养基(将DifcoAntibiotic medium No.3 1.75g溶解到100ml水中,高压灭菌)的粗试管中,37℃振荡培养一晚。然后,将培养了一晚的菌体全部接种到装有100ml Pen培养基的300ml锥形瓶中,37℃振荡培养3小时,使之生长到对数生长期中期。将该培养液在无菌条件下,5000rpm离心10分钟,使菌体沉淀。去除上清液后,悬浮到4.5ml SMMP(×2SMMP(将蔗糖34.2g,马来酸0.464g,氯化镁.6水合物0.813g溶解于水中,用氢氧化钠调至pH6.5后,制成100ml,高压灭菌)与×4 Pen培养基(Difco Antibiotic medium No.3 7g溶解到100ml水中,高压灭菌)的等量混合物),加入0.5ml溶菌酶溶液(将10mg的溶菌酶(生化学工业) 溶解到0.5ml SMMP中,用孔径0.45μm的微孔滤膜过滤除菌),37℃缓慢振荡培养2小时。显微镜下确认90%以上的细胞原生质体化后,3000rpm离心20分钟,使原生质体沉淀。除去上清液,将所得原生质体再悬浮到5ml SMMP中。再3000rpm离心20分钟,收集原生质体,悬浮到2ml SMMP中,作为转化受体菌的原生质体悬浮液。
将质粒DNA约1μg溶解到SMMP中,与原生质体悬浮液0.5ml充分混合。混合后立即加入40%聚乙二醇溶液(聚乙二醇6000(ナカラィテスク)40g溶解到×2 SMMP中,加水到100ml后,高压灭菌)1.5ml,并充分混合。室温放置2分钟后,加入5ml SMMP并混合,3000rpm离心20分钟。除去上清液后,向沉淀的原生质体中加入1mlSMMP并悬浮,30℃缓慢振荡3小时。用SMMP适当稀释后,涂到加入药物(四环素的场合,加到10μg/ml)的DM3培养基(细菌用琼脂(Difco公司制)80g/L 45ml,酪蛋白氨基酸(casamino acid)50g/L 50ml,琥珀酸钠6水合物338g/L pH7.3 250ml,磷酸缓冲液(磷酸氢二钾35g/L,磷酸二氢钾15g/L)50ml,酵母提取物100g/L 25ml,氯化镁·6水合物203g/L 10ml,葡萄糖100g/L 25ml,分别高压灭菌后,混合,加入3.5ml 20mg/ml用0.45um微孔滤膜过滤除菌的牛血清白蛋白)上。37℃培养1-2天,得到转化株。
如此获得具有上述各质粒的枯草芽孢杆菌ATCC33712株。
分别将所得转化体以及未导入质粒的ATCC33712株接种到LB液体培养基3ml(对含有质粒的菌株添加10mg/l的四环素),30℃振荡培养24小时。取该培养液0.25ml接种到含有TB培养基(细菌用胰化蛋白胨(Difco公司制)1.4%,细菌用酵母提取物(Difco公司制)2.4%,KH2PO40.231%,K2HPO41.251%,用1mol/l氢氧化钠调至pH7.4)5ml的试管中,30℃振荡培养3小时。3小时后,取1ml培养液移到阿氏试管No.60.54OS(Assist公司制),添加40μl灭菌后的50%木糖溶液,再振荡培养3小时,然后将实施例1所得化合物(VII-a)(R为钠的化合物)以终浓度0.2mg/ml分别加到试管中,再30℃振荡培养16小时,进行反应。
反应终止后,用醋酸将反应液的pH调整为3.5。向该反应液0.5ml中加入乙酸乙酯1ml,振荡1小时。振荡后,3000rpm离心5分钟,将反应液分为2层,回收上清的乙酸乙酯层,用离心蒸发仪除去溶剂后,将残渣溶解到0.5ml甲醇中。
用该甲醇溶液的一部分进行与实施例1同样的HPLC分析,进行化合物(VIII-a)(式中R1为钠的化合物)的检测、定量。结果如表2所示。
表2质粒化合物(VIII-a)(mg/l)无0.5pWH1520 0.5pWbioI 0.5pWcypA 0.5pWcypX 0.5pWpksS 0.5pWyetO 0.5pWyjiB 24.6pWyrhJ 0.5由实施例1、2的结果可以看出,yjiB基因编码由化合物(VII-a)或化合物(VII-b)生成化合物(VIII-a)或化合物(VIII-b)的活性。
另外,用上述序列号27和28的引物组合进行PCR扩增的DNA片段中含有序列号2记载的碱基序列,该碱基序列中含有编码具有序列号1记载的氨基酸序列的蛋白质的碱基序列。
实施例3以巨大芽孢杆菌作宿主时yjiB基因的表达及化合物(VIII-a)的生成用与实施例2中记载的枯草杆菌转化法相同的方法,将实施例2中制备的pWyjiB导入巨大芽孢杆菌(MoBiTec公司制)及芽孢杆菌属FERM BP-6030。
与实施例2同样培养所得转化体及不带有质粒的宿主,进行反应,测定生成的化合物(VIII-a)的量。结果如表3所示。
表3宿主质粒化合物(VIII-a)(mg/l)B.megaterium 无 2.0″ pWyjiB27.2FERM BP-6030 无 4.5″ pWyjiB30.3实施例4 制备在棒状杆菌中表达生成化合物(VIII-a)的蛋白质的质粒为了使实施例1中获得的yjiB基因能在棒状杆菌中有效表达,用DNA合成仪合成具有序列号31、32、33、34、35、36、37、38、39记载的碱基序列的DNA。
将含有可在棒状杆菌中表达的启动子序列p54-6(GeneBankAJ132582)、具有序列号40记载的碱基序列的DNA片段,插入到质粒载体pCS299P(特愿平11-110437)的Sse83871-BamH I位点间的质粒pRI 109 DNA,由该质粒转化的大肠杆菌NM522株按常规方法制备。
以实施例2中得到的pWyjiB DNA作模板,用具有序列号31和32碱基序列的DNA引物和Taq DNA聚合酶(宝酒造社制),用DNA ThermalCycler 480(Perkin Elmer日本公司制)进行PCR。
PCR在下述条件下进行以96℃30秒、50℃45秒、72℃3分钟构成的反应程序为一个循环,进行25个循环的反应。
用Sal I和BamH I酶切通过PCR扩增的DNA片断后,进行琼脂糖凝胶电泳,按常规方法纯化大约1.2kb的DNA片段,得到Sal I-BamH I处理的DNA片段。
用限制酶Sal I和BamH I酶切上述得到的质粒pRT109DNA后,进行琼脂糖凝胶电泳,按常规方法纯化大约62kb的DNA片段,得到Sal I-BamH I处理的pRI 109片段。
将上述得到的Sal I-BamH I处理的DNA片段与Sal I-BamH I处理的pRT109片段混合,然后进行连接反应,得到重组DNA。
用该重组DNA,按常规方法转化大肠杆菌DH5α(购自东洋纺社)后,涂到含卡那霉素20μg/ml的LB琼脂培养基上,30℃培养1天,获得转化体。
按常规方法从该转化体中分离纯化质粒。以分离出的质粒DNA为模板,分别以具有序列号33、34、35、36、37的碱基序列的DNA作引物,用DyeTerminator Cycle Sequencing Kit(Applied Biosystem公司制)及373A测序仪(Applied Biosystem公司制),确定插入的DNA片段的碱基序列,将序列号41的碱基序列插入到pRT109的Sal I-BamH I位点间的质粒命名为pRIyjiB。
序列号41记载的碱基序列中含有编码具有序列号42记载的氨基酸序列的蛋白质的碱基序列。
以实施例1中得到的枯草芽孢杆菌Marburg168株(ATCC15563株)的染色体DNA作模板,使用具有序列号38及39的碱基序列的DNA引物和LA-Taq DNA聚合酶(宝酒造社制),用DNA Thermal Cycler480(Perkin Elmer日本公司制)进行PCR。
PCR在下述条件下进行以96℃30秒、55℃30秒、72℃2分钟构成的反应程序为一个循环,进行30个循环后,72℃反应7分钟。
将PCR扩增的DNA片段与pT7Blue(购自宝酒造社)混合后,进行连接反应,获得重组DNA。
用该重组DNA,按常规方法转化大肠杆菌DH5α(购自东洋纺社)后,涂到含有氨苄青霉素100μg/ml的LB琼脂培养基上,30℃培养1天,获得转化体。
按常规方法从转化体中分离纯化质粒。按常规方法用各种限制酶酶切分离出的质粒DNA,酶切鉴定确认是插入了目的DNA片段的质粒,命名为pTSYN2-72。
用Xho I和BamH I酶切pTSYN2-72 DNA,然后进行琼脂糖凝胶电泳,按常规方法纯化出约1.2kb的DNA片段,获得Xho I-BamH I处理的DNA片段。
用限制性酶Sal I和BamH I酶切pRI 109 DNA,然后进行琼脂糖凝胶电泳,按常规方法纯化出约6kb的DNA片段,获得Sal I-BamHI处理的pRI 109片段。
将上述取得的Xho I-BamH I处理的DNA片段与Sal I-BamH I处理的pRI 109片段混合后,进行连接反应,得到重组DNA。
用该重组DNA,按常规方法转化大肠杆菌DH5α(购自东洋纺社),涂到含卡那霉素20μg/ml的LB琼脂培养基上,30℃培养1天,获得转化体。
按常规方法从该转化体中分离纯化质粒。以分离出的质粒DNA为模板,分别以具有序列号33、34、35、36、37的碱基序列的DNA作引物,用DyeTerminator Cycle Sequencing Kit(Applied Biosystem公司制)及373A测序仪(Applied Biosystem公司制),确定插入的DNA片段的碱基序列,将序列号43的序列插入到pRI 109的Sal I-BamH I位点间的质粒命名为pSYN2-72。
序列号43记载的碱基序列中含有编码具有序列号1记载的氨基酸序列的蛋白质的碱基序列。
以实施例2中得到的pWyjiB DNA作模板,以具有序列号38及39的碱基序列的DNA作引物,用Z-Taq DNA聚合酶(宝酒造社制),用DNA Thermal Cycler 480(Perkin Elmer日本公司制)进行PCR。
PCR在下述条件下进行以98℃20秒、55℃20秒、72℃30分钟构成的反应程序为一个循环,进行25个循环的反应。
用Xho I和BamH I酶切PCR扩增的DNA片段,然后进行琼脂糖凝胶电泳,按常规方法纯化出约1.2kb的DNA片段,获得Xho I-BamHI处理的DNA片段。
用限制酶Sal I和BamH I酶切质粒pRI 109 DNA,然后进行琼脂糖凝胶电泳,按常规方法纯化出约6kb的DNA片段,获得Sal I-BamH I处理的pRI 109片段。
将上述取得的Xho I-BamH I处理的DNA片段与Sal I-BamH I处理的pRI 109片段混合后,进行连接反应,得到重组DNA。
用该重组DNA,按常规方法转化大肠杆菌DH5α(购自东洋纺社),涂到含卡那霉素20μg/ml的LB琼脂培养基上,30℃培养1天,获得转化体。
按常规方法从该转化体中分离纯化质粒。以分离出的质粒DNA为模板,分别以具有序列号33、34、35、36、37的碱基序列的DNA作引物,用DyeTerminator Cycle Sequencing Kit(Applied Biosystem公司制)及373A测序仪(Applied Biosystem公司制),确定插入的DNA片段的碱基序列,将序列号44记载的碱基序列插入到pRT109的Sal I-BamH I位点间的质粒命名为pSYN2-39。
序列号44记载的碱基序列中含有编码具有序列号45记载的氨基酸序列的蛋白质的碱基序列。
实施例5谷氨酸棒杆菌ATCC13032株的质粒导入及活性评价将ATCC13032株接种到加入了8ml肉汤培养基(普通肉汤培养基(极东制药工业社制)20g/l,细菌用酵母提取物(Difco公司制)5g/l)的试管中,30℃振荡培养一晚。然后取培养了一晚的菌体5ml接种在加入了250ml肉汤培养基的21锥形瓶中,30℃振荡培养4小时。将所得培养液离心,使菌体沉淀。去除上清液后,悬浮到预冷的30ml EPB(250mmol/l蔗糖,15%(v/v)甘油)中,离心,再度将菌体沉淀。同样,再度悬浮到EPB中,离心,分离菌体,然后将菌体悬浮到2ml的EPB中。分别将0.1ml得到的菌体悬浮液注入到0.5ml的管中,用干冰速冻,得到转化用的菌体悬浮液。将所得菌体在-80℃下保存。
在冰上融解冻结的转化用菌体悬浮液0.1ml,43.5℃保持10分钟后,移到冰上。添加含pRT109DNA约2μg的水溶液2μl后,移到预冷的大肠杆菌GenePulser杯(BioRad公司制)中,通过用GenePulser(BioRad公司制)的电穿孔法,在25μF、200Ω、1.5kV的条件下,将DNA导入到细菌内。电穿孔后,立即将菌体悬浮液全部移到加入了1ml肉汤培养基的15ml体积的试管中,30℃振荡培养1小时。
将所得培养液3500rpm,离心10分钟,使菌体沉淀。弃上清液后,重新添加0.1ml肉汤培养基,悬浮菌体后,将悬浮液涂到含卡那霉素20μg/ml的肉汤琼脂培养基(用2%Difco琼脂固化的肉汤培养基)上,30℃培养2天,得到转化体。
如此获得具有pRT109的谷氨酸棒杆菌ATCC13032株。
与上述同样,获得具有实施例4中获得的pRIyjiB、pSYN2-72、pSYN2-39各质粒的谷氨酸棒杆菌ATCC13032株。
将所得转化体分别接种到加入3ml肉汤培养基的试管中,培养基中含卡那霉素100μg/ml,30℃振荡培养24小时。取培养液0.2ml移入到加入2ml含卡那霉素100μg/ml的LMC培养基(向高压灭菌的pre-LMC培养基(NH4Cl 1g/l,KH2PO41g/l,K2HPO43g/l,Difco酵母提取物0.2g/l,尿素1g/l,生物素0.05mg/l,硫胺素0.5mg/l,玉米浸渍液10g/l,pH7.2)中分别添加灭菌了的葡萄糖、MgSO4、FeSO4、MnSO4,终浓度分别为30g/l、0.1g/l、2mg/l、2mg/l)的试管中,30℃振荡培养5小时。添加化合物(VII-a)(式中R为钠的化合物)终浓度为300mg/l,再30℃振荡培养16小时。
将反应液0.5ml移入1.5ml的管中,15,000rpm离心2分钟,分离菌体。用甲醇将所得上清液部分稀释到5-20倍,15,000rpm离心2分钟后,用其一部分,进行与实施例1同样的HPLC分析,进行化合物(VIII-a)(式中R1为钠的化合物)的检测、定量。根据定量结果算出反应液中化合物(VIII-a)的浓度,结果如表4所示。
表4质粒化合物(VIII-a)(mg/l)pRI109 0.3pSYN2-7230pRIyjiB 61pSYN2-39104实施例6棒状杆菌的质粒导入及活性评价用与实施例5记载的ATCC13032株的转化方法同样的方法,将实施例4中取得的pRIyjiB DNA导入美棒杆菌ATCC15991、产氨棒杆菌ATCC6872、黄色短杆菌ATCC14067中,分别由各菌株得到转化株。
将所得转化体分别接种到装有3ml肉汤培养基、含100μg/ml卡那霉素的试管中,30℃振荡培养24小时。取0.5ml培养液移入到装有含100μg/ml卡那霉素、葡萄糖10g/l的5mlTB培养基(细菌用胰化蛋白胨(Difco公司制)14g,细菌用酵母提取物24g(Difco公司制)溶解到900ml水中后,高压灭菌,再加入高压灭菌了的PB(KH2PO423.1g/l,K2HPO4125.1g/l)100ml)的试管中,30℃振荡培养5小时。取培养液1ml移到阿氏试管(Assist公司制)中,添加化合物(VII-a)(式中R为钠的化合物)终浓度为300mg/l,再30℃振荡培养16小时。
反应终止后,按实施例2中记载的方法,进行反应液中的化合物(VIII-a)(式中R1为钠的化合物)的检测、定量。根据定量的结果算出的培养液中化合物(VIII-a)的浓度,如表5所示。
表5宿主 质粒 化合物 (VIII-a)(mg/l)C.callunae ATCC15991(KY3510) pRIyjiB 22C.ammoniagenes ATCC6872(KY3454)pRIyjiB 12B.flavum ATCC14067(KY10122)pRIyjiB 23工业实用性本发明可高效制备新型的编码羟化酶的DNA及抑制羟甲基戊二酸单酰CoA(HMG-CoA)还原酶、具有降低血清胆固醇作用的化合物。
序列表说明序列号3合成DNA序列号4合成DNA序列号5合成DNA序列号6合成DNA序列号7合成DNA序列号8合成DNA序列号9合成DNA序列号10合成DNA序列号11合成DNA序列号12合成DNA序列号13合成DNA序列号14合成DNA序列号15合成DNA序列号16合成DNA序列号17合成DNA序列号18合成DNA序列号19合成DNA序列号20合成DNA
序列号21合成DNA序列号22合成DNA序列号23合成DNA序列号24合成DNA序列号25合成DNA序列号26合成DNA序列号27合成DNA序列号28合成DNA序列号29合成DNA序列号30合成DNA序列号31合成DNA序列号32合成DNA序列号33合成DNA序列号34合成DNA序列号35合成DNA序列号36合成DNA序列号37合成DNA序列号38合成DNA序列号39合成DNA序列号40合成DNA
序列表SEQUENCE LISTING<110>协和发酵工业株式会社<120>HMG-CoA还原酶抑制剂的制备方法<130>H11-0011T4<160>45<170>PatentIn Ver.2.0<210>1<211>396<212>PRT<213>枯草芽孢杆菌<400>1Met Asn Val Leu Asn Arg Arg Gln Ala Leu Gln Arg Ala Leu Leu Asn1 5 10 15Gly Lys Asn Lys Gln Asp Ala Tyr His Pro Phe Pro Trp Tyr Glu Ser20 25 30Met Arg Lys Asp Ala Pro Val Ser Phe Asp Glu Glu Asn Gln Val Trp
35 40 45Ser Val Phe Leu Tyr Asp Asp Val Lys Lys Val Val Gly Asp Lys Glu50 55 60Leu Phe Ser Ser Cys Met Pro Gln Gln Thr Ser Ser Ile Gly Asn Ser65 70 75 80Ile Ile Asn Met Asp Pro Pro Lys His Thr Lys Ile Arg Ser Val Val85 90 95Asn Lys Ala Phe Thr Pro Arg Val Met Lys Gln Trp Glu Pro Arg Ile100 105 110Gln Glu Ile Thr Asp Glu Leu Ile Gln Lys Phe Gln Gly Arg Ser Glu115 120 125Phe Asp Leu Val His Asp Phe Ser Tyr Pro Leu Pro Val Ile Val Ile130 135 140Ser Glu Leu Leu Gly Val Pro Ser Ala His Met Glu Gln Phe Lys Ala145 150 155 160Trp Ser Asp Leu Leu Val Ser Thr Pro Lys Asp Lys Ser Glu Glu Ala165 170 175Glu Lys Ala Phe Leu Glu Glu Arg Asp Lys Cys Glu Glu Glu Leu Ala180 185 190Ala Phe Phe Ala Gly Ile Ile Glu Glu Lys Arg Asn Lys Pro Glu Gln195 200 205Asp Ile Ile Ser Ile Leu Val Glu Ala Glu Glu Thr Gly Glu Lys Leu210 215 220Ser Gly Glu Glu Leu Ile Pro Phe Cys Thr Leu Leu Leu Val Ala Gly225 230 235240Asn Glu Thr Thr Thr Asn Leu Ile Ser Asn Ala Met Tyr Ser Ile Leu245 250 255Glu Thr Pro Gly Val Tyr Glu Glu Leu Arg Ser His Pro Glu Leu Met260 265 270Pro Gln Ala Val Glu Glu Ala Leu Arg Phe Arg Ala Pro Ala Pro Val275 280 285Leu Arg Arg Ile Ala Lys Arg Asp Thr Glu Ile Gly Gly His Leu Ile290 295 300Lys Glu Gly Asp Met Val Leu Ala Phe Val Ala Ser Ala Asn Arg Asp305 310 315 320Glu Ala Lys Phe Asp Arg Pro His Met Phe Asp Ile Arg Arg His Pro325 330 335Asn Pro His Ile Ala Phe Gly His Gly Ile His Phe Cys Leu Gly Ala340 345 350Pro Leu Ala Arg Leu Glu Ala Asn Ile Ala Leu Thr Ser Leu Ile Ser355 360 365Ala Phe Pro His Met Glu Cys Val Ser Ile Thr Pro Ile Glu Asn Ser370 375 380Val Ile Tyr Gly Leu Lys Ser Phe Arg Val Lys Met385 390 395<210>2<211>1191<212>DNA<213>枯草芽孢杆菌<220><221>CDS<222>(1)..(1191)<400> 2atg aat gtg tta aac cgc cgg caa gcc ttg cag cga gcg ctg ctc aat 48Met Asn Val Leu Asn Arg Arg Gln Ala Leu Gln Arg Ala Leu Leu Asn1 5 10 15ggg aaa aac aaa cag gat gcg tat cat ccg ttt cca tgg tat gaa tcg 96Gly Lys Asn Lys Gln Asp ALa Tyr His Pro Phe Pro Trp Tyr Glu Ser20 25 30atg aga aag gat gcg cct gtt tcc ttt gat gaa gaa aac caa gtg tgg 144Met Arg Lys Asp Ala Pro Val Ser Phe Asp Glu Glu Asn Gln Val Trp35 40 45agc gtt ttt ctt tat gat gat gtc aaa aaa gtt gtt ggg gat aaa gag 192Ser Val Phe Leu Tyr Asp Asp Val Lys Lys Val Val Gly Asp Lys Glu50 55 60ttg ttt tcc agt tgc atg ccg cag cag aca agc tct att gga aat tcc 240Leu Phe Ser Ser Cys Met Pro Gln Gln Thr Ser Ser Ile Gly Asn Ser65 70 75 80atc att aac atg gac ccg ccg aag cat aca aaa atc cgt tca gtc gtg 288Ile Ile Asn Met Asp Pro Pro Lys His Thr Lys Ile Arg Ser Val Val85 90 95aac aaa gcc ttt act ccg cgc gtg atg aag caa tgg gaa ccg aga att 336Asn Lys Ala Phe Thr Pro Arg Val Met Lys Gln Trp Glu Pro Arg Ile100 105 110caa gaa atc aca gat gaa ctg att caa aaa ttt cag ggg cgc agt gag 384Gln Glu Ile Thr Asp Glu Leu Ile Gln Lys Phe Gln Gly Arg Ser Glu115 120 125ttt gac ctt gtt cac gat ttt tca tac ccg ctt ccg gtt att gtg ata 432Phe Asp Leu Val His Asp Phe Ser Tyr Pro Leu Pro Val Ile Val Ile130 135 140tct gag ctg ctg gga gtg cct tca gcg cat atg gaa cag ttt aaa gca 480Ser Glu Leu Leu Gly Val Pro Ser Ala His Met Glu Gln Phe Lys Ala145 150 155 160tgg tct gat ctt ctg gtc agt aca ccg aag gat aaa agt gaa gaa gct 528Trp Ser Asp Leu Leu Val Ser Thr Pro Lys Asp Lys Ser Glu Glu Ala165 170 175gaa aaa gcc ttt ttg gaa gaa cga gat aag tgt gag gaa gaa ctg gcc 576Glu Lys Ala Phe Leu Glu Glu Arg Asp Lys Cys Glu Glu Glu Leu Ala180 185 190gcg ttt ttt gcc ggc atc ata gaa gaa aag cga aac aaa ccg gaa cag 624Ala Phe Phe Ala Gly Ile Ile Glu Glu Lys Arg Asn Lys Pro Glu Gln195 200 205gat att att tct att tta gtg gaa gcg gaa gaa aca ggc gag aag ctg 672Asp Ile Ile Ser Ile Leu Val Glu Ala Glu Glu Thr Gly Glu Lys Leu210 215 220tcc ggt gaa gag ctg att ccg ttt tgc acg ctg ctg ctg gtg gcc gga 720Ser Gly Glu Glu Leu Ile Pro Phe Cys Thr Leu Leu Leu Val Ala Gly225 230 235 240aat gaa acc act aca aac ctg att tca aat gcg atg tac agc ata tta 768Asn Glu Thr Thr Thr Asn Leu Ile Ser Asn Ala Met Tyr Ser Ile Leu245 250 255gaa acg cca ggc gtt tac gag gaa ctg cgc agc cat cct gaa ctg atg 816Glu Thr Pro Gly Val Tyr Glu Glu Leu Arg Ser His Pro Glu Leu Met260 265 270cct cag gca gtg gag gaa gcc ttg cgt ttc aga gcg ccg gcc ccg gtt 864Pro Gln Ala Val Glu Glu Ala Leu Arg Phe Arg Ala Pro Ala Pro Val275 280 285ttg agg cgc att gcc aag cgg gat acg gag atc ggg ggg cac ctg att 912Leu Arg Arg Ile Ala Lys Arg Asp Thr Glu Ile Gly Gly His Leu Ile290 295 300aaa gaa ggt gat atg gtt ttg gcg ttt gtg gca tcg gca aat cgt gat 960Lys Glu Gly Asp Met Val Leu Ala Phe Val Ala Ser Ala Asn Arg Asp305 310 315 320gaa gca aag ttt gac aga ccg cac atg ttt gat atc cgc cgc cat ccc 1008Glu Ala Lys Phe Asp Arg Pro His Met Phe Asp Ile Arg Arg His Pro325 330 335aat ccg cat att gcg ttt ggc cac ggc atc cat ttt tgc ctt ggg gcc 1056Asn Pro His Ile Ala Phe Gly His Gly Ile His Phe Cys Leu Gly Ala340 345 350ccg ctt gcc cgt ctt gaa gca aat atc gcg tta acg tct ttg att tct 1104Pro Leu Ala Arg Leu Glu Ala Asn Ile Ala Leu Thr Ser Leu Ile Ser355 360 365gct ttt cct cat atg gag tgc gtc agt atc act ccg att gaa aac agt 1152Ala Phe Pro His Met Glu Cys Val Ser Ile Thr Pro Ile Glu Asn Ser370 375 380gtg ata tac gga tta aag agc ttc cgt gtg aaa atg taa 1191Val Ile Tyr Gly Leu Lys Ser Phe Arg Val Lys Met385 390 395<210>3<211>39
<212>DNA<213>人工序列<220>
<223>合成DNA<400>3tttggatccg aattcaaaag tgctggcgct gttccgttt39<210>4<211>41<212>DNA<213>人工序列<220>
<223>合成DNA<400>4gtgggatccg tcgaccactt ttttcacgat gttcactccc c41<210>5<211>39<212>DNA<213>人工序列
<220>
<223>合成DNA<400>5ccaggatcct ctagatggtg aaatggttgt tgccgctct39<210>6<211>39<212>DNA<213>人工序列<220>
<223>合成DNA<400>6tcaggatccc ccgggtgagc ggcaaatcca cccaccctg39<210>7<211>37<212>DNA<213>人工序列<220>
<223>合成DNA<400>7taagcgcgcc ccgggttaat tggatgggcg aaagctc37<210>8<211>39<212>DNA<213>人工序列<220>
<223>合成DNA<400>8atcgcgcgcg tcgacgatag cggcagaaaa ttggcggca39<210>9<211>38<212>DNA<213>人工序列<220>
<223>合成DNA
<400>9agcggatccg aattcgctgg aatcaaaagt cggccaga38<210>10<211>38<212>DNA<213>人工序列<220>
<223>合成DNA<400>10tcaggatccg tcgactgaga aaacacaaac gccccctc38<210>11<211> 39<212>DNA<213>人工序列<220>
<223>合成DNA<400>11atgggatcct ctagacatgt tgtagtttgg gttggaatc 39
<210>12<211>42<212>DNA<213>人工序列<220>
<223>合成DNA<400>12gccggatcca gatctggcat cacacaacaa taaatacacc gc 42<210>13<211>39<212>DNA<213> 人工序列<220>
<223>合成DNA<400>13tctggatcct ctagaagaga acacaaagag tacgaatgc 39
<210>14<211>41<212>DNA<213>人工序列<220>
<223>合成DNA<400>14aaaggatccc ccgggtttac cagccagcgc aacaaagtca t41<210>15<211>39<212>DNA<213>人工序列<220>
<223>合成DMA<400>15cctgaattct ctagaaggct ttcaccacgt attttgctg 39<210>16<211>41
<212>DNA<213>人工序列<220>
<223>合成DNA<400>16tctgaattcc ccgggagaac aaaatgccaa aagcctgagtc 41<210>17<211>34<212>DNA<213>人工序列<220>
<223>合成DNA<400>17aatactagta caattgcatc gtcaactgca tctt34<210>18<211>41<212>DNA<213>人工序列
<220>
<223>合成DNA<400>18gtgggatccg tcgaccactt ttttcacgat gttcactccc c41<210>19<211>34<212>DNA<213>人工序列<220>
<223>合成DNA<400>19gaaactagtt cttcaaaaga aaaaaagagt gtaa34<210>20<211>39<212>DNA<213>人工序列<220>
<223>合成DNA<400>20tcaggatccc ccgggtgagc ggcaaatcca cccaccctg 39<210>21<211>34<212>DNA<213>人工序列<220>
<223>合成DNA<400>21taaactagta gccaatcgat taaattgttt agtg34<210>22<211>34<212>DNA<213>人工序列<220>
<223>合成DNA
<400>22ggaggtacct tatgccccgt caaacgcaac gaga34<210>23<211>34<212>DNA<213>人工序列<220>
<223>合成DNA<400>23aggactagtc aaatggaaaa attgatgttt catc34<210>24<211>38<212>DNA<213>人工序列<220>
<223>合成DNA<400>24tcaggatccg tcgactgaga aaacacaaac gccccctc38
<210>25<211>34<212>DNA<213>人工序列<220>
<223>合成DNA<400>25ggtactagta aggaaacaag cccgattcct cagc34<210>26<211>42<212>DNA<213>人工序列<220>
<223>合成DNA<400>26gccggatcca gatctggcat cacacaacaa taaatacacc gc 42
<210>27<211>38<212>DNA<213>人工序列<220>
<223>合成DNA<400>27ttggatccac tagtaatgtg ttaaaccgcc ggcaagcc38<210>28<211>
<211>41<212>DNA<213>人工序列<220>
<223>合成DNA<4D0>28aaaggatccc ccgggtttac cagccagcgc aacaaagtca t41<210>29
<211>34<212>DNA<213>人工序列<220>
<223>合成DNA<400>29atgactagta aacaggcaag cgcaatacct cagc34<210>30<211>34<212>DNA<213>人工序列<220>
<223>合成DMA<400>30tttggtacct tacattcctg tccaaacgtc tttc34<210>31<211>29<212>DNA
<213>人工序列<220>
<223>合成DNA<400>31agcggtcgac aatgaatgtg ttaaaccgc 29<210>32<211>29<212>DNA<213>人工序列<220>
<223>合成DNA<400>32acgcggatcc ttacattttc acacggaag 29<210>33<211>24<212>DNA<213>人工序列
<220>
<223>合成DNA<400>33cgccagggtt ttcccagtca cgac 24<210>34<211>18<212>DNA<213>人工序列<220>
<223>合成DNA<400>34cgcaatatgc ggattggg 18<210>35<211>18<212>DNA<213>人工序列<220>
<223>合成DNA
<400>35tttccggcca ccagcagc 18<210>36<211>18<212>DNA<213>人工序列<220>
<223>合成DNA<4D0>36taaccggaag cgggtatg 18<210>37<211>18<212>DNA<213>人工序列<220>
<223>合成DNA<400>37
aaggaaacag gcgcatcc 18<210>38<211>67<212>DNA<213>人工序列<220>
<223>合成DNA<400>38tcgcctcgag tcgaggaggt cgactaatat gaacgttctg aaccgccgtc aagccttgcgagcg67<210>39<211>28<212>DNA<213>人工序列<220>
<223>合成DNA<400>39
tcgcggatcc ttacattttc acacggaa28<210>40<211>715<212>DNA<213>人工序列<220>
<223>合成DNA<400>40cctgcaggtc atcacccgag caggcgaccc gaacgttcgg aggctcctcg ctgtccattc 60gctcccctgg cgcggtatga accgccgcct catagtgcag tttgatcctg acgagcccag 120catgtctgcg cccaccttcg cggaacctga ccagggtccg ctagcgggcg gccggaaggt 180gaatgctagg catgatctaa ccctcggtct ctggcgtcgc gactgcgaaa tttcgcgagg 240gtttccgaga aggtgattgc gcttcgcaga tctcgtggac ggcttggttg acgccctccg 300cccattgggt gatggtggca ccatttggct gttgactcct ggtgcaggaa aacgtggaac 360tattgctcca ggtgaaattt ccgaatccgc acaattggca ggcctcgtcc agaccaccgc 420agagcgtctc ggtgattggc agggcagctg cttggtcgcg cgcggcgcga tgaagaagta 480agaattagcc gaaaacacct tccagccagg cgatttgctt aagttagaag gtgtggctag 540tattctaaga gtgctcatga ggaagcggaa agcttttaag agagcatgat gcggctttag 600ctcagctgga agagcaactg gtttacaccc agtaggtcgg gggttcgatc cagctgtgaa 660caattgcact ttggatctaa ttaagggatt agtcgactat ggatccccgg gtacc 715<210>41<211>1204<212>DNA<213>枯草芽孢杆菌<220>
<221>CDS<222>(8)..(1195)<400>41gtcgaca atg aat gtg tta aac cgc cgg caa gcc ttg cag cga gcg ctg 49Met Asn Val Leu Asn Arg Arg Gln Ala Leu Gln Arg Ala Leu1 5 10ctc aat ggg aaa aac aaa cag gat gcg tat cat ccg ttt cca tgg tat 97Leu Asn Gly Lys Asn Lys Gln Asp Ala Tyr His Pro Phe Pro Trp Tyr15 20 25 30gaa tcg atg aga aag gat gcg cct gtt tcc ttt gat gaa gaa aac caa 145Glu Ser Met Arg Lys Asp Ala Pro Val Ser Phe Asp Glu Glu Asn Gln35 40 45gtg tgg agc gtt ttt ctt tat gat gat gtc aaa aaa gtt gtt ggg gat 193Val Trp Ser Val Phe Leu Tyr Asp Asp Val Lys Lys Val Val Gly Asp50 55 60aaa gag ttg ttt tcc agt tgc atg ccg cag cag aca agc tct att gga 241Lys Glu Leu Phe Ser Ser Cys Met Pro Gln Gln Thr Ser Ser Ile Gly65 70 75aat tcc atc att aac atg gac ccg ccg aag cat aca aaa atc cgt tca 289Asn Ser Ile Ile Asn Met Asp Pro Pro Lys His Thr Lys Ile Arg Ser80 85 90gtc gtg aac aaa gcc ttt act ccg cgc gcg atg aag caa tgg gaa ccg 337Val Val Asn Lys Ala Phe Thr Pro Arg Ala Met Lys Gln Trp Glu Pro95 100 105 110aga att caa gaa atc aca gat gaa ctg att caa aaa ttt cag ggg cgc 385Arg Ile Gln Glu Ile Thr Asp Glu Leu Ile Gln Lys Phe Gln Gly Arg115 120 125agt gag ttt gac ctt gtt cac gat ttt tca tac ccg ctt ccg gtt att 433Ser Glu Phe Asp Leu Val His Asp Phe Ser Tyr Pro Leu Pro Val Ile130 135 140gtg ata tct gag ctg ctg gga gtg cct tca gcg cat atg gaa cag ttt 481Val Ile Ser Glu Leu Leu Gly Val Pro Ser Ala His Met Glu Gln Phe145 150 155aaa gca tgg tct gat ctt ctg gtc agt aca ccg aag gat aaa agt gaa 529Lys Ala Trp Ser Asp Leu Leu Val Ser Thr Pro Lys Asp Lys Ser Glu160 165 170gaa gct gaa aaa gcc ttt ttg gaa gaa cga gat aag tgt gag gaa gaa 577Glu Ala Glu Lys Ala Phe Leu Glu Glu Arg Asp Lys Cys Glu Glu Glu175 180 185 190ctg gcc gcg ttt ttt gcc ggc atc ata gaa gaa aag cga aac aaa ccg 625Leu Ala Ala Phe Phe Ala Gly Ile Ile Glu Glu Lys Arg Asn Lys Pro195 200 205gaa cag gat att att tct att tta gtg gaa gcg gaa gaa aca ggc gag 673Glu Gln Asp Ile Ile Ser Ile Leu Val Glu Ala Glu Glu Thr Gly Glu210 215 220aag ctg tcc ggt gaa gag ctg att ccg ttg tgc acg ctg ctg ctg gtg 721Lys Leu Ser Gly Glu Glu Leu Ile Pro Leu Cys Thr Leu Leu Leu Val225 230 235gcc gga aat gaa acc act aca aac ctg att tca aat gcg atg tac agc 769Ala Gly Asn Glu Thr Thr Thr Asn Leu Ile Ser Asn Ala Met Tyr Ser240 245 250ata tta gaa acg cca ggc gtt tac gag gaa ctg cgc agc cat cct gaa 817Ile Leu Glu Thr Pro Gly Val Tyr Glu Glu Leu Arg Ser His Pro Glu255 260 265 270ctg atg cct cag gca gtg gag gaa gcc ttg cgt ttc aga gcg ccg gcc 865Leu Met Pro Gln Ala Val Glu Glu Ala Leu Arg Phe Arg Ala Pro Ala275 280 285ccg gtt ttg agg cgc att gcc aag cgg gat acg gag atc ggg ggg cac 913Pro Val Leu Arg Arg Ile Ala Lys Arg Asp Thr Glu Ile Gly Gly His290 295 300ctg att aaa gaa ggt gat atg gtt ttg gcg ttt gtg gca tcg gca aat 961Leu Ile Lys Glu Gly Asp Met Val Leu Ala Phe Val Ala Ser Ala Asn305 310 315cgt gat gaa gca aag ttt gac aga ccg cac atg ttt gat atc cgc cgc 1009Arg Asp Glu Ala Lys Phe Asp Arg Pro His Met Phe Asp Ile Arg Arg320325 330cat ccc aat ccg cat att gcg ttt ggc cac ggc atc cat ttt tgc ctt 1057His Pro Asn Pro His Ile Ala Phe Gly His Gly Ile His Phe Cys Leu335 340 345 350ggg gcc ccg ctt gcc cgt ctt gaa gca aat atc gcg tta acg tct ttg 1105Gly Ala Pro Leu Ala Arg Leu Glu Ala Asn Ile Ala Leu Thr Ser Leu355 360 365att tct gct ttt cct cat atg gag tgc gtc agt atc act ccg att gaa 1153Ile Ser Ala Phe Pro His Met Glu Cys Val Ser Ile Thr Pro Ile Glu
370 375 380aac agt gtg ata tac gga tta aag agc ttc cgt gtg aaa atg taaggatcc 1204Asn Ser Val Ile Tyr Gly Leu Lys Ser Phe Arg Val Lys Met385 390 395<210>42<211>396<212>PRT<213>枯草芽孢杆菌<400>42Met Asn Val Leu Asn Arg Arg Gln Ala Leu Gln Arg Ala Leu Leu Asn1 5 10 15Gly Lys Asn Lys Gln Asp Ala Tyr His Pro Phe Pro Trp Tyr Glu Ser20 25 30Met Arg Lys Asp Ala Pro Val Ser Phe Asp Glu Glu Asn Gln Val Trp35 40 45Ser Val Phe Leu Tyr Asp Asp Val Lys Lys Val Val Gly Asp Lys Glu50 55 60Leu Phe Ser Ser Cys Met Pro Gln Gln Thr Ser Ser Ile Gly Asn Ser65 70 75 80Ile Ile Asn Met Asp Pro Pro Lys His Thr Lys Ile Arg Ser Val Val85 90 95Asn Lys Ala Phe Thr Pro Arg Ala Met Lys Gln Trp Glu Pro Arg Ile100 105 110Gln Glu Ile Thr Asp Glu Leu Ile Gln Lys Phe Gln Gly Arg Ser Glu115 120 125Phe Asp Leu Val His Asp Phe Ser Tyr Pro Leu Pro Val Ile Val Ile130 135 140Ser Glu Leu Leu Gly Val Pro Ser Ala His Met Glu Gln Phc Lys Ala145 150 155 160Trp Ser Asp Leu Leu Val Ser Thr Pro Lys Asp Lys Ser Glu Glu Ala165 170 175Glu Lys Ala Phe Leu Glu Glu Arg Asp Lys Cys Glu Glu Glu Leu Ala180 185 190Ala Phe Phe Ala Gly Ile Ile Glu Glu Lys Arg Asn Lys Pro Glu Gln195 200 205Asp Ile Ile Ser Ile Leu Val Glu Ala Glu Glu Thr Gly Glu Lys Leu210 215 220Ser Gly Glu Glu Leu Ile Pro Leu Cys Thr Leu Leu Leu Val Ala Gly225 230 235 240Asn Glu Thr Thr Thr Asn Leu Ile Ser Asn Ala Met Tyr Ser Ile Leu245 250 255Glu Thr Pro Gly Val Tyr Glu Glu Leu Arg Ser His Pro Glu Leu Met260 265 270Pro Gln Ala Val Glu Glu Ala Leu Arg Phe Arg Ala Pro Ala Pro Val275 280 285Leu Arg Arg Ile Ala Lys Arg Asp Thr Glu Ile Gly Gly His Leu Ile290 295 300Lys Glu Gly Asp Met Val Leu Ala Phe Val Ala Ser Ala Asn Arg Asp305 310 315 320Glu Ala Lys Phe Asp Arg Pro His Met Phe Asp Ile Arg Arg His Pro325 330 335Asn Pro His Ile Ala Phe Gly His Gly Ile His Phe Cys Leu Gly Ala340 345 350Pro Leu Ala Arg Leu Glu Ala Asn Ile Ala Leu Thr Ser Leu Ile Ser355 360 365Ala Phe Pro His Met Glu Cys Val Ser Ile Thr Pro Ile Glu Asn Ser370 375 380Val Ile Tyr Gly Leu Lys Ser Phe Arg Val Lys Met385 390 395<210>43<211>1221<212>DNA<213>枯草芽孢杆菌<220><221>CDS<222>(25)..(1212)<400>43ctcgagtcga ggaggtcgac taat atg aac gtt ctg aac cgc cgt caa gcc 51Met Asn Val Leu Asn Arg Arg Gln Ala1 5ttg cag cga gcg ctg ctc aat ggg aaa aac aaa cag gat gcg tat cat 99Leu Gln Arg Ala Leu Leu Asn Gly Lys Asn Lys Gln Asp Ala Tyr His10 15 20 25ccg ttt cca tgg tat gaa tcg atg aga aag gat gcg cct gtt tcc ttt 147Pro Phe Pro Trp Tyr Glu Ser Met Arg Lys Asp Ala Pro Val Ser Phe30 35 40gat gaa gaa aac caa gtg tgg agc gtt ttt ctt tat gat gat gtc aaa 195Asp Glu Glu Asn Gln Val Trp Ser Val Phe Leu Tyr Asp Asp Val Lys45 50 55aaa gtt gtt ggg gat aaa gag ttg ttt tcc agt tgc atg ccg cag cag 243Lys Val Val Gly Asp Lys Glu Leu Phe Ser Ser Cys Met Pro Gln Gln60 65 70aca agc tct att gga aat tcc atc att aac atg gac ccg ccg aag cat 291Thr Ser Ser Ile Gly Asn Ser Ile Ile Asn Met Asp Pro Pro Lys His75 80 85aca aaa atc cgt tca gtc gtg aac aaa gcc ttt act ccg cgc gtg atg 339Thr Lys Ile Arg Ser Val Val Asn Lys Ala Phe Thr Pro Arg Val Met90 95 100 105aag caa tgg gaa ccg aga att caa gaa atc aca gat gaa ctg att caa 387Lys Gln Trp Glu Pro Arg Ile Gln Glu Ile Thr Asp Glu Leu Ile Gln110 115 120aaa ttt cag ggg cgc agt gag ttt gac ctt gtt cac gat ttt tca tac 435Lys Phe Gln Gly Arg Ser Glu Phe Asp Leu Val His Asp Phe Ser Tyr125 130 135ccg ctt ccg gtt att gtg ata tet gag ctg ctg gga gtg cct tca gcg 483Pro Leu Pro Val Ile Val Ile Ser Glu Leu Leu Gly Val Pro Ser Ala140 145 150cat atg gaa cag ttt aaa gca tgg tct gat ctt ctg gtc agt aca ccg 531His Met Glu Gln Phe Lys Ala Trp Ser Asp Leu Leu Val Ser Thr Pro155 160 165aag gat aaa agt gaa gaa gct gaa aaa gcc ttt ttg gaa gaa cga gat 579Lys Asp Lys Ser Glu Glu Ala Glu Lys Ala Phe Leu Glu Glu Arg Asp170 175 180 185aag tgt gag gaa gaa ctg gcc gcg ttt ttt gcc ggc atc ata gaa gaa 627Lys Cys Glu Glu Glu Leu Ala Ala Phe Phe Ala Gly Ile Ile GIu Glu190 195 200aag cga aac aaa ccg gaa cag gat att att tct att tta gtg gaa gcg 675Lys Arg Asn Lys Pro Glu Gln Asp Ile Ile Ser Ile Leu Val Glu Ala205 210 215gaa gaa aca ggc gag aag ctg tcc ggt gaa gag ctg att ccg ttt tgc 723Glu Glu Thr Gly Glu Lys Leu Ser Gly Glu Glu Leu Ile Pro Phe Cys220 225 230acg ctg ctg ctg gtg gcc gga aat gaa acc act aca aac ctg att tca 771Thr Leu Leu Leu Val Ala Gly Asn Glu Thr Thr Thr Asn Leu Ile Ser235 240 245aat gcg atg tac agc ata tta gaa acg cca ggc gtt tac gag gaa ctg 819Asn Ala Met Tyr Ser Ile Leu Glu Thr Pro Gly Val Tyr Glu Glu Leu250 255 260 265cgc agc cat cct gaa ctg atg cct cag gca gtg gag gaa gcc ttg cgt 867Arg Ser His Pro Glu Leu Met Pro Gln Ala Val Glu Glu Ala Leu Arg270 275 280ttc aga gcg ccg gcc ccg gtt ttg agg cgc att gcc aag cgg gat acg 915Phe Arg Ala Pro Ala Pro Val Leu Arg Arg Ile Ala Lys Arg Asp Thr285 290 295gag atc ggg ggg cac ctg att aaa gaa ggt gat atg gtt ttg gcg ttt 963Glu Ile Gly Gly His Leu Ile Lys Glu Gly Asp Met Val Leu Ala Phe300 305 310gtg gca tcg gca aat cgt gat gaa gca aag ttt gac aga ccg cac atg 1011Val Ala Ser Ala Asn Arg Asp Glu Ala Lys Phe Asp Arg Pro His Met315 320 325ttt gat atc cgc cgc cat ccc aat ccg cat att gcg ttt ggc cac ggc 1059Phe Asp Ile Arg Arg His Pro Asn Pro His Ile Ala Phe Gly His Gly330 335 340 345atc cat ttt tgc ctt ggg gcc ccg ctt gcc cgt ctt gaa gca aat atc 1107Ile His Phe Cys Leu Gly Ala Pro Leu Ala Arg Leu Glu Ala Asn Ile350 355 360gcg tta acg tct ttg att tct gct ttt cct cat atg gag tgc gtc agt 1155Ala Leu Thr Ser Leu Ile Ser Ala Phe Pro His Met Glu Cys Val Ser365 370 375atc act ccg att gaa aac agt gtg ata tac gga tta aag agc ttc cgt 1203Ile Thr Pro Ile Glu Asn Ser Val Ile Tyr Gly Leu Lys Ser Phe Arg380 385390gtg aaa atg taaggatcc1221Val Lys Met395<210>44<211>1221<212>DNA<213>枯草芽孢杆菌<221>CDS<221>(25)..(1212)<400>44ctcgagtcga ggaggtcgac taat atg aac gtt ctg aac cgc cgt caa gcc 51Met Asn Val Leu Asn Arg Arg Gln Ala1ttg ccg cga gcg ctg ctc aat ggg aaa aac aaa cag gat gcg tat cat 99Leu Pro Arg Ala Leu Leu Asn Gly Lys Asn Lys Gln Asp Ala Tyr His10 15 20 25ccg ttt cca tgg tat gaa tcg atg aga aag gat gcg cct gtt tcc ttt 147Pro Phe Pro Trp Tyr Glu Ser Met Arg Lys Asp Ala Pro Val Ser Phe30 35 40gat gaa gaa aac caa gtg tgg agc gtt ttt ctt tat gat gat gtc aaa 195Asp Glu Glu Asn Gln Val Trp Ser Val Phe Leu Tyr Asp Asp Val Lys45 50 55aaa gtt gtt ggg gat aaa gag ttg ttt tcc agt tgc atg ccg cag cag 243Lys Val Val Gly Asp Lys Glu Leu Phe Ser Ser Cys Met Pro Gln Gln60 65 70aca agc tct att gga aat tcc atc att agc atg gac ccg ccg aag cat 291Thr Ser Ser Ile Gly Asn Ser Ile Ile Ser Met Asp Pro Pro Lys His75 80 85aca aaa atc cgt tca gtc gtg aac aaa gcc ttt act ccg cgc gcg atg 339Thr Lys Ile Arg Ser Val Val Asn Lys Ala Phe Thr Pro Arg Ala Met90 95 100 105aag caa tgg gaa ccg aga att caa gaa atc aca gat gaa ctg att caa 387Lys Gln Trp Glu Pro Arg Ile Gln Glu Ile Thr Asp Glu Leu Ile Gln110 115 120aaa ttt cag ggg cgc agt gag ttt gac ctt gtt cac gat tat tca tac 435Lys Phe Gln Gly Arg Ser Glu Phe Asp Leu Val His Asp Tyr Ser Tyr125 130 135ccg ctt ccg gtt att gtg ata tct gag ctg ctg gga gtg cct tca gcg 483Pro Leu Pro Val Ile Val Ile Ser Glu Leu Leu Gly Val Pro Ser Ala140 145 150cat atg gaa cag ttt aaa gca tgg tct gat ctt ctg gtc agt aca ccg 531His Met Glu Gln Phe Lys Ala Trp Ser Asp Leu Leu Val Ser Thr Pro155 160 165aag gat aaa agt gaa gaa gct gaa aaa gcc ttt ttg gaa gaa cga gat 579Lys Asp Lys Ser Glu Glu Ala Glu Lys Ala Phe Leu Glu Glu Arg Asp170 175 180 185aag tgt gag gaa gaa ctg gcc gcg ttt ttt gcc ggc atc ata gaa gaa 627Lys Cys Glu Glu Glu Leu Ala Ala Phe Phe Ala Gly Ile Ile Glu Glu190 195 200aag cga aac aaa ccg gaa cag gat att att tct att tta gtg gaa gcg 675Lys Arg Asn Lys Pro Glu Gln Asp Ile Ile Ser Ile Leu Val Glu Ala205 210 215gaa gaa aca ggc gag aag ctg tcc ggt gaa gag ctg att ccg ttg tgc 723Glu Glu Thr Gly Glu Lys Leu Ser Gly Glu Glu Leu Ile Pro Leu Cys220 225 230acg ctg ctg ctg gtg gcc gga aat gaa acc act aca aac ctg att tca 771Thr Leu Leu Leu Val Ala Gly Asn Glu Thr Thr Thr Asn Leu Ile Ser235 240 245aat gcg atg ttc agc ata tta gaa acg cca ggc gtt tac gag gaa ctg 819ASh Ala Met Phe Ser Ile Leu Glu Thr Pro Gly Val Tyr Glu Glu Leu250 255 260 265cgc agc cat cct gaa ctg atg ccc cag gca gtg gag gaa gcc ttg cgt 867Arg Ser His Pro Glu Leu Met Pro Gln Ala Val Glu Glu Ala Leu Arg270 275 280ttc aga gcg ccg gcc ccg gtt ttg agg cgc att gcc aag cgg gat acg 915Phe Arg Ala Pro Ala Pro Val Leu Arg Arg Ile Ala Lys Arg Asp Thr285 290 295gag atc ggg ggg cac ctg att aaa gaa ggt gat acg gtt ttg gcg ttt 963Glu Ile Gly Gly His Leu Ile Lys Glu Gly Asp Thr Val Leu Ala Phe300 305 310gtg gca tcg gca aat cgt gat gaa gca aag ttt gac aga ccg cac atg 1011Val Ala Ser Ala Asn Arg Asp Glu Ala Lys Phe Asp Arg Pro His Met315 320 325ttt gat atc cgc cgc cat ccc aat ccg cat att gcg ttt ggc cac ggc 1059Phe Asp Ile Arg Arg His Pro Asn Pro His Ile Ala Phe Gly His Gly330 335 340 345atc cat ttt tgc ctt ggg gcc ccg ctt gcc cgt ctt gaa gca aat atc 1107Ile His Phe Cys Leu Gly Ala Pro Leu Ala Arg Leu Glu Ala Asn Ile350 355 360gcg tta acg tct ttg att tct gct ttt cct cat atg gag tgc gtc agt 1155Ala Leu Thr Ser Leu Ile Ser Ala Phe Pro His Met Glu Cys Val Ser365 370 375atc act ccg att gaa aac agt gtg ata tac gga tta aag agc ttc cgt 1203Ile Thr Pro Ile Glu Asn Ser Val Ile Tyr Gly Leu Lys Ser Phe Arg380 385 390gtg aaa atg taaggatcc1221Val Lys Met395<210>45<211>396<212>PRT<213>枯草芽孢杆菌<400>45Met Asn Val Leu Asn Arg Arg Gln Ala Leu Pro Arg Ala Leu Leu Asn1 5 10 15Gly Lys Asn Lys Gln Asp Ala Tyr His Pro Phe Pro Trp Tyr Glu Ser20 25 30Met Arg Lys Asp Ala Pro Val Ser Phe Asp Glu Glu Asn Gln Val Trp35 40 45Ser Val Phe Leu Tyr Asp Asp Val Lys Lys Val Val Gly Asp Lys Glu50 55 60Leu Phe Ser Ser Cys Met Pro Gln Gln Thr Ser Ser Ile Gly Asn Ser65 70 75 80Ile Ile Ser Met Asp Pro Pro Lys His Thr Lys Ile Arg Ser Val Val85 90 95Asn Lys Ala Phe Thr Pro ArgAla Met Lys Gln Trp Glu Pro Arg Ile100105 110Gln Glu Ile Thr Asp Glu Leu Ile Gln Lys Phe Gln Gly Arg Ser Glu115 120 125Phe Asp Leu Val His Asp Tyr Ser Tyr Pro Leu Pro Val Ile Val Ile130 135 140Ser Glu Leu Leu Gly Val Pro Ser Ala His Met Glu Gln Phe Lys Ala145 150 155 160Trp Ser Asp Leu Leu Val Ser Thr Pro Lys Asp Lys Ser Glu Glu Ala165 170 175Glu Lys Ala Phe Leu Glu Glu Arg Asp Lys Cys Glu Glu Glu Leu Ala180 185 190Ala Phe Phe Ala Gly Ile Ile Glu Glu Lys Arg Asn Lys Pro Glu Gln195 200 205Asp Ile Ile Ser Ile Leu Val Glu Ala Glu Glu Thr Gly Glu Lys Leu210 215 220Ser Gly Glu Glu Leu Ile Pro Leu Cys Thr Leu Leu Leu Val Ala Gly225 230 235 240Asn Glu Thr Thr Thr Asn Leu Ile Ser Asn Ala Met Phe Ser Ile Leu245 250 255Glu Thr Pro Gly Val Tyr Glu Glu Leu Arg Ser His Pro Glu Leu Met260 265 270Pro Gln Ala Val Glu Glu Ala Leu Arg Phe Arg Ala Pro Ala Pro Val275 280 285Leu Arg Arg Ile Ala Lys Arg Asp Thr Glu Ile Gly Gly His Leu Ile290 295 300Lys Glu Gly Asp Thr Val Leu Ala Phe Val Ala Ser Ala Asn Arg Asp305 310 315 320Glu Ala Lys Phe Asp Arg Pro His Met Phe Asp Ile Arg Arg His Pro325 330 335Asn Pro His Ile Ala Phe Gly His Gly Ile His Phe Cys Leu Gly Ala340 345 350Pro Leu Ala Arg Leu Glu Ala Asn Ile Ala Leu Thr Ser Leu Ile Ser355 360 365Ala Phe Pro His Met Glu Cys Val Ser Ile Thr Pro Ile Glu Asn Ser370 375 380Val Ile Tyr Gly Leu Lys Ser Phe Arg Val Lys Met385 390 39权利要求
1.芽孢杆菌属微生物来源的蛋白质,且具有这样的活性从通式(I-a)表示的化合物,以下叫做化合物(I-a), 或通式(I-b)表示的化合物(I-a)的内酯体,以下叫做化合物(I-b), 生成通式(II-a)表示的化合物,以下叫做化合物(II-a), 或通式(II-b)表示的化合物(II-a)的内酯体,以下叫做化合物(II-b), 通式(I-a)中,R1表示氢原子,取代或未取代的烷基或碱金属,R2表示取代或未取代的烷基或取代或未取代的芳香基;通式(I-b)中,R2同前;通式(II-a)中,R1和R2同前;通式(II-b)中,R2同前。
2.芽孢杆菌属微生物来源的蛋白质,且具有这样的活性从通式(III-a)表示的化合物,以下叫做化合物(III-a), 或通式(III-b)表示的化合物(III-a)的内酯体,以下叫做化合物(III-b), 生成通式(IV-a)表示的化合物,以下叫做化合物(IV-a), 或通式(IV-b)表示的化合物(IV-a)的内酯体,以下叫做化合物(IV-b), 通式(III-a)中,R1表示氢原子,取代或未取代的烷基或碱金属,R2表示取代或未取代的烷基或取代或未取代的芳香基;通式(III-b)中,R2同前;通式(IV-a)中,R1和R2同前;通式(IV-b)中,R2同前。
3.芽孢杆菌属微生物来源的蛋白质,且具有这样的活性从通式(V-a)表示的化合物,以下叫做化合物(V-a), 或通式(V-b)表示的化合物(V-a)的内酯体,以下叫做化合物(V-b), 生成通式(VI-a)表示的化合物,以下叫做化合物(VI-a), 或通式(VI-b)表示的化合物(VI-a)的内酯体,以下叫做化合物(VI-b), 通式(V-a)中,R1表示氢原子,取代或未取代的烷基或碱金属;通式(VI-a)中,R1同前。
4.芽孢杆菌属微生物来源的蛋白质,且具有这样的活性从通式(VII-a)表示的化合物,以下叫做化合物(VII-a), 或通式(VII-b)表示的化合物(VII-a)的内酯体,以下叫做化合物(VII-b), 生成通式(VIII-a)表示的化合物,以下叫做化合物(VIII-a), 或通式(VIII-b)表示的化合物(VIII-a)的内酯体,以下叫做化合物(VIII-b), 通式(VII-a)中,R1表示氢原子,取代或未取代的烷基或碱金属;通式(VIII-a)中,R1同前。
5.根据权利要求1-4中任一项所述的蛋白质,其中芽孢杆菌属的微生物选自枯草芽孢杆菌,巨大芽孢杆菌,侧孢芽孢杆菌,球形芽孢杆菌,短小芽孢杆菌,嗜热脂肪芽孢杆菌,蜡样芽孢杆菌,栗褐芽孢杆菌,短芽孢杆菌,蜂房芽孢杆菌,环状芽孢杆菌和浸麻芽孢杆菌。
6.根据权利要求1-5中任一项所述的蛋白质,其中芽孢杆菌属的微生物选自枯草芽孢杆菌ATCC6051株,巨大芽孢杆菌ATCC10778株,巨大芽孢杆菌ATCC11562株,巨大芽孢杆菌ATCC13402株,巨大芽孢杆菌ATCC15177株,巨大芽孢杆菌ATCC15450株,巨大芽孢杆菌ATCC19213株,巨大芽孢杆菌IAM1032株,侧孢芽孢杆菌ATCC4517株,短小芽孢杆菌FERM BP-2064株,栗褐芽孢杆菌ATCC14574株,短芽孢杆菌NRRL B-8029株,蜂房芽孢杆菌ATCC6344株,环状芽孢杆菌NTCT-2610株及浸麻芽孢杆菌NCIMB-9368株。
7.根据权利要求1-5中任一项所述的蛋白质,其中芽孢杆菌属的微生物选自芽孢杆菌属FERM BP-6029株和芽孢杆菌属FERM BP-6030株。
8.一种蛋白质,它具有序列号1记载的氨基酸序列。
9.一种蛋白质,它具有序列号1记载的氨基酸序列中1个以上的氨基酸发生缺失、置换或添加了的氨基酸序列,且具有从化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)的活性。
10.根据权利要求9所述的蛋白质,它具有序列号42或45记载的氨基酸序列。
11.根据权利要求9所述的蛋白质,其中化合物(I-a)是化合物(III-a),化合物(I-b)是化合物(III-b),化合物(II-a)是化合物(IV-a),化合物(II-b)是化合物(IV-b)。
12.根据权利要求9所述的蛋白质,其中化合物(I-a)是化合物(V-a),化合物(I-b)是化合物(V-b),化合物(II-a)是化合物(VI-a),化合物(II-b)是化合物(VI-b)。
13.根据权利要求9所述的蛋白质,其中化合物(I-a)是化合物(VII-a),化合物(I-b)是化合物(VII-b),化合物(II-a)是化合物(VIII-a),化合物(II-b)是化合物(VIII-b)。
14.一种分离纯化得到的DNA,它具有序列号2记载的碱基序列。
15.一种分离纯化得到的DNA,它能与权利要求14所述的DNA在严格条件下进行杂交,且能编码具有从化合物(I-a)或化合物(I-b)生成化合物(II-a)或化合物(II-b)活性的蛋白质。
16.根据权利要求15所述的DNA,它具有选自序列号41、43及44记载的碱基序列构成的组的碱基序列。
17.一种分离纯化得到的DNA,编码权利要求1-12中任一项所述的蛋白质。
18.根据权利要求15所述的DNA,其中化合物(I-a)是化合物(III-a),化合物(I-b)是化合物(III-b),化合物(II-a)是化合物(IV-a),化合物(II-b)是化合物(IV-b)。
19.根据权利要求15所述的DNA,其中化合物(I-a)是化合物(V-a),化合物(I-b)是化合物(V-b),化合物(II-a)是化合物(VI-a),化合物(II-b)是化合物(VI-b)。
20.根据权利要求15所述的DNA,其中化合物(I-a)是化合物(VII-a),化合物(I-b)是化合物(VII-b),化合物(II-a)是化合物(VIII-a),化合物(II-b)是化合物(VIII-b)。
21.重组DNA载体,它包含权利要求14-20中任一项所述的DNA。
22.一种转化体,是将权利要求21所述的重组DNA载体导入宿主细胞而得到的。
23.根据权利要求22所述的转化体,它属于选自埃希氏菌属、芽孢杆菌属、棒状杆菌属和链霉菌属的微生物。
24.根据权利要求22或23所述的转化体,它属于选自大肠杆菌、枯草芽孢杆菌、巨大芽孢杆菌、谷氨酸棒杆菌、产氨棒杆菌、美棒杆菌和浅青紫链霉菌的微生物。
25.化合物(II-a)或化合物(II-b)的制备方法,其特征在于,用权利要求22-24中任一项所述的转化体、该转化体的培养物或该培养物的处理物作为酶源,使化合物(I-a)或化合物(I-b)存在于水性介质中,并使化合物(II-a)或化合物(II-b)在水性介质中生成、蓄积,然后从该水性介质中提取化合物(II-a)或化合物(II-b)。
26.化合物(IV-a)或化合物(IV-b)的制备方法,其特征在于,用权利要求22-24中任一项所述的转化体、该转化体的培养物或该培养物的处理物作为酶源,使化合物(III-a)或化合物(III-b)存在于水性介质中,并使化合物(IV-a)或化合物(IV-b)在水性介质中生成、蓄积,然后从该水性介质中提取化合物(IV-a)或化合物(IV-b)。
27.化合物(VI-a)或化合物(VI-b)的制备方法,其特征在于,用权利要求22-24中任一项所述的转化体、该转化体的培养物或该培养物的处理物作为酶源,使化合物(V-a)或化合物(V-b)存在于水性介质中,并使化合物(VI-a)或化合物(VI-b)在水性介质中生成、蓄积,然后从该水性介质中提取化合物(VI-a)或化合物(VI-b)。
28.化合物(VIII-a)或化合物(VIII-b)的制备方法,其特征在于,用权利要求22-24中任一项所述的转化体、该转化体的培养物或该培养物的处理物作为酶源,使化合物(VII-a)或化合物(VII-b)存在于水性介质中,并使化合物(VIII-a)或化合物(VIII-b)在水性介质中生成、蓄积,然后从该水性介质中提取化合物(VIII-a)或化合物(VIII-b)。
29.根据权利要求25所述的制备方法,其中化合物(II-b)是由化合物(II-a)形成内酯而得到的。
30.根据权利要求25所述的制备方法,其中化合物(II-a)是使化合物(II-b)的内酯开环而得到的。
31.根据权利要求26所述的制备方法,其中化合物(IV-b)是由化合物(IV-a)形成内酯而得到的。
32.根据权利要求26所述的制备方法,其中化合物(IV-a)是使化合物(IV-b)的内酯开环而得到的。
33.根据权利要求27所述的制备方法,其中化合物(VI-b)是由化合物(VI-a)形成内酯而得到的。
34.根据权利要求27所述的制备方法,其中化合物(VI-a)是使化合物(VI-b)的内酯开环而得到的。
35.根据权利要求28所述的制备方法,其中化合物(VIII-b)是由化合物(VIII-a)形成内酯而得到的。
36.根据权利要求28所述的制备方法,其中化合物(VIII-a)是使化合物(VIII-b)的内酯开环而得到的。
37.根据权利要求25-28中任一项所述的制备方法,其中转化体培养物的处理物是选自培养菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂处理物、该菌体的酶处理物、该菌体的超声波处理物、该菌体的机械磨碎物、该菌体的溶剂处理物等菌体处理物,菌体的蛋白级分物,菌体及菌体处理物的固定化物的处理物。
38.权利要求1-12中任一项所述蛋白质的制备方法,其特征在于,在培养基中培养权利要求22-24中任一项所述的转化体,让权利要求1-12中任一项所述的蛋白质在培养物中生成、蓄积,然后从培养物中提取该蛋白质。
39.相当于选自序列号2、41、43及44记载的碱基序列构成的组的碱基序列中连续5-60个碱基构成的序列的寡核苷酸,或相当于与该寡核苷酸互补的序列的寡核苷酸。
全文摘要
本发明涉及具有羟化活性的蛋白质,它能羟化来源于芽孢杆菌属微生物且用通式(I-a),(式中,R
文档编号C12N1/21GK1345371SQ00805629
公开日2002年4月17日 申请日期2000年1月28日 优先权日1999年1月29日
发明者远藤博文, 米谷良之, 沟口宽, 桥本信一, 尾崎明夫 申请人:协和发酵工业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1