D-山梨醇脱氢酶基因的制作方法

文档序号:452048阅读:335来源:国知局
专利名称:D-山梨醇脱氢酶基因的制作方法
技术领域
本发明涉及一种全新的DNA分子,这种DNA分子编码一种属于葡糖杆菌属或醋杆菌属的乙酸菌的微生物的山梨醇脱氢酶,一种含有所说DNA分子的表达载体以及含有所说表达载体的重组生物。另外,本发明还涉及一种生产重组型D-山梨醇脱氢酶的方法和一种利用所说重组酶或含有所说表达载体的重组生物生产L-山梨糖的方法。
L-山梨糖是维生素C的实际工业生产方法中的一个重要中间产物。维生素C的生产主要是通过Reichstein方法(Helveticachimica Acta,第17卷,311页,1934年)。在此方法中,唯一的微生物转变是通过葡糖杆菌或醋杆菌株,利用D-山梨醇生产L-山梨糖。这种转变被认为是通过NAD/NADP非依赖性D-山梨醇脱氢酶(D-sorbitol dehydrogenase,SLDH)来完成的。L-山梨糖也是微生物法生产2-酮-L-古洛糖酸工艺中的一个熟知底物,其中2-酮-L-古洛糖酸是维生素C生产中的一个有用的中间产物。
众所周知,存在NAD/NADP非依赖性的D-山梨醇脱氢酶,它能够催化D-山梨醇氧化为L-山梨糖。所说的D山梨醇脱氢酶已从弱氧化葡糖杆菌的α IFO 3254种中分离和鉴定出来(E.Shinagawo等,农业生物化学,第46卷,135-141页,1982年)。这种酶由三种分子量分别为63KD、51KD、17KD的亚基所组成,其中最大的亚基为脱氢酶,它含有FAD作为辅助因子,中间大小的亚基为细胞色素C,最小的亚基是一种功能未知的蛋白质。这种酶的最适pH为4.5。类似的SLDH也已从弱氧化葡糖杆菌ATCC 621菌种(KCTC 2111菌)中纯化和鉴定出来(E-S Choi等,FEMS微生物通信(FEMS Microbiol.Lett.),第125卷,45-50页,1995年),它由三种分子量分别为75KD、50KD、14KD的亚基所组成;其中最大的亚基是脱氢酶,含有吡咯并喹啉苯醌(pyrroloquinoline quinone,PQQ)作为辅助因子,次大小的亚基为细胞色素C,最小的亚基为一种功能未知的蛋白质。也有人从弱氧化葡糖杆菌IFO 3255中分离和鉴定了NAD/NADP非依赖性SLDH(T.Hoshino等,欧洲专利号728840)。这种SLDH是由一种分子量约为79.0±0.5KD的亚基所组成,最适pH在6-7之间,同时具有D-山梨醇、甘露醇和甘油脱氢酶活性。
尽管已有数种SLDH被纯化,但它们的基因一直未被克隆出来。为了有效地生产SLDH酶和构建含有强化SLDH活性的重组生物以提高L-山梨糖的产量,克隆SLDH基因是非常有价值的。通过将所说的SLDH基因导入至所需生物如导入至能将L-山梨糖转变为2-酮-L-古洛酸的葡糖杆菌中,产生重组微生物,以直接利用D-山梨醇生产2-酮-L-古洛酸,这项工作也是很有意义的。
本发明提供了一个编码来源于一种微生物的D-山梨醇脱氢酶的核苷酸序列(基因),这种微生物属于包括葡糖杆菌属和醋杆菌属在内的一种乙酸细菌。本发明还提供了一种含有所述核苷酸序列的DNA分子,以及所说的DNA分子与另一种DNA分子的组合体,其中后一种DNA分子含编码具体内活化所说SLDH功能的蛋白质的核苷酸序列;携带有含SLDH核苷酸序列的DNA分子或所说的DNA分子组合的表达载体;携带有这类表达载体的重组生物;生产重组SLDH的方法;和利用重组SLDH或重组生物生产L-山梨糖的方法。
本发明也涉及本发明产物的功能性衍生物。这种功能性衍生物定义为对本发明提供的氨基酸序列进行添加、插入、缺失和/或取代一至数个氨基酸残基产生的蛋白质,它们仍具有通过本领域内熟知技术或本文特别介绍的方法可测出的SLDH活性。这种功能性衍生物可通过下述方法之一产生通过本领域中熟知的化学肽链合成路线,或利用本文所公开的DNA序列、通过本领域熟知的方法及公开方法如Sambrook等的方法(分子克隆,冷泉港实验室出版社,纽约,美国,第二版,1989年)进行的重组技术路线。本领域都熟知对蛋白质和多肽进行一般不影响分子活性的氨基酸替换,并已由多人描述如H.Neurach和R.L.Hill在“蛋白质”一书中的描述(学术出版社,纽约,1979年,参见第14页图6)。比较广泛存在的替代有Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu,Asp/Gly以及反向替代。
另外,本发明还涉及编码如SEQ ID No2和SEQ ID No3所公开的、具有SLDH活性的多肽、具有在体内活化所说SLDH功能的多肽的DNA序列以及它们的互补序列,或那些包含所说序列、能在标准条件下与这类序列或片段杂交的DNA序列,和虽然由于遗传密码的简并性在标准条件下不能与这类序列杂交、但所编码多肽的氨基酸序列却相同的DNA分子。
本文中所提及的杂交的“标准条件”是指本领域熟练技术人员通常用来检测特异杂交信号的条件,如1989年美国纽约冷泉港实验室出版社出版的第二版“分子克隆”等中描述的条件,或本领域熟练技术人员熟悉的、如Sambrook等(如前述)所描述的所谓“严格杂交”和“严格洗涤”条件。
下面是对附图的简述

图1示SLDH多肽的部分氨基酸序列和几个寡核苷酸序列。图中黑体氨基酸序列用于设计合成PCR反应的两个寡核苷酸序列(S7和s6R)。箭头指示DNA合成的方向。所有引物都是含有葡糖杆菌偏好密码子的简并性DNA混合物。
图2示本发明克隆的SLDH基因的酶切图谱及编码SLDH和ORF2的DNA区的遗传结构。
图3示含有上、下游序列的编码SLDH和ORF2的核苷酸序列以及由此推断出的SLDH和ORF2的氨基酸序列。图3还示意SLDH和ORF2基因可能的核糖体结合位点(SD序列)以及可能的转录终止序列。
图4示pTNB114、pTNB115和pTNB116质粒的构建过程。这些质粒能在大肠杆菌中,在lac启动子控制下表达SLDH和/或ORF2基因。所构建的pTNB115中,由于ORF2基因缺失含核糖体结合位点和起始密码子ATG的区域,因而不能产生ORF2。
图5示pTNB110和pTNB143质粒的构建过程。其中pTNB110含有在普通pA启动子调控下的ORF2和SLDH基因(实施例6中将详述),pTNB143含有均在基因上游相邻位置连接pA启动子以控制其基因活性的ORF2和SLDH基因。图中各图标说明如下*1通过PCR方法,从携带有DSM4025的A酶基因的DNA片段,如DSM4025的染色体DNA或pSSA202质粒(T.Hoshino等,欧洲专利局申请号9611500.8)克隆A酶基因启动子(pA),连接至pUC18的HindⅢ-BamHⅠ位点,获得pUCAP质柱。所用引物为5’-CCAAG CTTAT CGCCG CGTTT GTCAT-3’5’-CCGGA TCCGG TTGGT GCAGC GGTCA-3’*2通过PCR方法,从pSSA202亚克隆DSM4025的A酶基因中由启动子至信号肽间的一段序列。所用引物为5’-CCAAG CTTAT CGCCG CGTTT GTCAT-3’5’-GCTAG CAAAGGCGGG TGCGG-3’3*利用pTNB 110进行PCR扩增。所用引物为5’-GTCGA CATCG CCGCG TTTGT CA-3’5’-GCCGG CGCAC TAGAC GGCTC C-3’**本发明人通过DNA重组技术已分离到SLDH基因和能够促使在体内产生SLDH活性的基因,并已测定出它们的核苷酸序列。
本发明提供了编码葡糖杆菌SLDH的DNA序列,以及能够促使体内产生SLDH活性的基因(该基因以下称作ORF2基因);本发明还提供了含有编码SLDH的所说DNA的表达载体以及含有所说表达载体的宿主细胞。
简单说来,可通过下述步骤获得本发明所用的SLDH和/或ORF2基因、含有所述基因的DNA分子、重组表达载体和重组生物(1)从具有能将D-山梨醇转变为L-山梨糖的SLDH活性的微生物中提取染色体DNA,利用这些染色体DNA在合适宿主细胞如大肠杆菌内构建基因库;(2)通过菌落、噬菌斑或Southern杂交、PCR(聚合酶链反应)克隆、Western杂交分析及其它类似方法克隆染色体DNA中的SLDH和/或ORF2基因;(3)通过传统方法分析测定前面所克隆到的SLDH和/或ORF2基因的核苷酸序列,选出包含有前面所说SLDH和/或ORF2基因的DNA分子,构建能够有效表达SLDH和/或ORF2的重组表达载体;(4)通过适当的将DNA导入宿主细胞的方法,如转化、转导、接合和/或电击法构建携带有SLDH和/或ORF2基因的重组生物。
本发明上述步骤中使用的材料和技术下面将作举例详细说明总染色体DNA可通过本领域熟知技术进行纯化。利用下面叙述的方法之一从总染色体DNA中将目的基因克隆至质粒或噬菌体载体中(ⅰ)根据纯化的蛋白质或其多肽片段分析测定部分氨基酸序列。这种完整蛋白或多肽片段可通过分离完整蛋白或对SDS-聚丙烯酰胺凝胶电泳后的凝胶进行肽酶处理获得。如此获得的蛋白质和多肽片段进行蛋白测序仪测序,如可使用应用生物系统自动气相测序仪470A。可利用氨基酸序列设计寡核苷酸探针和引物,并通过如应用生物系统自动DNA序列仪381A等DNA合成仪进行DNA合成。利用所说的探针,通过Southern、菌落或噬菌斑杂交,可以从由携带有目的基因的菌株构建的基因库中分离含有目的基因的克隆;(ⅱ)另一种方法是,可利用目的蛋白的抗体,通过免疫学方法,从基因库中分离能表达目的蛋白的克隆;(ⅲ)可利用一套引物即按照前面确定的氨基酸序列设计合成的两种寡核苷酸分子,通过PCR方法,从总染色体DNA中扩增出目的基因的DNA片段,然后以前面获得的PCR产物作探针,通过Southern、菌落或噬菌斑杂交方法,从构建于如大肠杆菌等宿主菌内的基因库中分离含有完整目的基因的克隆;(ⅳ)还有一种克隆方法是筛选出能够弥补SLDH-缺陷型菌株SLDH缺乏的克隆。这种SLDH-缺陷型菌株可通过传统的化学诱变方法产生,也可通过DNA重组技术如利用Tn5转座子破坏目的基因而获得。
通过本领域熟知技术,在本发明所公开DNA序列基础上设计引物,从而利用PCR方法获得DNA序列也是本发明的目的之一。另外,我们知道,本发明的DNA序列也可通过如EP747483所描述的合成方法获得。
上面提到的抗体可按照“酶学方法”1981年第73卷第46页所描述的方法,利用纯化的SLDH蛋白或其多肽片段为抗原制得。
当分离到含目的基因的克隆后,可按照熟知的方法,如利用M13噬菌体DNA进行的双脱氧链末端终止法进行目的基因的核苷酸序列测定(Sanger F.等,美国国家科学院院报(Proc.Natl.Acad.Sci.USA),第74卷,第5463-5467页,1977年)。
能表达本发明的D-山梨醇脱氢酶的目的基因结构见图2和图3。这个特异基因编码含有716个氨基酸的SLDH酶和含有24个氨基酸的信号肽。本发明人发现在上述SLDH基因上游不远处还存在一个开放阅读框,并将其命名为ORF2。此ORF2基因编码一种含有126个氨基酸的蛋白质,推测这种蛋白具有使本发明的重组SLDH获得目的酶活性的功能,特别是当所说的SLDH是在醋杆菌属外的其它宿主细胞中表达时。
为使从包括葡糖杆菌属和醋杆菌属在内的乙酸菌中分离获得的目的基因/核苷酸序列得到有效表达,可以采用各种启动子,比如目的基因自身的启动子、一些抗生素抗性基因的启动子,如Tn5中卡那霉素抗性基因(D.E.Berg和C.M.Berg,1983年,生物技术(Bio/Technology),第1卷,第417-435页),pBR322中的氨苄青霉素抗性基因以及大肠杆菌的β-半乳糖苷酶基因(lac)的启动子,还有trp-,tac-、trc-等启动子,入噬菌体的启动子以及在宿主生物中有功能的任何一种启动子。为使目的基因得到有效表达,宿主生物可选择多种微生物,包括一些细菌如大肠杆菌,恶臭假单孢杆菌,木醋杆菌,巴氏醋杆菌,醋化醋杆菌,汉氏醋杆菌,微白葡糖杆菌,被膜葡糖杆菌,蜡状葡糖杆菌,二羟丙酮葡糖杆菌,葡萄糖葡糖杆菌,工业葡糖杆菌,生黑葡糖杆菌,非氧化葡糖杆菌,氧化葡糖杆菌,如氧化葡糖杆菌DSM4025(此菌株已按照布达佩斯条约于1983年3月17日保藏于德意志微生物保藏中心,Braunshweig,BRD,保藏号为DSM4025),氧化葡糖杆菌球状亚种,玫瑰葡糖杆菌(Gluconobacter roseus),锈色葡糖杆菌,弱氧化葡糖杆菌,哺乳动物细胞和植物细胞。
为能进行表达,在使用上述启动子的同时,还应加入其它一些能在宿主细胞内操作的调控元件,如SD序列(包括可在宿主细胞内操作的天然或合成序列,如AGGAGG等)及转录终止子(包括可在宿主细胞内操作的任何天然或合成的反向重复序列)等。其中所说的宿主细胞是指即将导入编码序列的宿主细胞。
为表达膜结合多肽,如本发明中的SLDH蛋白,优选方法是连接一段通常约含15至50个氨基酸残基的完全疏水性信号肽。编码信号肽的DNA可选自能在宿主细胞内操作的任何天然或合成序列。
克隆双链DNA时可采用多种宿主细胞/克隆载体组合。克隆载体通常是质柱或噬菌体,其中含有复制起始点,调控元件,包括多克隆位点的一段克隆位点以及选择标记,如一些抗生素抗性基因,包括氨苄青霉素、四环素、卡那霉素、链霉素、庆大霉素及放线壮观素等抗生素的抗性基因。
在大肠杆菌中表达本发明所克隆基因的优选载体可以是大肠杆菌内通常使用的任何一种载体,如pBR322或其衍生质粒,包括pUC18和pBlueseriptⅡ(Stratagene克隆体系,加利福尼亚,美国);pACYC177或pACYC184(细菌学杂志,第134卷,1141-1156页,1978年)或它们的衍生质粒;来源于具广谱宿主范围的质粒的载体,如RK2(C.M.Thomas,质粒,第5卷,第10页,1981年)或RSF1010(P.Guerry等,细菌学杂志,第117卷,619-630页,1974年)。在包括葡糖杆菌、醋杆菌和/或恶臭假单孢杆菌等的细菌中表达本发明的核苷酸序列,优选载体应是既能在葡糖杆菌、醋杆菌和/或恶臭假单孢杆菌中,又能在优选的克隆生物体如大肠杆菌中复制的载体。较好的选择是具广谱宿主范围的载体,如类似pVK100(V.C.Knauf等人,质粒,第8卷45-54,1982)及其衍生物的粘粒载体,还有RSF1010等。为保证克隆基因能稳定、有效地表达,携带有克隆基因的宿主细胞也能有效地生长,应仔细考虑载体的拷贝数和稳定性。含有转座因子的DNA分子,如Tn5等也可用作载体,将目的基因导入至优选宿主细胞内,特别是染色体上。同时含有分离自优选宿主细胞的任何DNA和本发明的基因的DNA分子也可用于将此基因导入至优选宿主细胞内,特别是染色体上。根据宿主细胞和DNA分子的要求,可选择任何一种传统方法将此DNA分子转移至优选宿主中,比如本领域熟练技术人员熟知的转化、转导、转接合或电击法等方法。
有用的宿主包括微生物,哺乳动物细胞,植物细胞以及其它类似细胞。微生物选择自细菌,如大肠杆菌,恶臭假单孢杆菌,木醋杆菌,巴氏醋杆菌,醋化醋杆菌,汉氏醋杆菌,微白葡糖杆菌,被膜葡糖杆菌,蜡状葡糖杆菌,二羟丙酮葡糖杆菌,葡萄糖葡糖杆菌,工业葡糖杆菌,生黑葡糖杆菌,非氧化葡萄糖葡糖杆菌,氧化葡糖杆菌,氧化葡糖杆菌球状亚种,玫瑰葡糖杆菌,锈色葡糖杆菌,弱氧化葡糖杆菌,或能表达重组SLDH和/或ORF2基因的任何一种细菌。本发明还可使用所说微生物的有用对等物、传代培养物、突变体或突变种。较好的菌株有E.coli K12及其衍生物,恶臭假单孢杆菌,葡糖杆菌,醋杆菌菌株等。
通过本领域内熟知方法,将本发明提供的SLDH和/或ORF2基因/核苷酸序列连接至合适的载体中,此载体内包含有可在上述宿主细胞内操作的调控区如启动子、核糖体结合位点和转录终止子,由此获得表达载体。当SLDH和ORF2基因组合克隆时,它们可串联或分别克隆至同一质粒上,或染色体DNA上。图4和图5图解了SLDH和ORF2基因组合克隆至同一质粒的形式。也可以将其中一个基因克隆于质粒中,而另一个基因则克隆至染色体DNA上。
为构建携带有重组表达载体的重组微生物,可采用多种基因转移方法,如转化、转导、接合生殖(《普通及分子细菌学方法》,第14和15章,Philipp Gerhardt等编,美国微生物学社会出版,1994年)和电击法。构建重组生物可选择分子生物学领域内熟知的方法。大肠杆菌、葡糖杆菌和醋杆菌可选用一般的转化系统。大肠杆菌还可选用转导系统。在包括大肠杆菌、恶臭假单孢杆菌和葡糖杆菌等革兰氏阳性和革兰氏阴性细菌中,可广泛采用接合生殖体系。WO89/06688中公开了一种较好的接合生殖方法。这种接合可在液体培养基中或固体表面上进行。生产SLDH和/或ORF2的较好宿主细胞可选择自大肠杆菌,恶臭假单孢杆菌,葡糖杆菌和醋杆菌。通常在接合生殖所用的宿主细胞内加入一个选择标记,比如常选用萘啶酮酸抗性或利福平抗性标记。也可采用一些天然抗性标记,比如许多葡糖杆菌中可选用多粘菌素B抗性标记。
本发明提供了重组型SLDH。为提高SLDH酶的产率,可将本发明提供的SLDH基因导入至包括葡糖杆菌属和醋杆菌属等乙酸细菌的生物中。也可利用本发明的SLDH基因和ORF2基因组合,在葡糖杆菌外的微生物内生产有活性的SLDH。重组型SLDH可固定于固相载体上以进行固相酶反应。本发明也提供了重组生物。利用这些重组生物可由D-山梨醇生产L-山梨糖。甚至可以在导入有本发明的SLDH基因和ORF2基因组合的非乙酸细菌的宿主生物内由D-山梨醇生产L-山梨糖。
实施例实施例1.SLDH的氨基酸序列测定(1)经赖氨酸内肽酶处理的SLDH多肽的N-末端氨基酸序列分析对来源于SLDH蛋白的第1、3和8号肽进行了部分氨基酸序列的测定(附图1;SEQ ID No4至6)。利用赖氨酸内肽酶对弱氧化葡糖杆菌IFO 3255(T.Hoshino等,EP728840)内纯化的SLDH进行消化。存在于100mMTris·HCl缓冲液(pH 9.0)中的反应混合物(25毫升)含有1.2mM赖氨酸内肽酶和3nmol SLDH蛋白,于37℃反应15小时。由此产生的多肽片段在0.1%TFA溶液中,利用具乙腈/异丙醇梯度的HPLC柱(柱C-4蛋白,VYDAC,加利福尼亚,美国),按1.0毫升/分钟的流速进行分离。测定多肽洗脱液在214nm处的紫外吸收值,收集峰组分,再利用氨基酸测序仪(应用性生物系统470A型,Perkin Elmer公司,Conn,美国)测定其N-末端氨基酸序列。
实施例2.PCR方法克隆部分SLDH基因利用弱氧化葡糖杆菌IFO 3255的染色体DNA和s7、s6R简并性寡核苷酸DNA引物进行PCR反应。s7和s6R引物的序列如附图1所示。使用热循环仪(ZYMOREACTOR Ⅱ AB-1820,ATTO,东京,日本),通过热稳定的聚合酶Amplitaq(Perkin-Elmer,Roche Molecular Systems Inc.,NJ,USA)进行PCR扩增。PCR扩增采用下述反应体系(50微升)每种脱氧核糖核苷三磷酸各200μm,每种引物各10~20pmol(54-288简并性),弱氧化葡糖杆菌IFO3255的染色体DNA 6ng以及0.5单位保存于供应商所提供缓冲液中的这种DNA聚合酶。反应进行30个循环,每个循环包括1)94℃下进行1分钟的变性步骤;2)48℃下进行1分钟的退火步骤;3)72℃进行2分钟的合成步骤。由此扩增出1.6kb的DNA,再将其克隆至大肠杆菌载体pUC57/T(MBI Fermentas,Vilnius,Lithuania)中,这个载体具有ddT加尾的3’-末端,它可以直接连接扩增的DNA片段,由此获得重组质粒pMT20。通过双脱氧链末端终止法(F.Sanger等,美国国家科学院院报,第74卷,5463-5467页,1977年)测定所克隆DNA的核苷酸序列。此1.6kb片段编码第3和第8号多肽。
实施例3.完整SLDH基因的克隆(1)建立弱氧化葡糖杆菌IFO 3255的基因库弱氧化葡糖杆菌IFO 3255在MB琼脂培养板上生长2天后,收集细胞,提取其染色体DNA。在500微升反应体系中加入20单位EcoRI,部分消化染色体DNA(160微克)。消化5、10、15、30、60分钟后分别取出部分样品,通过琼脂糖凝胶电泳检测消化程度。含有部分消化DNA片段的前四个组分合并后,进行制备性凝胶电泳(0.6%琼脂糖)。切割含15-35kb片段的凝胶并进行电洗脱。洗脱液过滤后加入乙酸钠和乙醇,于-80℃沉淀,DNA片段经离心收集后悬浮于200μl含1mM EDTA的10mM Tris·HCl(pH8.0)的缓冲液中。
同时,利用EcoRI完全消化1.8微克粘粒载体pVK100,再进行小牛肠道碱性磷酸酶处理。使用连接试剂盒(TakaraShuzo,Kyoto,日本)在20个独立管中加入已线性化和去磷酸化的pVK100,及弱氧化葡糖杆菌IFO3255染色体DNA的15-35kb EcoRI酶切片段(5微克),进行连接反应。连接反应采用供应商所推荐的条件,以获得高度聚合的DNA。按照供应商(Amersham,日本)提供的方法,对DNA连接产物进行体外包装。由此产生的噬菌体颗粒用于感染基因组库宿主菌E.coli ED 8767,从而获得4271个集落。所有经测试的集落(20个)都含有平均约25kb的DNA插入片段。
(2)集落杂交克隆SLDH完整基因利用32P标记的pMT20中的1.6kb DNA片段,通过集落杂交方法,从上述的粘粒文库中筛选分离含有SLDH完整基因的克隆。筛选分离到一个克隆,将其命名为pSLII。此克隆在pVK100载体上插入了25kb插入片段。从pSLII中分离出6.2kb的PstI酶切片段,克隆至pUC18中,获得pUS LIIP质粒。从pUSLIIP质粒中分离含有ORF2和SLDH基因的6.2kb PstI酶切片段,亚克隆至pCRII载体(Invitrogen公司,加利福尼亚,美国),获得pCRSLIIP。从这个质粒中,将含6.2kb PstⅠ酶切片段的DNA片段以HindⅢ-XhoⅠ片段形式分离出来,再克隆至pVK100的HindⅢ和XhoⅠ位点间,获得pVKSLIIP。
(3)在大肠杆菌中表达SLDH基因为验证6.2kb的PstⅠ片段确实编码SLDH目的蛋白,利用前面所述的抗SLDH抗体,对含有pUSLIIP的E.coli JM109细胞进行了Western杂交分析。在转化子中观察到分子量约80KD的免疫阳性蛋白质,由此表明,此PstⅠ酶切片段编码具有完整SLDH分子量大小(79KD+/-0.5KD)的多肽。
(4)用作SLDH活性补偿测试菌株-SLDH缺失型葡糖杆菌26A11株的构建使用生黑葡糖杆菌IFO3293作为母株,通过转座子Tn5进行突变。Tn5是一种编码卡那霉素抗性的转座因子,它能随机整合至宿主生物的染色体上,导致无义突变,因而被广泛用作革兰氏阴性细菌的突变剂。选择IFO3293作为母株有以下原因(1)它能利用D-山梨醇产生L-山梨糖,(2)使用纯化自弱氧化葡糖杆菌IFO3255的SLDH制成的抗体进行Western杂交分析,这种菌株具有约80KD的免疫阳性多肽,(3)这种菌株比弱氧化葡糖杆菌IFO3255菌株产生Tn5突变体的频率要高很多。
生黑葡糖杆菌IFO3293株在含有5ml MB培养基的试管中,于30℃培养过夜。其中MB培养基组成为甘露糖醇25克/升,酵母抽提物(Difco实验室)5克/升,细菌蛋白胨(Difco)3克/升。在分别装有5ml含50μg/ml卡那霉素的LB培养基的试管中各接种大肠杆菌HB101(pRK2013)〔D.H.Figurski,美国国家科学院院报,第76卷,1648-1652页,1979年〕和大肠杆菌HB101(pSUP2021)〔R.Simon等,生物技术,第1卷,784-791页,1983年〕,于37℃培养过夜。通过离心分别收集菌体,并悬浮于一半体积的MB培养基中。三种菌体悬液按1∶1∶1的比例混合,混合物加入至铺于MB琼脂板表面的硝酸纤维素滤膜上。培养板于27℃培养过夜后,刮下滤膜上的培养细菌,将它们悬浮于适量体积的MB培养基中,再铺于筛选板上(MPK板)。MB培养基含有10微克/毫升多粘菌素B和50微克/毫升卡那霉素。MPK板置于27℃培养3至4天。
利用抗SLDH的抗体,对由此获得的3436个Tn5突变体进行免疫点杂交。在96孔微滴定板上分别将各株细胞悬浮于50μlLaemmli缓冲液中,置于60℃消化2小时。这种Laemmli缓冲液含有62.5mM Tris·HCl(pH 6.5),10%甘油,2%SDS及5%β-巯基乙醇。将无细胞抽提液(CFEs)打点于硝酸纤维素滤膜上,利用AP连接底物试剂盒(Bio-RAD实验室,Richmond,加利福尼亚,美国)对CFEs进行杂交,筛选免疫阳性样品。由此利用免疫点杂交筛选只获得一个无阳性信号的菌株26A11。
通过Western杂交分析进一步确证26A11菌株确实是SLDH缺失型。26A11表达SLDH量最多仅为母菌株的1/500。26A11不是一个SLDH完全缺失型菌株,但由于Tn5的插入,其内源SLDH基因活性受到抑制。通过Tn5插入位点附近的序列分析,表明这个插入位点靠近C末端。随后通过休止细胞反应测定26A11和野生型葡糖杆菌株中的SLDH活性。在含有2%D-山梨醇的100mM磷酸钾缓冲液(pH7.0)中,26A11糖很少能将D-山梨醇转化为L-山梨糖,而野生菌株IFO3293和IFO3255则能在30℃39.5小时后完全实现转化。
(5)在26A11中表达SLDH基因为验证所获得的SLDH克隆确实具有SLDH活性,设计并进行了互补实验。通过接合生殖的方法,将pSLⅡ和pVKSLIIP质粒导入至26A11中。携带有pSLⅡ和pVKSLIIP质粒的转接合子通过微型休止细胞反应证明能恢复SLDH活性,在Western杂交分析中具有约80KD的免疫反应性多肽。
(6)SLDH基因的核苷酸序列测定利用pUSLIIP质粒对SLDH和ORF2基因进行序列测定。由此测得的核苷酸序列(SEQ ID No1;3481 bp)结果表明,SLDH基因的ORF(2223bp,SEQ ID No1中第572-2794位核苷酸)编码具有740个氨基酸残基的多肽(SEQ IDNo2),其中包含有利用纯化SLDH多肽所测得的三个氨基酸序列(SEQ ID No4至6中的第1,3和8号肽)。如图2和3所示,此段核苷酸序列不仅含有SLDH的ORF,在其上游还发现一个新的ORF-ORF2。ORF2的ORF(381 bp,SEQ IDNo1中第192-572位核苷酸)编码一个具有126个氨基酸残基的多肽(SEQ ID No3)。
通过氨基酸测序,测得1号肽中第4位氨基酸为Glu,但根据DNA测序的结果,此处应为Ala;通过氨基酸测序,测得3号肽中第11位氨基酸为Gln,而DNA测序结果表明此处为Pro。所推断的氨基酸序列中可能含有一个信号肽类似区(SEQ ID No8),它包含(1)许多疏水性残基;(2)N端含有带正电的残基;(3)具有可作为切割信号的Ala-Xxa-Ala位点。按实施例3(7)的方法测定真正的信号肽序列。SLDH基因的潜在核糖体结合位点(Shine-Dalgarno,SD,序列)位于起始密码子上游8bp处(SEQ ID No1中第558-564位核苷酸AGAGGAG)。ORF2基因的潜在SD序列位于起始密码子上游10bp处(SEQ ID No1中第177-182位核苷酸GGGAGG)。如图3所示,SLDH结构基因下游紧接处有一些反向重复序列(第2803-2833位和第2838-2892位核苷酸),它们可能可以作为SLDH基因的转录终止环。ORF2基因的反向重复序列位于第684-704位核苷酸序列区。
利用mpBlast程序(NCBI,Bethesda,Md,USA)和GCG结构域程序(Genetics Computer Group,UniversityResearch Park,WI,USA)分析SLDH和ORF2的同源性。SLDH多肽在其C末端附近区含有喹啉蛋白(q uinoprotein)普通保守序列(SEQ ID N o2中第632-692位氨基酸残基),另外还有一个可能是作为喹啉蛋白结构域的序列(PrositeNo.PS00363〔DN〕W.{3}G〔RK〕.{6}〔FY〕S.{4}〔LIVM〕N.{2}NV.{2}L〔RK〕;SEQ ID No2中第79-107位氨基酸残基。
ORF2与来源于氧化葡糖杆菌、大肠杆菌、乙酸钙不动杆菌的PQQ-依赖型、膜结合的D-葡萄糖脱氢酶(GDH)的N-末端区域具有一定的同源性,此区域是将GDH连接至膜的一个跨膜区。ORF2与氧化葡糖杆菌、大肠杆菌、乙酸钙不动杆菌的GDH的同源性分别为30%,32%和37%。ORF2蛋白可能是作为锚定蛋白使SLDH成为膜结合蛋白类型。
实施例4.成熟SLDH多肽的N末端和C末端序列测定对N-末端直接进行测序没有得到结果,表明N-末端受到阻抑。因此,在0.1M Tris·HCl溶液中,利用内切蛋白酶Lys-C(Wako,Osaka,日本),于37℃处理SLDH多肽20小时,其中底物与酶比例为20∶1(重量/重量)。通过反相HPLC(RP300,1mm×25cm,应用生物系统,福斯特城,加利福尼亚)分析总消化产物,利用质谱仪(TSQ 700三相四极仪,Finnigan-MAT,San Jose,加利福尼亚)测定峰组分的分子量。质谱仪分析、氨基酸组成分析结果以及由所测核苷酸序列SEQ ID No1推断出的氨基酸组成几方面结果表明消化产物之一-SEQ ID No7可能是N-末端序列部分。进一步进行碰撞诱导解离(CID)分析确证具N-末端序列的肽链的同一性。经测序表明N末端为焦谷氨酰残基。
如SEQ ID No7所示,SLDH的N末端经测序为Gln-Phe-Ala-Pro-Ala-Gly-Ala-Gly-Gly-Glu-Pro-Ser-Ser-Ser-Val-Pro-Gly-Pro-Gly-Asn-Ala-Ser-Glu-Pro-Thr-Glu-Asn-Ser-Pro-Lys,因此,其信号肽序列含24个氨基酸残基。如SEQ ID No8所列,信号肽序列为Met-Arg-Arg-Pro-Tyr-Leu-Leu-Ala-Thr-Ala-Ala-Gly-Leu-Ala-Leu-Ala-Cys-Ser-Pro-Leu-Ile-Ala-His-Ala。利用经V8蛋白酶消化所回收的肽测定了C-末端序列,为Pro-Asp-Ala-Ile-Lys-Gln(SEQ ID No9)。
实施例5.在大肠杆菌中表达SLDH和/或ORF2基因按照图4路线,利用实施例3(2)中的pCRSLIIP质粒,构建几种携带有由lac启动子调控的SLDH基因的质粒,并在其中插入或不插入ORF2基因。由此获得三个质粒pTNB114质粒含有SLDH和ORF2基因,pTNB115质柱含有SLDH基因和去除包括核糖体结合位点与起始密码子(ATG)在内的N末端的ORF2基因,pTNB116质粒含有去除大部分序列的ORF2基因和完整SLDH基因。通过传统的转化方法将这三种质粒导入至大肠杆菌中。可利用这些转化子的无细胞抽提物,通过Western杂交分析测定其中SLDH多肽的产量。另外,利用休止细胞,可测定其中的SLDH活性。休止细胞反应的反应混合物组成为0.3%NaCl,1%CaCO3,4%D-山梨醇,1mM PMS,其中含有或不含有1μg/ml PQQ。反应于室温进行17小时。利用硅胶60F254,0.25mm,Merck,在显影溶剂(组成为n-丙醇-H2O-1%H3PO4-HCOOH,比例400∶100∶10∶1)和间萘二酚喷显剂作用下,通过TLC实验可测定生成L-山梨糖的SLDH活性。通过Western杂交分析,在所有转化子中,甚至在无ORF2基因表达的转化子中都检测到SLDH多肽。但是,生成L-山梨糖的SLDH活性则仅在携带有含完整ORF2基因的pTNB114质粒的转化子中检测到,活性测定是在PQQ存在时的休止细胞反应条件下进行的。
实施例6.大肠杆菌中SLDH和/或ORF2基因的表达附图5图解了质粒pTNB110和pTNB143的构建过程。通过在pUC18的HindⅢ-XhoⅠ位点间插入含DSM4025 A酶基因启动子(pA)(T.HoShino等,欧洲专利申请号9611500.8)的HindⅢ-KpnⅠ片段和pTNB114质粒来源的KpnⅠ-XhoⅠ片段,构建了pTNB110质粒,此质粒携带有在pA控制下的ORF2和SLDH基因。如图5所示,在杂合载体pUC57/pCRⅡ(含pUC57来源的具plac的ScaⅠ-HindⅢ片段和pCRⅡ来源的无plae的XhoⅠ-ScaⅠ片段)中插入pTNB141来源的0.9kb SalⅠ片段和pTNB135来源的3.2kb HindⅢ-XhoⅠ片段,由此构建成pTNB143质粒,此质粒中ORF2和SLDH基因是以独立表达单元存在的,即都有各自的pA启动子。通过传统的转化方法,将pTNB110和pTNB143质粒导入至大肠杆菌内。由此获得的转化子按实施例5叙述的方法进行Western杂交分析和休止细胞反应。结果表明,携带有pTNB110和pTNB143质粒的两种转化子都能生成SLDH蛋白,在PQQ存在下,都具有利用D-山梨醇生成L-山梨糖的SLDH活性。
实施例7.氧化葡糖杆菌DSM4025中表达SLDH基因氧化葡糖杆菌DSM4025具有很强的L-山梨糖和L-山梨酮脱氢酶活性,而生成L-山梨糖的D-山梨醇脱氢酶活性则很低。为构建能在氧化葡糖杆菌DSM4025内表达SLDH的pTNB136质粒,在pVK100的HindⅢ-XhoⅠ位点间插入了pTNB135来源的HindⅢ-XhoⅠ片段(图5)。将质粒pTNB136和其载体pVK100通过接合生殖的方法导入至GOBΔK菌株中。此菌株是氧化葡糖杆菌DSM4025的一个突变株,它缺失了含编码具有生成L-山梨糖的D-山梨醇脱氢酶活性的B酶基因(EnzymeB)(EP832974)的两个EcoRI片段,而代之以卡那霉素抗性基因表达盒(pUC4K的1.28kb EcoRI片段;Pharmacia Uppsala,Sweden),导致无B酶基因。此基因破坏是通过本领域熟知的DNA重组技术完成的。在10%D-山梨醇中,于30℃烧瓶发酵4天后,携带有pTNB136或pVK100的GOBΔK转接子各能产生5克/升、2克/升的2KAG(培养基组成为10%D-山梨醇、1.6%尿素,0.05%甘油,0.25%MgSO4·7H2O,3%corn steep liquor,6.25%面包酵母湿细胞(baker’s yeast wet cells)和1.5%CaCO3)。利用抗SLDH的抗体进行的Western杂交分析结果表明,携带有pTNB136的转接子能表达具免疫反应性的SLDH多肽。
序列表(1)一般信息(ⅰ)申请人名称F.Hoffmann-La Roche AG街道Grezacherstrasse 124城市Basle国家瑞士邮政编码CH-4002电话061-6882511传真061-6881395电传962292/965542 hlr c(ⅱ)发明题目D-山梨醇脱氢酶基因(ⅲ)序列数9(ⅳ)计算机可读形式(A)介质类型软盘(B)计算机Macintosh(C)操作系统(D)软件MS word ver 5.1a(V)当前申请数据(A)申请号(B)申请日期(C)分类(2)SEQ ID N01信息(ⅰ)序列特征(A)长度3481个碱基对(B)类型核酸(C)链型双链(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅲ)初始来源生物弱氧化葡糖杆菌菌株IFO3255(ⅳ)特性主要特性CDS位置192..572测序方法E主要特性CDS位置592..2794测序方法EACAAATCATA CTGGCGGCGC TGTAGTGACA ATTCCGGCGG GTTAAAGAGA ATATTTTTTT60GGTGACAGGC CACAACAAAT TTTTGTTACC TCAAACACAG TTTTGTTAGA GCATTTGAAA 120ACGAAGTCCG ATGGACCTGA ACTGAATATG GATTTACCGT CCGGAGGATT CAGTTTGGGA 180GGCATTCGGT TATGCCAAAT CTTCAAGGTA ATAGGACTCT GACGGAGTGG CTGACGCTGC 240TTCTCGGGGT CATCGTCCTT CTTGTGGGCC TGTTCTTCGT CATTGGGGGT GCTGACCTCG 300CGATGCTGGG CGGCTCTACC TACTATGTTC TCTGTGGCAT CCTCCTGGTT GCTAGCGGCG 360TATTCATGCT CATGGGCCGC ACGCTTGGTG CCTTCCTGTA TCTGGGTGCC CTGGCCTACA 420CGTGGGTCTG GTCCTTCTGG GAAGTCGGTT TCAGCCCCAT CGATCTTCTG CCCCGCGCTT 480TCGGCCCGAC CATCCTTGGC ATTCTCGTTG CCCTGACCAT TCCGGTCCTG CGCCGCATGG 540AAAGCCGTCG TACTCTCAGA GGAGCCGTCT GATGCGCCGG CCTTACCTTC TAGCAACAGC 600CGCAGGACTC GCCCTTGCCT GTTCGCCGCT CATCGCTCAT GCACAGTTTG CTCCCGCAGG 660GGCTGGCGGC GAACCTTCCT CGTCAGTTCC TGGGCCAGGA AATGCGAGCG AGCCCACCGA 720AAACTCTCCG AAAAGTCAGA GCTACTTCGC AGGACCGTCG CCCTATGCCC CGCAGGCTCC 780TGGCGTAAAC GCAGCCAACC TGCCGGACAT TGAGTCAATC GATCCCTCGC AGGTCCCGGC 840CATGGCTCCG CAGCAGAGTG CCAATCCGGC ACGTGGAGAC TGGGTTGCTT ACGGACGTGA 900CGATCATCAG ACGCGATACT CTCCGCTTTC GGAAATCACG CCTGAGAACG CAAGCAAGCT 960CAAGGTCGCT TTCGTCTACC ACACGGGGAG TTATCCGCGT CCGGGACAGG TGAACAAATG 1020GGCCGCCGAA ACCACGCCGA TCAAGGTTGG TGACGGTCTC TACACATGTT CCGCCATGAA 1080CGACATCATC AAGCTGGATC CGGCTACGGG TAAGCAGATC TGGCGTCGGA ACGTGGATGT 1140CAAATACCAC TCCATTCCCT ATACCGCTGC CTGTAAGGGT GTGACGTATT TCACGTCCTC 1200CGTGGTGCCG GAAGGCCAGC CCTGCCACAA TCGCCTTATC GAAGGCACGC TGGATATGCG 1260TCTGATTGCG GTTGACGCGG AGACAGGGGA TTTCTGCCCT AATTTCGGTC ATGGTGGTCA 1320GGTCAACCTG ATGCAGGGTC TGGGTGAGTC TGTTCCGGGC TTCGTCTCCA TGACGGCACC 1380TCCACCGGTC ATCAACGGCG TCGTGGTTGT AAACCACGAA GTGCTCGACG GTCAGCGCCG 1440CTGGGCTCCG TCCGGTGTGA TCCGTGGTTA CGATGCTGAA AGTGGCAAAT TCGTATGGGC 1500CTGGGACGTC AACAATTCCG GACGATCACA GCCAGCCTAC CGGGTAACCG TCATTACAGC 1560CGTGGAACGC CGAATTCCTG GGCTACCTGA CAGGCGACAA CGAGGAGGGT CTCGTTTACG 1620TCCCGACAGG AACTCTGCTG CTGACTATTA CAGCGCCCTG CGTAGTGATG CTGAAAACAA 1680GGTGTCCTCC GCTGTTGTCG CCATTGACGT CAAGACGGGT TCTCCGCGCT GGGTCTTCCA 1740GACGGCTCAT AAGGACGTCT GGGATTATGA CATCGGTTCA CAGGCGACCC TGATGGATAT 1800GCCTGGCCCG GATGGCCAGA CGGTTCCTGC TCTCATCATG CCGACCAAGC GTGGCCAGAC 1860GTTCGTGCTT GACCGTCGTA CCGGCAAGCC AATTCTGCCG GTTGAAGAAC GCCCAGCTCC 1920GTCCCCTGGT GTTATTCCGG GTGACCCGCG TTCTCCGACG CAGCCATGGT CCGTCGGGAT 1980GCCGGCCCTT CGCGTGCCGG ATCTGAAAGA GACAGACATG TGGGGTATGT CCCCCATCGA 2040TCAGCTCTTC TGCCGTATCA AGTTCCGCCG TGCGAACTAT GTGGGTGAGT TCACACCACC 2100GAGCGTTGAC AAGCCGTGGA TTGAATATCC GGGCTATAAC GGTGGCAGTG ACTGGGGCTC 2160CATGTCCTAT GATCCGCAGT CCGGCATCCT GATTGCGAAC TGGAACATCA CACCGATGTA 2220CGACCAGCTC GTAACCCGCA AGAAGGCAGA CTCCCTCGGC CTGATGCCGA TCGATGACCC 2280CAACTTCAAG CCAGGTGGCG GTGGTGCCGA AGGTAACGGC GCCATGGACG GAACGCCTTA 2340CGGTATCGTC GTGACACCGT TCTGGGATCA GTACACGGGC ATGATGTGCA ACCGTCCGCC 2400CTACGGTATG ATCACAGCCA TCGACATGAA GCACGGCCAG AAGGTTCTGT GGCAGCATCC 2460GCTCGGAACG GCTCGCGCCA ACGGTCCATG GGGTCTGCCA ACAGGTCTGC CATGGGAAAT 2520CGGCACTCCG AACAATGGTG GTTCGGTTGT GACCGGTGGC GGTCTGATCT TCATCGGTGC 2580GGCAACGGAT AACCAGATCC GCGCGATTGA TGAACACACT GGCAAGGTTG TCTGGAGCGC 2640AGTCCTCCCC GGCGGCGGTC AGGCCAATCC GATGACGTAT GAAGCCAATG GTCACCAGTA 2700CGTTGCCATC ATGGCTGGCG GTCATCACTT CATGATGACG CCAGTGTCTG ACCAGCTTGT 2760GGTTTACGCA CTGCCGGATG CCATCAAGCA GTAATTAAGT CCTGTGGCGG ATGTGTCATG 2820CATATCCGCC ACACTCCATC GTCAGAAGGA GACTTTCGTG CTAGCCATGC AGGGAAGTCT 2880CCTTTTGACG TTTTTGGCTC TTTCCAGCGA GCGGGCAGTC TGAAACGGGG CTTCGTCTGG 2940CTCGTACTTT CAGAATGGCT CGTCGCACCC TCATGACTGC CCACTCCCCC GTTATCTTGC 3000AGGTTCTGCC AGCCCTCAGC ACGGGCGGCC TGGAGCGGGG AGCTATTGAA ATTGCGGCTG 3060CCATCACACA GGCTGGTGGC AAGGCCATTG TCGCTTCGAA GACGGGTCCT CTTCTTGTGC 3120AACTCCGCCA CGTCGGAGCA GTGCATGTGC CGCTGGATCT CAAATCGAAA TCGCCGTTTT 3180CTGTTCGGCG CCGTGCCCGT GAACTCCAGA AACTGATCCG GGAGCAGCAG GTTGATCTGG 3240TTCACGCCCG GTCCCGTATT CCGGCATGGG CCGCCTGGCT CGCCTGCCGC CGCGAGAACA 3300TTCCTTTCGT GACAACGTGG CATGGCGTCC ACGAGGCTGG CTGGTGGGGC AAGAAATTCT 3360ACAATTCGGT GCTGGCCCGG GGTGCAAGGG TCATCGCAAT TTCGCACTAC ATTTCCGGGC 3420GTCTTTCAGG GCAGTACGGC GTTCAGGCAG ATCGTCTTCG AACCATTCCG CGTGGTGCCG 3480SEQ ID No2信息(ⅰ)序列特征(A)长度740个残基(B)类型氨基酸(C)拓扑结构线性(ⅱ)分子类型蛋白质(ⅲ)初始来源生物弱氧化葡糖杆菌菌株IFO3255(ⅳ)特性主要特性信号肽位置-24..-1测序方法E主要特性成熟肽位置1..76测序方法EMet Arg Arg Pro Tyr Leu Leu Ala Thr Ala Ala Giy Leu Ala Leu-24 -20 -15 -10Ala Cys Ser Pro Leu Ile Ala His Ala Gln Phe Ala Pro Ala Gly-5 1 5Ala Gly Gly Glu Pro Ser Ser Ser Val Pro Gly Pro Gly Asn Ala10 15 20Ser Glu Pro Thr Glu Asn Ser Pro Lys Ser Gln Ser Tyr Phe Ala25 30 35Gly Pro Ser Pro Tyr Ala Pro Gln Ala Pro Gly Val Asn Ala Ala40 45 50ASh Leu Pro Asp Ile Glu Ser Ile Asp Pro Ser Gln Val Pro Ala55 60 65Met Ala Pro Gln Gln Ser Ala ASh Pro Ala Arg Gly Asp Trp Val70 75 80Ala Tyr Gly Arg Asp Asp His Gln Thr Arg Tyr Ser Pro Leu Ser85 90 95Glu Ile Thr Pro Glu Asn Ala Ser Lys Leu Lys Val Ala Phe Val100 105 110Tyr His Thr Gly Ser Tyr Pro Arg Pro Gly Gln Val Asn Lys Trp115 120 125Ala Ala Glu Thr Thr Pro Ile Lys Val Gly Asp Gly Leu Tyr Thr130 135 140Cys Ser Ala Met Asn Asp Ile Ile Lys Leu Asp Pro Ala Thr Gly145 150 155Lys Gln Ile Trp Arg Arg Asn Val Asp Val Lys Tyr His Ser Ile160 165 170Pro Tyr Thr Ala Ala Cys Lys Gly Val Thr Tyr Phe Thr Ser Ser175 180 185Val Val Pro Glu Gly Gln Pro Cys His Asn Arg Leu Ile Glu Gly190 195 200Thr Leu Asp Met Arg Leu Ile Ala Val Asp Ala Glu Thr Gly Asp205 210 215Phe Cys Pro Asn Phe Gly His Gly Gly Gln Val Asn Leu Met Gln220 225 230Gly Leu Gly Glu Ser Val Pro Gly Phe Val Ser Met Thr Ala Pro235 240 245Pro Pro Val Ile Asn Gly Val Val Val Val Asn His Glu Val Leu250 255 260Asp Gly Gln Arg Arg Trp Ala Pro Ser Gly Val Ile Arg Gly Tyr265 270 275Asp Ala Glu Ser Gly Lys Phe Val Trp Ala Trp Asp Val Asn Asn280 285 290Ser Gly Arg Ser Gln Pro Ala Tyr Arg Val Thr Val Ile Thr Ala295 300 305Val Glu Arg Arg Ile Pro Gly Leu Pro Asp Arg Arg Gln Arg Gly310 315 320Gly Ser Arg Leu Arg Pro Asp Arg Asn Ser Ala Ala Asp Tyr Tyr325 330 335Ser Ala Leu Arg Ser Asp Ala Glu Asn Lys Val Ser Ser Ala Val340 345 350Val Ala Ile Asp Val Lys Thr Gly Ser Pro Arg Trp Val Phe Gln355 360 365Thr Ala His Lys Asp Val Trp Asp Tyr Asp Ile Gly Ser Gln Ala370 375 380Thr Leu Met Asp Met Pro Gly Pro Asp Gly Gln Thr Val Pro Ala385 390 395Leu Ile Met Pro Thr Lys Arg Gly Gln Thr Phe Val Leu Asp Arg400 405 410Arg Thr Gly Lys Pro Ile Leu Pro Val Glu Glu Arg Pro Ala Pro415 420 425Ser Pro Gly Val Ile Pro Gly Asp Pro Arg Ser Pro Thr Gln Pro430 435 440Trp Ser Val Gly Met Pro Ala Leu Arg Val Pro Asp Leu Lys GluD-山梨醇脱氢酶基因 445450 455Thr Asp Met Trp Gly Met Ser Pro Ile Asp Gln Leu Phe Cys Arg460 465 470Ile Lys Phe Arg Arg Ala Asn Tyr Val Gly Glu Phe Thr Pro Pro475 480 485Ser Val Asp Lys Pro Trp Ile Glu Tyr Pro Gly Tyr Asn Gly Gly490 495 500Ser Asp Trp Gly Ser Met Ser Tyr Asp Pro Gln Ser Gly Ile Leu505 510 515Ile Ala Asn Trp Asn Ile Thr Pro Met Tyr Asp Gln Leu Val Thr520 525 530Arg Lys Lys Ala Asp Ser Leu Gly Leu Met Pro Ile Asp Asp Pro535 540 545Asn Phe Lys Pro Gly Gly Gly Gly Ala Glu Gly Asn Gly Ala Met550 555 560Asp Gly Thr Pro Tyr Gly Ile Val Val Thr Pro Phe Trp Asp Gln565 570 575Tyr Thr Gly Met Met Cys ASn Arg Pro Pro Tyr Gly Met Ile Thr580 585 590Ala Ile Asp Met Lys His Gly Gln Lys Val Leu Trp Gln His Pro595 600 605Leu Gly Thr Ala Arg Ala Asn Gly Pro Trp Gly Leu Pro Thr Gly610 615 620Leu Pro Trp Glu Ile Gly Thr Pro Asn Asn Gly Gly Ser Val Val625 630 635Thr Gly Gly Gly Leu Ile Phe Ile Gly Ala Ala Thr Asp Asn Gln640 645 650Ile Arg Ala Ile Asp Glu His Thr Gly Lys Val Val Trp Ser Ala655 660 665Val Leu Pro Gly Gly Gly Gln Ala Asn Pro Met Thr Tyr Glu Ala670 675 680Asn Gly His Gln Tyr Val Ala Ile Met Ala Gly Gly His His Phe685 690 695Met Met Thr Pro Val Ser Asp Gln Leu Val Val Tyr Ala Leu Pro700 705 710Asp Ala Ile Lys Gln715 716SEQ ID No3信息(ⅰ)序列特征(A)长度126个残基(B)类型氨基酸(C)拓扑结构线性(ⅱ)分子类型蛋白质(ⅲ)片段类型内部片段(ⅳ)初始来源生物弱氧化葡糖杆菌菌株IFO3255(ⅴ)特性主要特性成熟肽位置1..126测序方法EMet Pro Asn Leu Gln Gly Asn Arg Thr Leu Thr Glu Trp Leu Thr1 5 10 15Leu Leu Leu Gly Val Ile Val Leu Leu Val Gly Leu Phe Phe Val20 25 30Ile Gly Gly Ala Asp Leu Ala Met Leu Gly Gly Ser Thr Tyr Tyr35 40 45Val Leu Cys Gly Ile Leu Leu Val Ala Ser Gly Val Phe Met Leu50 55 60Met Gly Arg Thr Leu Gly Ala Phe Leu Tyr Leu Gly Ala Leu Ala65 70 75Tyr Thr Trp Val Trp Ser Phe Trp Glu Val Gly Phe Ser Pro Ile80 85 90Asp Leu Leu Pro Arg Ala Phe Gly Pro Thr Ile Leu Gly Ile Leu95 100 105Val Ala Leu Thr Ile Pro Val Leu Arg Arg Met Glu Ser Arg Arg110 115 120Thr Leu Arg Gly Ala Val125 126SEQ ID No4信息(ⅰ)序列特征(A)长度8个残基(B)类型氨基酸(C)拓扑结构线性(ⅱ)分子类型肽(ⅲ)片段类型内部片段(ⅳ)初始来源生物弱氧化葡糖杆菌菌株IFO3255(ⅴ)特性测序方法ELys Trp Ala Glu Glu Thr Xaa Pro1 5 8SEQ ID No5信息(ⅰ)序列特征(A)长度24个残基(B)类型氨基酸(C)拓扑结构线性(ⅱ)分子类型肽(ⅲ)片段类型内部片段(ⅳ)初始来源生物弱氧化葡糖杆菌菌株IFO3255(ⅴ)特性测序方法ELys Ser Gln Ser Tyr Phe Ala Gly Pro Ser Gln Tyr Ala Pro1 5 10Gln Ala Pro Gly Val Asn Ala Xaa Asn Leu15 20 24SEQ ID No6信息(ⅰ)序列特征(A)长度16个残基(B)类型氨基酸(C)拓扑结构线性(ⅱ)分子类型肽(ⅲ)片段类型内部片段(ⅳ)初始来源生物弱氧化葡糖杆菌菌株IFO3255(ⅴ)特性测序方法ELys Val Leu Trp Gln His Pro Leu Gly Thr Ala Arg Xaa Asn1 5 10Gly Pro15 16SEQ ID No7信息(ⅰ)序列特征(A)长度30个残基(B)类型氨基酸(C)拓扑结构线性(ⅱ)分子类型肽(ⅲ)片段类型N-末端片段(ⅳ)初始来源生物弱氧化葡糖杆菌菌株IFO3255(ⅴ)特性测序方法EGln Phe Ala Pro Ala Gly Ala Gly Gly Glu Pro Ser Ser Ser1 5 10Val Pro Gly Pro Gly Asn Ala Ser Glu Pro Thr Gln Asn15 20 25Ser Pro Lys30SEQ ID No8信息(ⅰ)序列特性(A)长度24个残基(B)类型氨基酸(C)拓扑结构线性(ⅱ)分子类型肽(ⅲ)初始来源生物弱氧化葡糖杆菌菌株IFO3255(ⅳ)特性主要特性信号肽位置1..24测序方法EMet Arg Arg Pro Tyr Leu Leu Ala Thr Ala Ala Gly Leu Ala1 5 10 15Leu Ala Cys Ser Pro Leu Ile Ala His Ala20 24SEQ ID No9信息(ⅰ)序列特征(A)长度6个残基(B)类型氨基酸(C)拓扑结构线性(ⅱ)分子类型肽(ⅲ)片段类型C-末端片段(ⅳ)初始来源生物弱氧化葡糖杆菌菌株IFO3255(ⅴ)特性测序方法EPro Asp Ala Ile Lys Gln1 5 权利要求
1.一种DNA分子,其包含一段能编码具有(a)或(b)项定义且具有山梨醇脱氢酶活性的蛋白质的核苷酸序列(a)一种含有SEQ ID No2中第1-716位氨基酸序列的蛋白质,或(b)通过对(a)中蛋白质序列进行取代、缺失、插入或添加一个或数个氨基酸而衍生出的蛋白质。
2.按照权利要求1所述的DNA分子,它编码一种属于乙酸菌类的微生物的山梨醇脱氢酶。
3.按照权利要求2所述的DNA分子,其中所说的微生物属于葡糖杆菌属或醋杆菌属。
4.按照权利要求1-4中任一项所述的DNA分子,它选自下述组中(e)一种DNA分子,它含有SEQ ID No1第644-2791位或第572-2791位序列所代表的一段核苷酸序列,和(f)一种DNA分子,它能够与(e)中定义的DNA进行杂交并编码具有权利要求1中(a)项定义的蛋白质功能的蛋白质。
5.DNA分子组合,它含有(1)权利要求1-4中任一项所定义的DNA分子;和(2)一种编码ORF2的DNA分子,其核苷酸序列内含SEQ IDNo1第192-569位序列,和/或一种编码ORF2衍生物的DNA分子,所说的ORF2衍生物是在SEQ ID No3所定义序列内取代、缺失、插入或添加一至数个氨基酸,并且具有与ORF2同等功能的蛋白质。
6.按照权利要求5所述的DNA分子组合,它含有(1)一种含有SEQ ID No1第644-2791或第572-2791位核苷酸序列的DNA;或一种能与这种DNA分子杂交且编码具有权利要求1所定义蛋白质的功能的蛋白质的DNA;和(2)一种含有SEQ ID No1第192-569位核苷酸序列、编码ORF2的DNA分子或一种编码ORF2衍生物的DNA分子,其中所说的ORF2衍生物是通过对SEQ ID No3所定义序列进行取代、缺失、插入或添加一至数个氨基酸而产生的且具有ORF2功能之一的蛋白质。
7.一种含有权利要求1-6中任一项所述的DNA的表达载体。
8.一种含有权利要求5或6所述的DNA分子组合,其中相关DNA分别位于不同表达载体或同一表达载体上。
9.一种按照权利要求5或6所述的DNA分子组合,它们按照SEQ ID No1所描述的串联方式存在。
10.按照权利要求7所述的表达载体,它在选自属于葡糖杆菌、醋杆菌或大肠杆菌的微生物体内是有功能的。
11.一种已转化有权利要求7-10中任一项所述的表达载体的重组生物。
12.一种重组生物,该宿主生物的一条染色体DNA上含有权利要求5,6,8或9任一项所定义的DNA分子组合。
13.按照权利要求11或12所述的重组生物,其中宿主生物是一种选自属于葡糖杆菌属、醋杆菌属或大肠杆菌属的微生物。
14.一种生产重组D-山梨醇脱氢酶的方法,包括在适当培养基中培养权利要求11-13任一项所述的重组生物以及从培养体系中收集所说的重组型D-山梨醇脱氢酶。
15.一种重组型D-山梨醇脱氢酶,它是通过对权利要求1-4中任一项所述的DNA分子或权利要求5、6、8、9任一项所述的DNA分子组合进行表达产生的。
16.一种重组型D-山梨醇脱氢酶,它是按照权利要求14所述方法生产的。
17.一种按照权利要求15或16所述的重组型D-山梨醇脱氢酶,它固化在一种固相载体上以进行固相酶反应。
18.一种生产L-山梨糖的方法,包括利用权利要求16或17所述的重组型D-山梨醇脱氢酶,将D-山梨醇转化为L-山梨糖。
19.一种生产L-山梨糖的方法,包括在适当的培养基中,利用权利要求11-13任一项所述的重组生物进行发酵作用,将D-山梨醇转变为L-山梨糖。
全文摘要
一种DNA分子,其包含一段能编码具有(a)或(b)项定义且具有山梨醇脱氢酶活性的蛋白质的核苷酸序列:(a)一种含有SEQ IDNO∶2中第1—716位氨基酸序列的蛋白质,或(b)通过对(a)中蛋白质序列进行取代、缺失、插入或添加一个或数个氨基酸而衍生出的蛋白质;含有这种DNA分子的质粒;转化有这种质粒的宿主;生产这类蛋白质的方法以及这类蛋白质的用途。
文档编号C12R1/02GK1210148SQ98118469
公开日1999年3月10日 申请日期1998年8月20日 优先权日1997年8月21日
发明者星野立夫, 小岛节子, 新庄允子, 富山则文, 宫埼太郎 申请人:弗·哈夫曼-拉罗切有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1