糖基转移酶、突变体及其应用的制作方法

文档序号:16069086发布日期:2018-11-24 12:58阅读:236来源:国知局
本发明涉及生物技术和植物生物学领域,具体地,本发明涉及用于人参皂苷rh2合成的糖基转移酶、糖基转移酶突变体及其应用。
背景技术
人参皂苷是五加科人参属植物(如人参、三七、西洋参等)中的主要活性物质,近年来在葫芦科植物三七中也发现一些人参皂苷。目前,国内外科学家已经从人参、三七等植物中分离出了至少100种皂苷,人参皂苷属于三萜皂苷。其中一些人参皂苷被证实具有广泛的生理功能和药用价值:包括抗肿瘤、免疫调节、抗疲劳、护心、护肝等功能。其中多种皂苷已经用于临床,如以人参皂苷rg3单体为主要成分的药物参一胶囊可改善肿瘤患者的气虚症状,提高机体免疫功能。以人参皂苷rh2单体为主要成分的今幸胶囊是一种保健药品用于提高机体免疫力,增强抗病能力。从结构上来看,人参皂苷是皂苷元经过糖基化后形成的生物活性小分子。人参皂苷的皂苷元只有有限的几种,主要是达玛烷型的原人参二醇和原人参三醇,以及齐墩果烷型的香树脂。除了皂苷元的差异,人参皂苷之间结构上的差异主要体现在皂苷元不同的糖基化修饰上。人参皂苷的糖链一般结合在皂苷元的c3、c6、或c20的羟基上,糖基可以是葡萄糖、鼠李糖、木糖、和阿拉伯糖。不同的糖基结合位点,糖链组成和长度使人参皂苷在生理功能和药用价值上产生极大的差异。例如,人参皂苷rb1,rd和rc都是以原人参二醇为皂苷元的皂苷,它们之间的差别只是糖基修饰上的差别,但它们之间的生理功能就有很多的差别。rb1有稳定中心神经元系统的功能,而rc的功能却是抑制中心神经元系统的功能,rb1的生理功能非常广泛,而rd却只有非常有限的几种功能。稀有人参皂苷是指在人参中含量极低的皂苷。人参皂苷rh2(3-o-β-(d-glucopyranosyl)-20(s)-protopanaxadiol)属于原人参二醇类的皂苷,在皂苷元的c-3位羟基上连有一个葡萄糖基。人参皂苷rh2的含量大约只有人参干重的万分之一左右,但是,人参皂苷rh2具有良好的抗肿瘤活性,是人参中最主要的抗肿瘤活性成分之一,能够抑制肿瘤细胞生长、诱导肿瘤细胞凋亡、抗肿瘤转移。研究表明人参皂苷rh2能够抑制lungcancercells3ll(mice),morrislivercancercells(rats),b-16melanomacells(mice),以及helacells(human)的增值。在临床上,人参皂苷rh2与放疗或化疗结合治疗,可以增强放疗和化疗的效果。此外,人参皂苷rh2还具有抗过敏,提高机体免疫力的功能,抑制no和pge产生的炎症等作用。糖基转移酶的功能是将糖基供体(核苷二磷酸糖,例如udp-葡萄糖)上的糖基转移到不同的糖基受体上。根据氨基酸序列的不同,目前糖基转移酶已有94个家族。目前已测序的植物基因组中,发现了上百种以上不同的糖基转移酶。这些糖基转移酶的糖基受体包括糖、脂、蛋白、核酸、抗生素和其它的小分子。在人参中参与皂苷糖基化的糖基转移酶,其作用是把糖基供体上的糖基转移到皂苷元或者苷元的c3、c6或c20的羟基上,从而形成具有不同药用价值的皂苷。目前本领域尚缺乏一种有效的生产稀有人参皂苷rh2、人参皂苷f2的方法,因此迫切需要开发多种特异高效的糖基转移酶。技术实现要素:本发明的目的就是提供一类糖基转移酶及其应用,用于合成稀有人参皂苷rh2、人参皂苷f2。本发明的第一方面,提供了一种分离的多肽,所述分离的多肽的氨基酸序列在对应于seqidno:19所示氨基酸序列的第222位的氨基酸残基为非gln和/或在对应于seqidno:19所示氨基酸序列第322位的氨基酸残基为非ala。在另一优选例中,所述分离的多肽:i).具有如seqidno:19所示氨基酸序列且第222位的氨基酸残基为非gln和/或第322位的氨基酸残基为非ala,或ii).具有i)所限定的序列经过一个或几个氨基酸残基,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有i)所限定的分离的多肽功能的由i)衍生的分离的多肽。在另一优选例中,所述分离的多肽具有i)所限定的序列经过一个或几个氨基酸残基,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的添加而形成的序列,且基本具有i)所限定的分离的多肽功能的由i)衍生的分离的多肽。在另一优选例中,所述分离的多肽的氨基酸序列在对应于seqidno:19所示氨基酸序列的第222位的氨基酸残基选自以下氨基酸的至少一种:his、asn、gln、lys和arg。在另一优选例中,所述分离的多肽的氨基酸序列在对应于seqidno:19所示氨基酸序列的第222位的氨基酸残基为his。在另一优选例中,所述分离的多肽的氨基酸序列在对应于seqidno:19所示氨基酸序列的第322位的氨基酸残基选自以下氨基酸的至少一种:val、ile、leu、met和phe。在另一优选例中,所述分离的多肽的氨基酸序列在对应于seqidno:19所示氨基酸序列的第322位的氨基酸残基为val。在另一优选例中,所述分离的多肽的氨基酸序列在对应于seqidno:19所示氨基酸序列的第222位的氨基酸残基为his,在对应于seqidno:19所示氨基酸序列第322位的氨基酸残基为val。在另一优选例中,所述分离的多肽:iii).seqidno:19所示氨基酸序列且第222位的氨基酸残基为非gln和/或第322位的氨基酸残基为非ala,或iv).具有iii)所限定的序列经过一个或几个氨基酸残基,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有iii)所限定的分离的多肽功能的由iii)衍生的分离的多肽。在另一优选例中,所述分离的多肽具有iii)所限定的序列经过一个或几个氨基酸残基,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的添加而形成的序列,且基本具有iii)所限定的分离的多肽功能的由iii)衍生的分离的多肽。在另一优选例中,所述分离的多肽的氨基酸序列在seqidno:19所示氨基酸序列的第222位的氨基酸残基选自以下氨基酸的至少一种:his、asn、gln、lys和arg。在另一优选例中,所述分离的多肽的氨基酸序列在seqidno:19所示氨基酸序列的第222位的氨基酸残基为his。在另一优选例中,所述分离的多肽的氨基酸序列在seqidno:19所示氨基酸序列的第322位的氨基酸残基选自以下氨基酸的至少一种:val、ile、leu、met和phe。在另一优选例中,所述分离的多肽的氨基酸序列在seqidno:19所示氨基酸序列的第322位的氨基酸残基为val。在另一优选例中,所述分离的多肽的氨基酸序列在seqidno:19所示氨基酸序列的第222位的氨基酸残基为his,在seqidno:19所示氨基酸序列第322位的氨基酸残基为val。在另一优选例中,所述分离的多肽为糖基转移酶。在另一优选例中,所述糖基转移酶来源于人参属植物。在另一优选例中,所述糖基转移酶来源于人参、西洋参和/或三七。在另一优选例中,所述的多肽选自下组:(a)具有seqidno.:4或seqidno.:21所示氨基酸序列的多肽;(b)将seqidno.:4或seqidno.:21所示氨基酸序列的多肽经过一个或几个氨基酸残基,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的、或是添加信号肽序列后形成的、并具有糖基转移酶活性的衍生多肽;(c)序列中含有(a)或(b)中所述多肽序列的衍生多肽;(d)氨基酸序列与seqidno.:4或seqidno.:21所示氨基酸序列的同源性≥85%(较佳地≥90%、91%、92%、93%、94%、95%、96%、97%、98%或99%),并具有糖基转移酶活性的衍生多肽。在另一优选例中,所述的序列(c)为由(a)或(b)添加了标签序列、信号序列或分泌信号序列后所形成的融合蛋白。在另一优选例中,所述糖基转移酶活性指能将糖基供体的糖基转移到四环三萜类化合物的c-3位羟基上的活性。在另一优选例中,所述糖基转移酶能提高人参皂苷rh2和/或人参皂苷f2的产量。在另一优选例中,在人工构建的菌株中,所述糖基转移酶能提高人参皂苷rh2的产量;优选地,提高5-150%;更优选地,提高10-100%;更优选地,提高20-80%;最优选,提高28-70%。在另一优选例中,所述人工构建的菌株选自下组:酿酒酵母菌株、大肠杆菌菌株、毕赤酵母菌株、裂殖酵母菌株、克鲁维酵母菌株。本发明的第二方面,提供了一种分离的多核苷酸,所述的多核苷酸为选自下组的序列:(a)编码本发明的第一方面所述多肽的核苷酸序列;(b)编码如seqidno.:4或seqidno.:21所示多肽或其衍生多肽的核苷酸序列;(c)如seqidno.:3或seqidno.:22所示的核苷酸序列;(d)与seqidno.:3或seqidno.:22所示序列的同源性≥90%(较佳地≥91%、92%、93%、94%、95%、96%、97%、98%或99%)的核苷酸序列;(e)在seqidno.:3或seqidno.:22所示核苷酸序列的5’端和/或3’端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸所形成的核苷酸序列;(f)与(a)-(e)任一所述的核苷酸序列互补的核苷酸序列。本发明的第三方面,提供了一种载体,所述的载体含有本发明的第二方面所述的多核苷酸。在另一优选例中,所述载体包括表达载体、穿梭载体、整合载体。本发明的第四方面,提供了本发明的第一方面所述分离的多肽的用途,它被用于催化以下反应,或被用于制备催化以下反应的催化制剂:(i)将来自糖基供体的糖基转移到四环三萜类化合物的c-3位羟基上。在另一优选例中,所述的糖基供体包括选自下组的核苷二磷酸糖:udp-葡萄糖,adp-葡萄糖,tdp-葡萄糖,cdp-葡萄糖,gdp-葡萄糖,udp-乙酰基葡萄糖,adp-乙酰基葡萄糖,tdp-乙酰基葡萄糖,cdp-乙酰基葡萄糖,gdp-乙酰基葡萄糖,udp-木糖,adp-木糖,tdp-木糖,cdp-木糖,gdp-木糖,udp-木糖,udp-半乳糖醛酸,adp-半乳糖醛酸,tdp-半乳糖醛酸,cdp-半乳糖醛酸,gdp-半乳糖醛酸,udp-半乳糖,adp-半乳糖,tdp-半乳糖,cdp-半乳糖,gdp-半乳糖,udp-阿拉伯糖,adp-阿拉伯糖,tdp-阿拉伯糖,cdp-阿拉伯糖,gdp-阿拉伯糖,udp-鼠李糖,adp-鼠李糖,tdp-鼠李糖,cdp-鼠李糖,gdp-鼠李糖,或其他核苷二磷酸己糖或核苷二磷酸戊糖,或其组合。在另一优选例中,所述的糖基供体包括选自下组的尿苷二磷酸(udp)糖:udp-葡萄糖,udp-木糖,udp-半乳糖醛酸,udp-半乳糖,udp-阿拉伯糖,udp-鼠李糖,或其他尿苷二磷酸己糖或尿苷二磷酸戊糖,或其组合。在另一优选例中,所述分离的多肽用于催化下述反应或被用于制备催化下述反应的催化制剂:其中,r1为h或者oh;r2为h或者oh;r3为h或者糖基;r4为糖基。在另一优选例中,所述分离的多肽用于催化下述反应或被用于制备催化下述反应的催化制剂:所述的多肽选自seqidno.:4或seqidno.:21所示的多肽或其衍生多肽。在另一优选例中,所述的糖基选自:葡萄糖基、半乳糖醛酸基、木糖糖基,半乳糖基、阿拉伯糖基、鼠李糖基,以及其他己糖基或戊糖基。在另一优选例中,所述反应(a)和或(b)的反应产物包括(但不限于):s构型或r构型的达玛烷型四环三萜类化合物、羊毛脂烷型四环三萜类化合物、apotirucallane型四环三萜、甘遂烷型四环三萜类化合物、环阿屯烷(环阿尔廷烷)型四环三萜类化合物、葫芦烷四环三萜类化合物、或楝烷型四环三萜类化合物。本发明的第五方面,提供了一种体外糖基化方法,包括步骤:在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的c-3位羟基上;从而形成糖基化的四环三萜类化合物;其中,所述的糖基转移酶为本发明的第一方面所述的多肽或其衍生多肽。在另一优选例中,所述的衍生多肽选自:将seqidno.:4或seqidno.:21所示氨基酸序列的多肽经过一个或几个氨基酸残基的取代、缺失或添加而形成的、或是添加信号肽序列后形成的、并具有糖基转移酶活性的衍生多肽;或氨基酸序列与seqidno.:4或seqidno.:21氨基酸序列的同源性≥85%(较佳地≥90%、91%、92%、93%、94%、95%、96%、97%、98%、99%),并具有糖基转移酶活性的衍生多肽;其中,所述糖基转移酶活性指能将糖基供体的糖基转移到四环三萜类化合物的c-3位羟基上的活性。本发明的第六方面,提供了一种进行糖基催化反应的方法,包括步骤:在本发明的第一方面所述的多肽或其衍生多肽存在的条件下,进行糖基催化反应。在另一优选例中,所述的方法还包括步骤:在糖基供体以及本发明的第一方面所述多肽或其衍生多肽的存在下,将式(i)化合物转化为所述式(ii)化合物。在另一优选例中,所述式(i)化合物为原人参二醇ppd,并且式(ii)化合物为人参皂苷rh2;或所述式(i)化合物为compoundk,并且式(ii)化合物为人参皂苷f2。在另一优选例中,所述的方法还包括将所述的多肽及其衍生多肽分别加入催化反应;和/或将所述的多肽及其衍生多肽同时加入催化反应。在另一优选例中,所述的方法还包括将编码糖基转移酶的核苷酸序列与达玛稀二醇和/或原人参二醇合成代谢途径中的关键基因和/或其他糖基转移酶基因在宿主细胞中共表达,从而获得所述的式(ii)化合物。在另一优选例中,所述式(ii)化合物为人参皂苷rh2或人参皂苷f2。在另一优选例中,所述的宿主细胞为酵母菌或大肠杆菌。在另一优选例中,所述方法还包括:向反应体系中提供用于调节酶活性的添加物。在另一优选例中,所述的用于调节酶活性的添加物是:提高酶活性或抑制酶活性的添加物。在另一优选例中,所述的用于调节酶活性的添加物选自下组:ca2+、co2+、mn2+、ba2+、al3+、ni2+、zn2+、或fe2+。在另一优选例中,所述的用于调节酶活性的添加物是:可以生成ca2+、co2+、mn2+、ba2+、al3+、ni2+、zn2+、或fe2+的物质。在另一优选例中,所述的糖基供体是核苷二磷酸糖,选自下组:udp-葡萄糖,adp-葡萄糖,tdp-葡萄糖,cdp-葡萄糖,gdp-葡萄糖,udp-乙酰基葡萄糖,adp-乙酰基葡萄糖,tdp-乙酰基葡萄糖,cdp-乙酰基葡萄糖,gdp-乙酰基葡萄糖,udp-木糖,adp-木糖,tdp-木糖,cdp-木糖,gdp-木糖,udp-木糖,udp-半乳糖醛酸,adp-半乳糖醛酸,tdp-半乳糖醛酸,cdp-半乳糖醛酸,gdp-半乳糖醛酸,udp-半乳糖,adp-半乳糖,tdp-半乳糖,cdp-半乳糖,gdp-半乳糖,udp-阿拉伯糖,adp-阿拉伯糖,tdp-阿拉伯糖,cdp-阿拉伯糖,gdp-阿拉伯糖,udp-鼠李糖,adp-鼠李糖,tdp-鼠李糖,cdp-鼠李糖,gdp-鼠李糖,或其他核苷二磷酸己糖或核苷二磷酸戊糖,或其组合。在另一优选例中,所述的糖基供体是尿苷二磷酸糖,选自下组:udp-葡萄糖,udp-木糖,udp-半乳糖醛酸,udp-半乳糖,udp-阿拉伯糖,udp-鼠李糖,或其他尿苷二磷酸己糖或尿苷二磷酸戊糖,或其组合。在另一优选例中,反应体系的ph为:ph4.0-10.0,优选ph为5.5-9.0。在另一优选例中,反应体系的温度为:10℃-105℃,优选20℃-50℃。在另一优选例中,所述的达玛稀二醇合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因。在另一优选例中,所述的原人参二醇合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、原人参二醇合成的细胞色素p450基因cyp716a47和其的还原酶基因,或其组合。在另一优选例中,所述糖基催化反应的底物为式(i)化合物,且所述的产物为式(ii)化合物。在另一优选例中,所述式(i)化合物为原人参二醇ppd,并且式(ii)化合物为人参皂苷rh2;或所述式(i)化合物为compoundk,并且式(ii)化合物为人参皂苷f2。本发明的第七方面,提供了一种遗传工程化的宿主细胞,所述的宿主细胞含有本发明的第三方面所述的载体,或其基因组中整合有本发明的第二方面所述的多核苷酸。在另一优选例中,所述的糖基转移酶为本发明的第一方面所述的多肽或其衍生多肽。在另一优选例中,编码所述糖基转移酶的核苷酸序列如本发明的第二方面所述。在另一优选例中,所述的细胞为原核细胞或真核细胞。在另一优选例中,所述的宿主细胞为真核细胞,如酵母细胞或植物细胞。在另一优选例中,所述的宿主细胞为酿酒酵母细胞。在另一优选例中,所述的宿主细胞原核细胞,如大肠杆菌。在另一优选例中,所述的宿主细胞为人参细胞。在另一优选例中,所述的宿主细胞不是天然产生式(ii)化合物的细胞。在另一优选例中,所述的宿主细胞不是天然产生人参皂苷rh2或人参皂苷f2的细胞。在另一优选例中,所述的达玛稀二醇合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因。在另一优选例中,所述的宿主细胞含有原人参二醇合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、原人参二醇合成的细胞色素p450基因cyp716a47及其还原酶基因,或其组合。本发明的第八方面,提供了本发明的第七方面所述的宿主细胞的用途,用于制备酶催化试剂,或生产糖基转移酶、或作为催化细胞、或产生糖基化的四环三萜类化合物。在另一优选例中,所述四环三萜类化合物为式(ii)化合物。在另一优选例中,所述的宿主细胞用于通过对式(i)化合物的糖基化反应,生产式(ii)化合物。在另一优选例中,所述的宿主细胞用于通过对原人参二醇ppd和/或compoundk的糖基化反应,生产人参皂苷rh2和/或人参皂苷f2。本发明的第九方面,提供了一种产生转基因植物的方法,包括步骤:将本发明的第七方面所述的遗传工程化的宿主细胞再生为植物,并且所述的遗传工程化的宿主细胞为植物细胞。在另一优选例中,所述的遗传工程化的宿主细胞选自:人参细胞、花旗参细胞、三七细胞、烟草细胞。应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。附图说明图1糖基转移酶基因pn50琼脂糖凝胶电泳图。图2糖基转移酶基因pn50催化人参皂苷tlc分析图。图3为利用pn50构建重组酿酒酵母菌株产稀有人参皂苷rh2的hplc分析图。具体实施方式本发明人经过广泛而深入的研究,首次提供三七糖基转移酶pn50(seqidno.:4)和人参来源的糖基转移酶ugtpg45的突变体8e7(seqidno.:21)在萜类化合物糖基化催化及新皂苷合成中的应用。具体地,本发明的糖基转移酶能特异和高效地催化四环三萜化合物底物)的和/或将来自糖基供体的糖基转移到四环三萜类化合物的c-3位羟基上。特别是能够高效将原人参二醇ppd转化为具有抗肿瘤活性的稀有人参皂苷rh2,将稀有人参皂苷compoundk(在ppd的c20位具有一个糖基修饰)转化为产物人参皂苷f2。意外地,向产原人参二醇的酿酒酵母菌株中导入三七来源的糖基转移酶基因pn50所构建的重组酿酒酵母菌株zwby04rs-pn50能合成稀有人参皂苷rh2,并且与导入野生型人参来源的糖基转移酶基因ugtpg45的菌株zwby04rs-ugtpg45相比,菌株zwby04rs-pn50人参皂苷rh2的产量提高28%(45.55/35.66-1=28%);利用随机突变对ugtpg45进行改造获得的突变体基因8e7所构建的人工合成稀有人参皂苷rh2菌株zwby04rs-8e7,其rh2产量相比于利用ugtpg45所构建菌株zwby04rs-ugtpg45产量提升了70%(60.48/35.66-1=70%)。本发明还提供了转化和催化方法。本发明的糖基转移酶还可与达玛烯二醇和/或原人参二醇合成代谢途径中的关键酶(例如达玛烯二醇合成酶基因pgdds、原人参二醇合成的细胞色素p450基因cyp716a47及其还原酶基因pgcpr1)在宿主细胞中共表达,或者应用于制备人参皂苷rh2的遗传工程细胞中,应用于构建人工合成稀有人参皂苷rh2的菌株。此外,本发明的糖基转移酶还可与达玛烯二醇和/或原人参二醇合成代谢途径中的关键酶在宿主细胞中共表达,应用于构建人工合成稀有人参皂苷rh2的菌株。在此基础上完成了本发明。定义如本文所用,术语“活性多肽”、“本发明的多肽及其衍生多肽”、“本发明的酶”、“糖基转移酶”或“本发明的糖基转移酶”可互换使用,并具有本领域普通技术人员通常理解的含义。本发明糖基转移酶具有将将糖基供体的糖基转移到四环三萜类化合物的c-3位羟基上的活性。在本发明的一个优选例中,本发明糖基转移酶的氨基酸序列在对应于seqidno:19所示氨基酸序列的第222位的氨基酸残基为非gln和/或在对应于seqidno:19所示氨基酸序列第322位的氨基酸残基为非ala。在本发明的一个优选例中,本发明糖基转移酶:i).具有如seqidno:19所示氨基酸序列且第222位的氨基酸残基为非gln和/或第322位的氨基酸残基为非ala,或ii).具有i)所限定的序列经过一个或几个氨基酸残基,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有i)所限定的分离的多肽功能的由i)衍生的分离的多肽。在本发明的一个优选例中,本发明糖基转移酶具有i)所限定的序列经过一个或几个氨基酸残基,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的添加而形成的序列,且基本具有i)所限定的分离的多肽功能的由i)衍生的分离的多肽。在本发明的一个优选例中,本发明糖基转移酶的氨基酸序列在对应于seqidno:19所示氨基酸序列的第222位的氨基酸残基选自以下氨基酸的至少一种:his、asn、gln、lys和arg。在本发明的一个优选例中,本发明糖基转移酶的氨基酸序列在对应于seqidno:19所示氨基酸序列的第222位的氨基酸残基为his。在本发明的一个优选例中,本发明糖基转移酶的氨基酸序列在对应于seqidno:19所示氨基酸序列的第322位的氨基酸残基选自以下氨基酸的至少一种:val、ile、leu、met和phe。在本发明的一个优选例中,本发明糖基转移酶的氨基酸序列在对应于seqidno:19所示氨基酸序列的第322位的氨基酸残基为val。在本发明的一个优选例中,本发明糖基转移酶的氨基酸序列在对应于seqidno:19所示氨基酸序列的第222位的氨基酸残基为his,在对应于seqidno:19所示氨基酸序列第322位的氨基酸残基为val。在本发明的一个优选例中,本发明糖基转移酶选自下组:(a)具有seqidno.:4或seqidno.:21所示氨基酸序列的多肽;(b)将seqidno.:4或seqidno.:21所示氨基酸序列的多肽经过一个或几个氨基酸残基,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的、或是添加信号肽序列后形成的、并具有糖基转移酶活性的衍生多肽;(c)序列中含有(a)或(b)中所述多肽序列的衍生多肽;(d)氨基酸序列与seqidno.:4或seqidno.:21所示氨基酸序列的同源性≥85%(较佳地≥90%、91%、92%、93%、94%、95%、96%、97%、98%或99%),并具有糖基转移酶活性的衍生多肽。在具体的实施方式中,本发明糖基转移酶活性指能将糖基供体的糖基转移到四环三萜类化合物的c-3位羟基上的活性。在本发明的一个优选例中,从三七中克隆的一个新的糖基转移酶基因pn50,利用这个新的糖基转移酶可以催化多种达玛烷型人参皂苷c3位糖基化。通过对三七转录组数据进行分析,从中拼接到一个全长的糖基转移酶基因序列,并命名为pn50。将其克隆到克隆载体pmdt-18t上,然后设计表达引物构建到大肠杆菌表达载体pet28a上,使其在大肠杆菌中诱导表达。所获得的蛋白能催化原人二醇和compoundk的c3位羟基糖基化。所述三七糖基转移酶基因pn50替换人参来源的ugtpg45可以大幅提升rh2产量(提高28%)。在本发明的另一个优选例中,提供了一种糖基转移酶突变体蛋白8e7。所述糖基转移酶突变体蛋白为人参来源的野生型基因ugtpg45的突变体蛋白,所述突变糖基转移酶基因8e7替换人参来源的野生型基因ugtpg45可以大幅提升rh2产量(提高70%)。本领域普通技术人员不难知晓,在多肽的某些区域,例如非重要区域改变少数氨基酸残基基本上不会改变生物活性,例如,适当替换某些氨基酸得到的序列并不会影响其活性(可参见watson等,molecularbiologyofthegene,第四版,1987,thebenjamin/cummingspub.co.p224)。因此,本领域普通技术人员能够实施这种替换并且确保所得分子仍具有所需生物活性。因此,本发明的多肽可以在对应于seqidno:19所示氨基酸序列的第222位的氨基酸残基为非gln和/或在对应于seqidno:19所示氨基酸序列第322位的氨基酸残基为非ala的基础上作进一步突变而仍具备本发明糖基转移酶的功能和活性。例如本发明的糖基转移酶(a)其氨基酸序列如seqidno:21所示;或(b)包含(a)所限定的序列经过一个或多个氨基酸残基,优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的序列,且基本具有(a)所限定的多肽功能的由(a)衍生的多肽。在本发明中,本发明的糖基转移酶包括与氨基酸序列如seqidno:21所示的糖基转移酶相比,有至多20个、较佳地至多10个,再佳地至多3个,更佳地至多2个,最佳地至多1个氨基酸被性质相似或相近的氨基酸所替换而形成的突变体。这些保守性变异的突变体可根据,例如下表所示进行氨基酸替换而产生。初始残基代表性的取代残基优选的取代残基ala(a)val;leu;ilevalarg(r)lys;gln;asnlysasn(n)gln;his;lys;argglnasp(d)gluglucys(c)sersergln(q)asnasnglu(e)aspaspgly(g)pro;alaalahis(h)asn;gln;lys;argargile(i)leu;val;met;ala;pheleuleu(l)ile;val;met;ala;pheilelys(k)arg;gln;asnargmet(m)leu;phe;ileleuphe(f)leu;val;ile;ala;tyrleupro(p)alaalaser(s)thrthrthr(t)sersertrp(w)tyr;phetyrtyr(y)trp;phe;thr;serpheval(v)ile;leu;met;phe;alaleu本发明还提供了编码本发明多肽的多核苷酸。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。因此,本文所用的“含有”,“具有”或“包括”包括了“包含”、“主要由……构成”、“基本上由……构成”、和“由……构成”;“主要由……构成”、“基本上由……构成”和“由……构成”属于“含有”、“具有”或“包括”的下位概念。对应于seqidno:19所示氨基酸序列的第222位/322位的氨基酸残基本领域普通技术人员均知道,可在某个蛋白的氨基酸序列中对一些氨基酸残基作出各种突变,例如取代、添加或缺失,但得到的突变体仍能具备原蛋白的功能或活性。因此,本领域普通技术人员可对本发明具体公开的氨基酸序列作出一定改变而得到仍具有所需活性的突变体,那么这种突变体中与seqidno:19所示氨基酸序列的第222位/322位的氨基酸残基相对应的氨基酸残基可能就不是第222位/322位,但如此得到的突变体仍应落在本发明的保护范围内。本文所用的术语“对应于”具有本领域普通技术人员通常理解的意义。具体地说,“对应于”表示两条序列经同源性或序列相同性比对后,一条序列与另一条序列中的指定位置相对应的位置。因此,就“对应于seqidno:19所示氨基酸序列的第222位/322位的氨基酸残基”而言,如果在seqidno:19所示氨基酸序列的一端加上6-his标签,那么所得突变体中对应于seqidno:19所示氨基酸序列的第222位/322位就可能是第228位/328位;而如果删除seqidno:19所示氨基酸序列中的少数氨基酸残基,那么所得突变体中对应于seqidno:19所示氨基酸序列的第222位/322位就可能是第220位/320位,等等。再例如,如果一条具有400个氨基酸残基的序列与seqidno:19所示氨基酸序列的第20-420位具有较高的同源性或序列相同性,那么所得突变体中对应于seqidno:19所示氨基酸序列的第222位/322位就可能是第202位/302位。在具体的实施方式中,所述同源性或序列相同性可以是80%以上,优选90%以上,更优选95%-98%,最优选99%以上。本领域普通技术人员公知的测定序列同源性或相同性的方法包括但不限于:计算机分子生物学(computationalmolecularbiology),lesk,a.m.编,牛津大学出版社,纽约,1988;生物计算:信息学和基因组项目(biocomputing:informaticsandgenomeprojects),smith,d.w.编,学术出版社,纽约,1993;序列数据的计算机分析(computeranalysisofsequencedata),第一部分,griffin,a.m.和griffin,h.g.编,humanapress,新泽西,1994;分子生物学中的序列分析(sequenceanalysisinmolecularbiology),vonheinje,g.,学术出版社,1987和序列分析引物(sequenceanalysisprimer),gribskov,m.与devereux,j.编mstocktonpress,纽约,1991和carillo,h.与lipman,d.,siamj.appliedmath.,48:1073(1988)。测定相同性的优选方法要在测试的序列之间得到最大的匹配。测定相同性的方法编译在公众可获得的计算机程序中。优选的测定两条序列之间相同性的计算机程序方法包括但不限于:gcg程序包(devereux,j.等,1984)、blastp、blastn和fasta(altschul,s,f.等,1990)。公众可从ncbi和其它来源得到blastx程序(blast手册,altschul,s.等,ncbinlmnihbethesda,md.20894;altschul,s.等,1990)。熟知的smithwaterman算法也可用于测定相同性。如非特别说明,本文所说的人参皂苷和皂苷元,是的c20位s和/或r构型的人参皂苷和皂苷元。如本文所用,“分离的多肽”是指所述多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化所述多肽。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。所述多肽的纯度还可以用氨基酸序列进行进一步分析。本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、植物)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。本发明还包括所述多肽的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持所述多肽相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或与抗原igg片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。在本发明的活性多肽具有糖基转移酶活性,并且能够催化以下一种或多种反应:所述的多肽序列为seqidno.:4、seqidno.:21或其衍生多肽,该术语还包括具有与所示多肽具有相同功能的seqidno.:4、seqidno.:21序列的变异形式。这些变异形式包括(但并不限于):一个或多个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在c末端和/或n末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在c末端和/或n末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括本发明蛋白的活性片段和活性衍生物。本发明还提供所述多肽的类似物。这些类似物与天然多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然l-氨基酸的残基(如d-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白酶水解性能或优化了溶解性能的多肽。本发明的pn50、8e7多肽或其衍生多肽的氨基端或羧基端还可含有一个或多个多肽片段,作为蛋白标签。任何合适的标签都可以用于本发明。例如,所述的标签可以是flag、ha、ha1、c-myc、poly–his、poly-arg、strep-tagii、au1、ee、t7、4a6、ε、b、ge、以及ty1。这些标签可用于对蛋白进行纯化。表1列出了其中的一些标签及其序列。表1标签残基数序列poly-arg5-6个(通常5个)rrrrrpoly-his2-10个(通常6个)hhhhhhflag8个dykddddkstrep-tagii8个wshpqfekc-myc10个wqkliseedlgst220个后面6个lvprgs为了使翻译的蛋白分泌表达(如分泌到细胞外),还可在所述pn50、8e7多肽或其衍生多肽的氨基酸氨基末端添加上信号肽序列,如pelb信号肽等。信号肽在多肽从细胞内分泌出来的过程中可被切去。本发明的多核苷酸可以是dna形式或rna形式。dna形式包括cdna、基因组dna或人工合成的dna。dna可以是单链的或是双链的。dna可以是编码链或非编码链。编码成熟多肽的编码区序列可以与seqidno.:3或seqidno.:22所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有seqidno.:4或seqidno.:21所示氨基酸序列的多肽、或其衍生多肽,但与seqidno.:4或seqidno.:21或其衍生多肽的编码序列,优选为seqidno.:3或seqidno.:22所示的序列有差别的核酸序列。编码seqidno.:4或seqidno.:21所示多肽或其衍生多肽的成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件(或严紧条件)下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×ssc,0.1%sds,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与seqidno.:4或者seqidno.:21所示的成熟多肽有相同的生物学功能和活性。本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如pcr)以确定和/或分离编码pn50、8e7多肽或其衍生多肽的多聚核苷酸。本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。本发明的pn50、8e7多肽或其衍生多肽核苷酸全长序列或其片段通常可以用pcr扩增法、重组法或人工合成的方法获得。对于pcr扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cdna库或按本领域技术人员已知的常规方法所制备的cdna库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次pcr扩增,然后再将各次扩增出的片段按正确次序拼接在一起。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的dna序列。然后可将该dna序列引入本领域中已知的各种现有的dna分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。应用pcr技术扩增dna/rna的方法被优选用于获得本发明的基因。特别是很难从文库中得到全长的cdna时,可优选使用race法(race-cdna末端快速扩增法),用于pcr的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的dna/rna片段。本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或pn50、8e7多肽或其衍生多肽的编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。通过常规的重组dna技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的pn50、8e7多肽或其衍生多肽。一般来说有以下步骤:(1)用本发明的编码pn50、8e7多肽或其衍生多肽的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;(2)在合适的培养基中培养的宿主细胞;(3)从培养基或细胞中分离、纯化蛋白质。本发明中,编码pn50、8e7多肽或其衍生多肽的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。本领域的技术人员熟知的方法能用于构建含pn50、8e7多肽或其衍生多肽的编码dna序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组dna技术、dna合成技术、体内重组技术等。所述的dna序列可有效连接到表达载体中的适当启动子上,以指导mrna合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体pl启动子;真核启动子包括cmv立即早期启动子、hsv胸苷激酶启动子、早期和晚期sv40启动子、反转录病毒的ltrs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(gfp),或用于大肠杆菌的四环素或氨苄青霉素抗性。包含上述的适当dna序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇s2或sf9的昆虫细胞;cho、cos、293细胞、或bowes黑素瘤细胞的动物细胞等。本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是dna的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的sv40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。用重组dna转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收dna的感受态细胞可在指数生长期后收获,用cacl2法处理,所用的步骤在本领域众所周知。另一种方法是使用mgcl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的dna转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(hplc)和其它各种液相层析技术及这些方法的结合。应用本发明涉及的活性多肽或糖基转移酶pn50、8e7多肽或其衍生多肽的用途包括(但不限于):特异和高效地将来自糖基供体的糖基转移到四环三萜类化合物的c-3位羟基上。特别是能够将式(i)化合物转化为所述式(ii)化合物,例如将原人参二醇ppd转化为抗肿瘤活性更优良的稀有人参皂苷rh2;将compoundk转化为人参皂苷f2。所述的四环三萜化合物包括(但不限于):s构型或r构型的达玛烷型、羊毛脂烷型、甘遂烷型、环阿屯烷(环阿尔廷烷)型、apotirucallane型、葫芦烷、楝烷型等四环三萜类化合物。本发明提供了一种工业催化方法,包括:在提供糖基供体的条件下,用本发明的pn50、8e7多肽或其衍生多肽,获得人参皂苷rh2和人参皂苷f2。具体是,所述的(a)反应中所用的多肽选自seqidno.:4或seqidno.:21所示多肽或其衍生多肽;所述(b)反应中所用的多肽为seqidno.:4所示多肽或其衍生多肽。在本发明的一个优选例中,提供了一种利用前述三七的糖基转移酶pn50和糖基转移酶突变体蛋白8e7在酿酒酵母中合成人参皂苷rh2的方法。所述的糖基供体是核苷二磷酸糖,选自下组:udp-葡萄糖,adp-葡萄糖,tdp-葡萄糖,cdp-葡萄糖,gdp-葡萄糖,udp-乙酰基葡萄糖,adp-乙酰基葡萄糖,tdp-乙酰基葡萄糖,cdp-乙酰基葡萄糖,gdp-乙酰基葡萄糖,udp-木糖,adp-木糖,tdp-木糖,cdp-木糖,udp-木糖,gdp-木糖,udp-半乳糖醛酸,adp-半乳糖醛酸,tdp-半乳糖醛酸,cdp-半乳糖醛酸,gdp-半乳糖醛酸,udp-半乳糖,adp-半乳糖,tdp-半乳糖,cdp-半乳糖,gdp-半乳糖,udp-阿拉伯糖,adp-阿拉伯糖,tdp-阿拉伯糖,cdp-阿拉伯糖,gdp-阿拉伯糖,udp-鼠李糖,adp-鼠李糖,tdp-鼠李糖,cdp-鼠李糖,gdp-鼠李糖,或其他核苷二磷酸己糖或核苷二磷酸戊糖,或其组合。所述的糖基供体优选是尿苷二磷酸糖,选自下组:udp-葡萄糖,udp-木糖,udp-鼠李糖,udp-半乳糖醛酸,udp-半乳糖,udp-阿拉伯糖,或其他尿苷二磷酸己糖或尿苷二磷酸戊糖,或其组合。在所述方法中,还可以添加酶活性添加物(提高酶活性或抑制酶活性的添加物)。所述酶活性的添加物可以选自下组:ca2+、co2+、mn2+、ba2+、al3+、ni2+、zn2+、或fe2+;或为可以生成ca2+、co2+、mn2+、ba2+、al3+、ni2+、zn2+、或fe2+的物质。所述方法的ph条件为:ph4.0-10.0,优选ph6.0-ph8.5,更优选8.5。所述方法的温度条件为:10℃-105℃,优选25℃-35℃,更优选35℃。本发明还提供了一种组合物,它含有有效量的本发明的活性多肽或糖基转移酶pn50、8e7多肽或其衍生多肽,以及食品学上或工业上可接受的载体或赋形剂。这类载体包括(但并不限于):水、缓冲液、葡萄糖、水、甘油、乙醇、及其组合。所述的组合物中还可添加调节本发明糖基转移酶活性的物质。任何具有提高酶活性功能的物质均是可用的。较佳地,所述的提高本发明的糖基转移酶活性的物质选自巯基乙醇。此外,很多物质可以降低酶活性,包括但不限于:ca2+、co2+、mn2+、ba2+、al3+、ni2+、zn2+和fe2+;或在添加至底物后可水解形成ca2+、co2+、mn2+、ba2+、al3+、ni2+、zn2+和fe2+的物质。在获得了本发明的pn50、8e7多肽或其衍生多肽后,本领域人员可以方便地应用该酶来发挥转糖基的作用,特别是对达玛稀二醇、原人参二醇的转糖基作用。作为本发明的优选方式,还提供了二种形成稀有人参皂苷的方法,该方法之一包含:用本发明所述的pn50、8e7多肽或其衍生多肽处理待转糖基的底物,所述的底物包括达玛稀二醇、原人参二醇及其衍生物等四环三萜类化合物。较佳地,在ph3.5-10条件下,用所述的pn50、8e7多肽或其衍生多肽酶处理待转糖基的底物。较佳地,在温度30-105℃条件下,用所述的pn50、8e7多肽或其衍生多肽酶处理待转糖基的底物。该方法之二包含:将本发明所述的pn50、8e7多肽或其衍生多肽基因转入可以合成原人参二醇ppd的工程菌(例如,酵母或大肠杆菌工程菌)中,或者,将pn50、8e7多肽或其衍生多肽基因与达玛稀二醇、原人参二醇ppd合成代谢途径中的关键基因和任选地其他糖基转移酶基因于宿主细胞(例如酵母细胞或大肠杆菌)中共表达,获得直接生产稀有人参皂苷rh2和/或人参皂苷f2的重组菌。或者,将pn50、8e7多肽或其衍生多肽的编码核苷酸序列与达玛烯二醇和/或原人参二醇ppd合成代谢途径中的关键酶和任选地其他糖基转移酶以及合成udp-鼠李糖的关键酶在宿主细胞中共表达,应用于构建人工合成稀有人参皂苷rh2和人参皂苷f2的重组菌株。所述的达玛稀二醇合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因。在另一优选例中,所述的原人参二醇合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因pgdds、原人参二醇合成的细胞色素p450基因cyp716a47及其还原酶基因,或其组合。或者以上各种酶的同功酶及其组合。其中,达玛烯二醇合成酶将环氧角鲨烯(酿酒酵母自身合成)转化为达玛烯二醇,细胞色素p450cyp716a47及其还原酶再将达玛烯二醇转化为原人参二醇ppd。(hanet.al,plant&cellphysiology,2011,52.2062-73)本发明的主要优点:(1)本发明利用酿酒酵母生产人参皂苷rh2的方法相比于传统的依赖于人参属植物提取和糖基水解的方法具有成本低、周期短、质量稳定等优点;(2)本发明首次从三七中获得的糖基转移酶pn50可以催化ppd和rh2,催化ck合成f2,并且将其导入产ppd菌株中相比于人参中野生型糖基转移酶ugtpg45可以更高效的合成稀有人参皂苷rh2;(3)本发明通过对人参中野生型糖基转移酶ugtpg45随机突变获得突变体基因8e7,将其导入产ppd菌株中相比于人参中野生型糖基转移酶ugtpg45可以显著提高稀有人参皂苷rh2合成效率。下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如sambrook等人,分子克隆:实验室手册(newyork:coldspringharborlaboratorypress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。通过以下具体实施方法,可以进一步理解本发明的具体实施过程。实施例1.三七糖基转移酶基因pn50的克隆合成如序列pn50克隆引物f,seqidno:1(atggagagagaaatgttgagca)及pn50克隆引物r,seqidno:2(tcaggaggaaacaagctttgaa)的两条引物。以从三七中提取的rna反转录获得的cdna为模板,利用如上引物进行pcr。dna聚合酶选用宝生物工程有限公司的高保真的koddna聚合酶。pcr扩增程序为:94℃2min;94℃15s,58℃30s,68℃2min,共35个循环;68℃10min降至10℃。pcr产物经琼脂糖凝胶电泳检测,结果见图1。在紫外下照射,切下目标dna条带。然后采用axygengelextractionkit(aeygen公司)从琼脂糖凝胶中回收dna即为扩增出的糖基转移酶基因的dna片段。利用宝生物工程(大连)有限公司(takara)的pmd18-t克隆试剂盒,将回收的pcr产物克隆到pmdt载体,所构建的载体命名为pmdt-pn50。经测序获得pn50的基因序列。pn50基因具有seqidno:3的核苷酸序列。自seqidno:3的5’端第1-1368位核苷酸为pn50的开放阅读框(openreadingframe,orf),自seqidno:3的5’端的第1-3位核苷酸为pn50基因的起始密码子atg,自seqidno:3的5’端的第1366-1368位核苷酸为pn50基因的终止密码子tga。糖基转移酶pn50基因编码一个含有455个氨基酸的蛋白质pn50,具有seqidno:4的氨基酸残基序列,用软件预测到该蛋白质的理论分子量大小为51.1kda,等电点pi为5.10。自seqidno:4的氨基端的第332-375位氨基酸为糖基转移酶pspg保守功能域。pn50核苷酸序列seqidno:3atggagagagaaatgttgagcaaaactcacattatgttcatcccattcccagctcaaggccacatgagcccaatgatgcaattcgtcaagcgtttagcctggaaaggcgtgcgaatcacgatagttcttccggctgagattcgagattctatgcaaataaacaactcattgatcaacactgagtgcatctcctttgattttgataaagatgatgagatgccatacagcatgcgggcttatatgggagttgtaaagctcaaggtcacaaataaactgagtgacctactcgagaagcaaaaaacaaatggctaccctgttaatttgctagtggtcgattcattatatccatctcgggtagaaatgtgccaccaacttggggtaaaaggagctccatttttcactcactcttgtgctgttggtgccatttattataatgctcgcttagggaaattgaagatacctcctgaggaagggttgacttctgtttcattgccttcaattccattgttggggagaaatgatttgccaattattaggactggcacctttcctgatctctttgagcatttggggaatcagttttcagatcttgataaagcggattggatctttttcaatacttttgataagcttgaaaatgaggaagcaaaatggctatctagccaatggccaattacatccatcggaccattaatcccttcaatgtacttagacaaacaattaccaaatgacaaagacaatgacattaatttctacaaggcagacgtcggatcgtgcatcaagtggctagacgccaaagaccctggctcggtagtctacgcctcattcgggagcgtgaagcacaacctcggcgatgactacatggacgaagtagcatggggcttgttacacagcaaatatcacttcatatgggttgttatagaatccgaacgtacaaagctctctagcgatttcttggcagaggcagaggaaaaaggcctaatagtgagttggtgccctcaactcgaagttttgtcacataaatctataggtagttttatgactcattgtggttggaactcgacggttgaggcattgagtttgggcgtgccaatggtggcagtgccacaacagtttgatcagcctgttaatgccaagtatatcgtggatgtatggcgaattggggttcaggttccgattggtgaaaatggggttcttttgaggggagaagttgctaactgtataaaggatgttatggagggggaaataggggatgagcttagagggaatgctttgaaatggaaggggttggctgtggaggcaatggagaaagggggtagctctgataagaatattgatgagttcatttcaaagcttgtttcctcctgapn50氨基酸序列seqidno:4meremlskthimfipfpaqghmspmmqfvkrlawkgvritivlpaeirdsmqinnslintecisfdfdkddempysmraymgvvklkvtnklsdllekqktngypvnllvvdslypsrvemchqlgvkgapffthscavgaiyynarlgklkippeegltsvslpsipllgrndlpiirtgtfpdlfehlgnqfsdldkadwiffntfdkleneeakwlssqwpitsigplipsmyldkqlpndkdndinfykadvgscikwldakdpgsvvyasfgsvkhnlgddymdevawgllhskyhfiwvviesertklssdflaeaeekglivswcpqlevlshksigsfmthcgwnstvealslgvpmvavpqqfdqpvnakyivdvwrigvqvpigengvllrgevancikdvmegeigdelrgnalkwkglaveamekggssdknidefisklvss实施例2.三七糖基转移酶基因pn50的在大肠杆菌中表达合成如序列pn50表达引物fseqidno:5(ggatccatggagagagaaatgttgagca)及pn50表达引物rseqidno:6(ctcgagtcaggaggaaacaagctttgaa)的两条引物。在合成的引物f/r上分别加bamhi和xhoi两个酶切位点,以从植物中提取的cdna为模板进行pcr。dna聚合酶选用宝生物工程有限公司的高保真的koddna聚合酶。pcr扩增程序为:94℃2min;94℃15s,58℃30s,68℃2min,共35个循环;68℃10min降至10℃。pcr产物经琼脂糖凝胶电泳检测。在紫外下照射,切下目标dna条带。然后采用axygengelextractionkit(aeygen公司)从琼脂糖凝胶中回收dna即为扩增出的糖基转移酶基因的dna片段。将回收的两个pcr产物用bamhi和xhoi酶切后与分别与同样用bamhi和xhoi酶切后的pet28a连接,连接产物转化大肠杆菌epi300感受态细胞,将转化后的大肠杆菌菌液涂布在添加50ug/ml卡那霉素的lb平板上,并进一步通过pcr和酶切验证重组克隆。各选取其中一个克隆提取重组质粒后进行测序验证,测序验证正确后将重组质粒转化大肠杆菌bl21(de3)中诱导表达,诱导表达方法为:从平板挑取单克隆接种至含有50ug/ml卡那霉素的lb试管中过夜,取1%接种至50ml三角瓶中37℃震荡培养至od600为0.6-0.7加入终浓度为0.1mm的iptg诱导,在18℃下诱导16h。12000g,3min收集菌体每克湿重菌体加入10mlpbsbuffer重悬后裂解菌体,离心取上清做为粗酶液。实施例3.三七糖基转移酶基因pn50催化不同底物反应及其产物检测配置糖基转移酶pn50催化反应体系(100μl)如下:在37℃水浴下反应2h。反应结束后加入等体积的正丁醇抽提,取正丁醇相,经真空浓缩后,反应产物溶解于10μl甲醇中,结果用tlc或hplc检测。从图2中结果可以看出本发明中使用的糖基转移酶pn50可以催化原人参二醇ppd形成一种新的产物(反应见式a),其在tlc板上的迁移位置和rh2的迁移位置一致,证明此种新的产物为人参皂苷rh2。此外pn50还能催化compoundk,生成的产物根据tlc板上的迁移位置以及pn50的区域专一性推测为人参皂苷f2(图2)。实施例4.利用三七来源的糖基转移酶基因pn50在酿酒酵母中合成稀有人参皂苷rh2(1)三七来源的糖基转移酶基因pn50可以催化原人参二醇c3位羟基糖基化合成稀有人参皂苷rh2,为实现在酿酒酵母中合成稀有人参皂苷rh2,本发明首先构建了一株可生产原人参二醇的酿酒酵母底盘细胞。向野生型酿酒酵母中导入达玛烯二醇合成酶基因pgdds,原人参二醇合成的细胞色素p450基因cyp716a47及其还原酶基因pgcpr1,利用酿酒酵母自身的甲羟戊酸途径合成的2,3-环氧角鲨烯可以合成原人参二醇。通过对人工构建的原人参二醇合成途径进行优化包括对合成限速步骤优化,前体供应优化等获得了一株高产原人参二醇的酿酒酵母菌株zwby04rs。(2)合成如序列seqidno:7-18的12条引物,以pcr的方法获得糖基转移酶表达的启动子,终止子,orf,筛选标记,上下游同源臂片段,pcr方法同实施例1。将上述pcr片段以及ugtpg45的orf各100ng混匀后,利用酿酒酵母常规的liac/ssdna转化方法,转化重组酿酒酵母菌株zwby04rs,获得重组酿酒酵母菌株zwby04rs-ugtpg45。类似的将上述pcr片段以及pn50的orf各100ng混匀后,利用酿酒酵母常规的liac/ssdna转化方法,转化重组酿酒酵母菌株zwby04rs,获得重组酿酒酵母菌株zwby04rs-pn50。启动子引物fseq_id_no.7tagctctgataagaatattgatgagttcatttcaaagcttgtttcctcctgagatt启动子引物rseq_id_no.8actgtcaaggagggtattctgggcctccatgtcgctgctatataacagttgaaatttggataagaacatorf引物fseq_id_no.9gctatactgctgtcgattcgatactaacgccgccatccagtgtcgagaattacaatagtorf引物rseq_id_no.10tctggtgaggatttacggtatgatcatgctggtaagcttcgtta终止子引物fseq_id_no.11gaaaagaagataatatttttatataattatattaatctcaggaggaaacaagctttgaa终止子引物rseq_id_no.12gcatagcaatctaatctaagttttaattacaaaatggagagagaaatgttgagcaaaac筛选标记引物fseq_id_no.13cgcgttgagaagatgttcttatccaaatttcaactgttatatagcagcga筛选标记引物rseq_id_no.14ttacttcttgcagacatcagacatactattgtaattctcgacactggatggcggcgtta上游同源臂引物fseq_id_no.15ggctgtcgccattcaagagcagatagcttcaaaatgtttctactccttttttactcttc上游同源臂引物rseq_id_no.16cataatgtgagttttgctcaacatttctctctccattttgtaattaaaacttagattag下游同源臂引物fseq_id_no.17cccaaagctaagagtcccattttattc下游同源臂引物rseq_id_no.18gagtagaaacattttgaagctatctgctcttgaatggcgacagcctattgccccagtgt(3)配置固体培养基:配置培养基:1%yeastextract(酵母膏),2%peptone(蛋白胨),2%dextrose(glucose)(葡萄糖),2%琼脂粉。配置液体培养基:配置培养基:1%yeastextract(酵母膏),2%peptone(蛋白胨),2%dextrose(glucose)(葡萄糖)。挑取在固体培养基平板上划线的重组酿酒酵母菌zwby04rs-ugtpg45和zwby04rs-pn50,分别于含有5ml液体培养基的试管震荡培养过夜(30℃,250rpm,16h);离心收集菌体,转移至10ml液体培养基的50ml三角瓶中,调od600至0.05,30℃,250rpm震荡培养4天得到发酵产物。本方法对每一株重组酵母同时设置一个平行实验。原人参二醇及稀有人参皂苷rh2的提取和检测:从10ml发酵液中吸取100μl发酵液,用fastprep震荡裂解酵母,加入等体积的正丁醇抽提,而后在真空条件下使正丁醇蒸干。用100μl甲醇溶解后通过hplc检测目的产物的产量。hplc结果见图3。向产原人参二醇的酿酒酵母菌株中导入人参来源的糖基转移酶基因ugtpg45所构建的重组酿酒酵母菌株zwby04rs-ugtpg45能合成稀有人参皂苷rh2,其产量为35.66mg/l。向产原人参二醇的酿酒酵母菌株中导入三七来源的糖基转移酶基因pn50所构建的重组酿酒酵母菌株zwby04rs-pn50能合成稀有人参皂苷rh2,其产量为45.55mg/l。实施例5.人参来源的糖基转移酶ugtpg45随机突变库的构建以质粒ugtpg45-pmd18t为模板,使用genemorphiirandommutagenesiskit(agilenttechnology),ugtpg45随机突变引物fseqidno:23(gcatagcaatctaatctaagttttaattacaaaatggagagagaaatgttgagcaaaac)和ugtpg45随机突变引物rseqidno:24(gaaaagaagataatatttttatataattatattaatctcaggaggaaacaagctttgaa)为引物进行易错pcr,程序如下:95℃2min预变性;95℃变性30s,58℃退火30s,72℃延伸3min15s,30个循环;72℃终延伸10min。根据试剂盒说明书加入1ug,1.5ug,2ug模板对突变率进行摸索。割胶回收pcr产物,用taq酶加a,连接到载体pmd18t上,转化大肠杆菌top10。随机挑取10个阳性克隆测序,确定突变率在1-2碱基/基因相应的模板用量为1.5ug。后续实验使用该条件进行易错pcr即构建好ugtpg45的随机突变库。使用引物seqidno:25(片段7引物f)(acactggggcaataggctgtcgccattcaagagcagatagcttcaaaatgtttctactc)和seqidno:26(片段7引物r)(cataatgtgagttttgctcaacatttctctctccattttgtaattaaaacttagattag),以酿酒酵母基因组dna为模板pcr获得片段7,使用引物seqidno:27(片段8引物f)(ttgatgagttcatttcaaagcttgtttcctcctgagattaatataattatataaaaata)和seqidno:28(片段8引物r)(actgtcaaggagggtattctgggcctccatgtcgctgctatataacagttgaaatttgg)以酿酒酵母基因组dna为模板pcr获得片段8,使用引物seqidno:29(片段9引物f)(cccaaagctaagagtcccattttattc)和seqidno:30(片段9引物r)(gaagagtaaaaaaggagtagaaacattttgaagctatctgctcttgaatggcgacagcc),seqidno:31(片段10引物f)(tgtcgattcgatactaacgccgccatccagtgtcgagaattacaatagtatgtctgatg)和seqidno:32(片段10引物r)(tctggtgaggatttacggtatg)以酿酒酵母基因组dna为模板pcr获得片段9和10。使用引物seqidno:33(片段11引物f)(aagatgttcttatccaaatttcaactgttatatagcagcgacatggaggcccagaatac)和seqidno:34(片段11引物r)(tacttcttgcagacatcagacatactattgtaattctcgacactggatggcggcgttag)以质粒plkan为模板pcr获得片段11。将上述片段7-11等摩尔比混合,转化ppd高产菌株zwby04rs,涂布ypd平板(加入100ug/mlg418),30℃培养2天,待表达ugtpg45突变基因的酵母转化子长出。类似的,转化野生型ugtpg45构建酵母转化子作为对照。在96孔板中加入每孔600ulypd培养基(加入100ug/mlg418),挑取酵母单克隆到培养基中,30℃280rpm震荡培养1天。转移6ul培养物到一块含有600ulypd培养基的新的96孔板中,30℃280rpm震荡培养3天。每孔加入600ul正丁醇,盖好橡胶盖并用胶带封好,旋转抽提3h。4000rpm离心10min,吸取150ul正丁醇相到一块新的96孔板中,hplc进行产物测定。利用突变体基因8e7所构建的稀有人参皂苷rh2菌株zwby04rs-8e7其rh2产量相比于利用ugtpg45所构建菌株zwby04rs-ugtpg45产量提升了70%,达到60.48mg/l。所述野生型基因ugtpg45具有seqidno:20的核苷酸序列。自seqidno:20的5’端第1-1374位核苷酸为ugtpg45的开放阅读框,自seqidno:20的5’端的第1-3位核苷酸为ugtpg45基因的起始密码子atg,自seqidno:20的5’端的第1371-1374位核苷酸为ugtpg45基因的终止密码子tga。糖基转移酶ugtpg45基因编码一个含有457个氨基酸的蛋白质ugtpg45,具有seqidno:19的氨基酸残基序列,用软件预测到该蛋白质的理论分子量大小为51.1kda,等电点pi为5.10。自seqidno:19的氨基端的第332-375位氨基酸为糖基转移酶pspg保守功能域。ugtpg45氨基酸序列seq_id_no.19meremlskthimfipfpaqghmspmmqfakrlawkglritivlpaqirdfmqitnplintecisfdfdkddgmpysmqaymgvvklkvtnklsdllekqrtngypvnllvvdslypsrvemchqlgvkgapffthscavgaiyynarlgklkippeegltsvslpsipllgrddlpiirtgtfpdlfehlgnqfsdldkadwiffntfdkleneeakwlssqwpitsigplipsmyldkqlpndkdnginfykadvgscikwldakdpgsvvyasfgsvkhnlgddymdevawgllhskyhfiwvviesertklssdflaeaeaeekglivswcpqlqvlshksigsfmthcgwnstvealslgvpmvalpqqfdqpanakyivdvwqigvrvpigeegvvlrgevancikdvmegeigdelrgnalkwkglaveamekggssdknidefisklvssugtpg45核苷酸序列seq_id_no.20atggagagagaaatgttgagcaaaactcacattatgttcatcccattcccagctcaaggccacatgagcccaatgatgcaattcgccaagcgtttagcctggaaaggcctgcgaatcacgatagttcttccggctcaaattcgagatttcatgcaaataaccaacccattgatcaacactgagtgcatctcctttgattttgataaagacgatgggatgccatacagcatgcaggcttatatgggagttgtaaaactcaaggtcacaaataaactgagtgacctactcgagaagcaaagaacaaatggctaccctgttaatttgctagtggttgattcattatatccatctcgggtagaaatgtgccaccaacttggggtaaaaggagctccatttttcactcactcttgtgctgttggtgccatttattataatgctcgcttagggaaattgaagatacctcctgaggaagggttgacttctgtttcattgccttcaattccattgttggggagagatgatttgccaattattaggactggcacctttcctgatctctttgagcatttggggaatcagttttcagatcttgataaagcggattggatctttttcaatacttttgataagcttgaaaatgaggaagcaaaatggctatctagccaatggccaattacatccatcggaccattaatcccttcaatgtacttagacaaacaattaccaaatgacaaagacaatggcattaatttctacaaggcagacgtcggatcgtgcatcaagtggctagacgccaaagaccctggctcggtagtctacgcctcattcgggagcgtgaagcacaacctcggcgatgactacatggacgaagtagcatggggcttgttacatagcaaatatcacttcatatgggttgttatagaatccgaacgtacaaagctctctagcgatttcttggcagaggcagaggcagaggaaaaaggcctaatagtgagttggtgccctcaactccaagttttgtcacataaatctatagggagttttatgactcattgtggttggaactcgacggttgaggcattgagtttgggcgtgccaatggtggcactgccacaacagtttgatcagcctgctaatgccaagtatatcgtggatgtatggcaaattggggttcgggttccgattggtgaagagggggttgttttgaggggagaagttgctaactgtataaaggatgttatggagggggaaataggggatgagcttagagggaatgctttgaaatggaaggggttggctgtggaggcaatggagaaagggggtagctctgataagaatattgatgagttcatttcaaagcttgtttcctcctga所述突变体基因8e7具有seqidno:22的核苷酸序列。自seqidno:22的5’端第1-1374位核苷酸为8e7的开放阅读框,自seqidno:22的5’端的第1-3位核苷酸为8e7基因的起始密码子atg,自seqidno:22的5’端的第1371-1374位核苷酸为8e7基因的终止密码子tga。糖基转移酶8e7基因编码一个含有457个氨基酸的蛋白质8e7,具有seqidno:21的氨基酸残基序列。8e7氨基酸序列seq_id_no.21meremlskthimfipfpaqghmspmmqfakrlawkglritivlpaqirdfmqitnplintecisfdfdkddgmpysmqaymgvvklkvtnklsdllekqrtngypvnllvvdslypsrvemchqlgvkgapffthscavgaiyynarlgklkippeegltsvslpsipllgrddlpiirtgtfpdlfehlgnqfsdldkadwiffntfdkleneeakwlsshwpitsigplipsmyldkqlpndkdnginfykadvgscikwldakdpgsvvyasfgsvkhnlgddymdevawgllhskyhfiwvviesertklssdflaeveaeekglivswcpqlqvlshksigsfmthcgwnstvealslgvpmvalpqqfdqpanakyivdvwqigvrvpigeegvvlrgevancikdvmegeigdelrgnalkwkglaveamekggssdknidefisklvss8e7核苷酸序列seq_id_no.22atggagagagaaatgttgagcaaaactcacattatgttcatcccattcccagctcaaggccacatgagcccaatgatgcaattcgccaagcgtttagcctggaaaggcctgcgaatcacgatagttcttccggctcaaattcgagatttcatgcaaataaccaacccattgatcaacactgagtgcatctcctttgattttgataaagacgatgggatgccatacagcatgcaggcttatatgggagttgtaaaactcaaggtcacaaataaactgagtgacctactcgagaagcaaagaacaaatggctaccctgttaatttgctagtggttgattcattatatccatctcgggtagaaatgtgccaccaacttggggtaaaaggagctccatttttcactcactcttgtgctgttggtgccatttattataatgctcgcttagggaaattgaagatacctcctgaggaagggttgacttctgtttcattgccttcaattccattgttggggagagatgatttgccaattattaggactggcacctttcctgatctctttgagcatttggggaatcagttttcagatcttgataaagcggattggatctttttcaatacttttgataagcttgaaaatgaggaagcaaaatggctatctagccattggccaattacatccatcggaccattaatcccttcaatgtacttagacaaacaattaccaaatgacaaagacaatggcattaatttctacaaggcagacgtcggatcgtgcatcaagtggctagacgccaaagaccctggctcggtagtctacgcctcattcgggagcgtgaagcacaacctcggcgatgactacatggacgaagtagcatggggcttgttacatagcaaatatcacttcatatgggttgttatagaatccgaacgtacaaagctctctagcgatttcttggcagaggtagaggcagaggaaaaaggcctaatagtgagttggtgccctcaactccaagttttgtcacataaatctatagggagttttatgactcattgtggttggaactcgacggttgaggcattgagtttgggcgtgccaatggtggcactgccacaacagtttgatcagcctgctaatgccaagtatatcgtggatgtatggcaaattggggttcgggttccgattggtgaagagggggttgttttgaggggagaagttgctaactgtataaaggatgttatggagggggaaataggggatgagcttagagggaatgctttgaaatggaaggggttggctgtggaggcaatggagaaagggggtagctctgataagaatattgatgagttcatttcaaagcttgtttcctcctga上述结果表明使用本发明中三七来源的糖基转移酶基因pn50或者对野生型糖基转移酶基因改造获得的突变体基因8e7替换人参来源的糖基转移酶基因ugtpg45均能大幅提升稀有人参皂苷rh2的合成效率和产量,具有显著有益效果。讨论目前,通过对人参,花旗参和三七的转录组分析,研究人员已经发现了大量的糖基转移酶候选基因,但是仅有极少数的糖基转移酶被验证参与了人参皂苷的合成。对三七中参与人参皂苷合成的糖基转移酶至今未有报道。由于三七也合成相同的人参皂苷,发掘三七来源糖基转移酶一方面可以使我们更好的了解这两类植物合成人参皂苷合成途径,另一方面可以为人参皂苷的合成生物学研究提供更丰富的元件,具有重要意义。在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。序列表<110>中国科学院上海生命科学研究院<120>糖基转移酶、突变体及其应用<130>p2017-0476<160>34<170>patentinversion3.5<210>1<211>22<212>dna<213>人工序列<400>1atggagagagaaatgttgagca22<210>2<211>22<212>dna<213>人工序列<400>2tcaggaggaaacaagctttgaa22<210>3<211>1368<212>dna<213>人工序列<400>3atggagagagaaatgttgagcaaaactcacattatgttcatcccattcccagctcaaggc60cacatgagcccaatgatgcaattcgtcaagcgtttagcctggaaaggcgtgcgaatcacg120atagttcttccggctgagattcgagattctatgcaaataaacaactcattgatcaacact180gagtgcatctcctttgattttgataaagatgatgagatgccatacagcatgcgggcttat240atgggagttgtaaagctcaaggtcacaaataaactgagtgacctactcgagaagcaaaaa300acaaatggctaccctgttaatttgctagtggtcgattcattatatccatctcgggtagaa360atgtgccaccaacttggggtaaaaggagctccatttttcactcactcttgtgctgttggt420gccatttattataatgctcgcttagggaaattgaagatacctcctgaggaagggttgact480tctgtttcattgccttcaattccattgttggggagaaatgatttgccaattattaggact540ggcacctttcctgatctctttgagcatttggggaatcagttttcagatcttgataaagcg600gattggatctttttcaatacttttgataagcttgaaaatgaggaagcaaaatggctatct660agccaatggccaattacatccatcggaccattaatcccttcaatgtacttagacaaacaa720ttaccaaatgacaaagacaatgacattaatttctacaaggcagacgtcggatcgtgcatc780aagtggctagacgccaaagaccctggctcggtagtctacgcctcattcgggagcgtgaag840cacaacctcggcgatgactacatggacgaagtagcatggggcttgttacacagcaaatat900cacttcatatgggttgttatagaatccgaacgtacaaagctctctagcgatttcttggca960gaggcagaggaaaaaggcctaatagtgagttggtgccctcaactcgaagttttgtcacat1020aaatctataggtagttttatgactcattgtggttggaactcgacggttgaggcattgagt1080ttgggcgtgccaatggtggcagtgccacaacagtttgatcagcctgttaatgccaagtat1140atcgtggatgtatggcgaattggggttcaggttccgattggtgaaaatggggttcttttg1200aggggagaagttgctaactgtataaaggatgttatggagggggaaataggggatgagctt1260agagggaatgctttgaaatggaaggggttggctgtggaggcaatggagaaagggggtagc1320tctgataagaatattgatgagttcatttcaaagcttgtttcctcctga1368<210>4<211>455<212>prt<213>人工序列<400>4metgluargglumetleuserlysthrhisilemetpheileprophe151015proalaglnglyhismetserprometmetglnphevallysargleu202530alatrplysglyvalargilethrilevalleuproalagluilearg354045aspsermetglnileasnasnserleuileasnthrglucysileser505560pheasppheasplysaspaspglumetprotyrsermetargalatyr65707580metglyvalvallysleulysvalthrasnlysleuseraspleuleu859095glulysglnlysthrasnglytyrprovalasnleuleuvalvalasp100105110serleutyrproserargvalglumetcyshisglnleuglyvallys115120125glyalaprophephethrhissercysalavalglyalailetyrtyr130135140asnalaargleuglylysleulysileproproglugluglyleuthr145150155160servalserleuproserileproleuleuglyargasnaspleupro165170175ileileargthrglythrpheproaspleuphegluhisleuglyasn180185190glnpheseraspleuasplysalaasptrpilephepheasnthrphe195200205asplysleugluasngluglualalystrpleuserserglntrppro210215220ilethrserileglyproleuileprosermettyrleuasplysgln225230235240leuproasnasplysaspasnaspileasnphetyrlysalaaspval245250255glysercysilelystrpleuaspalalysaspproglyservalval260265270tyralaserpheglyservallyshisasnleuglyaspasptyrmet275280285aspgluvalalatrpglyleuleuhisserlystyrhispheiletrp290295300valvalileglusergluargthrlysleuserserasppheleuala305310315320glualagluglulysglyleuilevalsertrpcysproglnleuglu325330335valleuserhislysserileglyserphemetthrhiscysglytrp340345350asnserthrvalglualaleuserleuglyvalprometvalalaval355360365proglnglnpheaspglnprovalasnalalystyrilevalaspval370375380trpargileglyvalglnvalproileglygluasnglyvalleuleu385390395400argglygluvalalaasncysilelysaspvalmetgluglygluile405410415glyaspgluleuargglyasnalaleulystrplysglyleualaval420425430glualametglulysglyglyserserasplysasnileaspgluphe435440445ileserlysleuvalserser450455<210>5<211>28<212>dna<213>人工序列<400>5ggatccatggagagagaaatgttgagca28<210>6<211>28<212>dna<213>人工序列<400>6ctcgagtcaggaggaaacaagctttgaa28<210>7<211>56<212>dna<213>人工序列<400>7tagctctgataagaatattgatgagttcatttcaaagcttgtttcctcctgagatt56<210>8<211>69<212>dna<213>人工序列<400>8actgtcaaggagggtattctgggcctccatgtcgctgctatataacagttgaaatttgga60taagaacat69<210>9<211>59<212>dna<213>人工序列<400>9gctatactgctgtcgattcgatactaacgccgccatccagtgtcgagaattacaatagt59<210>10<211>44<212>dna<213>人工序列<400>10tctggtgaggatttacggtatgatcatgctggtaagcttcgtta44<210>11<211>59<212>dna<213>人工序列<400>11gaaaagaagataatatttttatataattatattaatctcaggaggaaacaagctttgaa59<210>12<211>59<212>dna<213>人工序列<400>12gcatagcaatctaatctaagttttaattacaaaatggagagagaaatgttgagcaaaac59<210>13<211>50<212>dna<213>人工序列<400>13cgcgttgagaagatgttcttatccaaatttcaactgttatatagcagcga50<210>14<211>59<212>dna<213>人工序列<400>14ttacttcttgcagacatcagacatactattgtaattctcgacactggatggcggcgtta59<210>15<211>59<212>dna<213>人工序列<400>15ggctgtcgccattcaagagcagatagcttcaaaatgtttctactccttttttactcttc59<210>16<211>59<212>dna<213>人工序列<400>16cataatgtgagttttgctcaacatttctctctccattttgtaattaaaacttagattag59<210>17<211>27<212>dna<213>人工序列<400>17cccaaagctaagagtcccattttattc27<210>18<211>59<212>dna<213>人工序列<400>18gagtagaaacattttgaagctatctgctcttgaatggcgacagcctattgccccagtgt59<210>19<211>457<212>prt<213>人工序列<400>19metgluargglumetleuserlysthrhisilemetpheileprophe151015proalaglnglyhismetserprometmetglnphealalysargleu202530alatrplysglyleuargilethrilevalleuproalaglnilearg354045aspphemetglnilethrasnproleuileasnthrglucysileser505560pheasppheasplysaspaspglymetprotyrsermetglnalatyr65707580metglyvalvallysleulysvalthrasnlysleuseraspleuleu859095glulysglnargthrasnglytyrprovalasnleuleuvalvalasp100105110serleutyrproserargvalglumetcyshisglnleuglyvallys115120125glyalaprophephethrhissercysalavalglyalailetyrtyr130135140asnalaargleuglylysleulysileproproglugluglyleuthr145150155160servalserleuproserileproleuleuglyargaspaspleupro165170175ileileargthrglythrpheproaspleuphegluhisleuglyasn180185190glnpheseraspleuasplysalaasptrpilephepheasnthrphe195200205asplysleugluasngluglualalystrpleuserserglntrppro210215220ilethrserileglyproleuileprosermettyrleuasplysgln225230235240leuproasnasplysaspasnglyileasnphetyrlysalaaspval245250255glysercysilelystrpleuaspalalysaspproglyservalval260265270tyralaserpheglyservallyshisasnleuglyaspasptyrmet275280285aspgluvalalatrpglyleuleuhisserlystyrhispheiletrp290295300valvalileglusergluargthrlysleuserserasppheleuala305310315320glualaglualagluglulysglyleuilevalsertrpcysprogln325330335leuglnvalleuserhislysserileglyserphemetthrhiscys340345350glytrpasnserthrvalglualaleuserleuglyvalprometval355360365alaleuproglnglnpheaspglnproalaasnalalystyrileval370375380aspvaltrpglnileglyvalargvalproileglyglugluglyval385390395400valleuargglygluvalalaasncysilelysaspvalmetglugly405410415gluileglyaspgluleuargglyasnalaleulystrplysglyleu420425430alavalglualametglulysglyglyserserasplysasnileasp435440445glupheileserlysleuvalserser450455<210>20<211>1374<212>dna<213>人工序列<400>20atggagagagaaatgttgagcaaaactcacattatgttcatcccattcccagctcaaggc60cacatgagcccaatgatgcaattcgccaagcgtttagcctggaaaggcctgcgaatcacg120atagttcttccggctcaaattcgagatttcatgcaaataaccaacccattgatcaacact180gagtgcatctcctttgattttgataaagacgatgggatgccatacagcatgcaggcttat240atgggagttgtaaaactcaaggtcacaaataaactgagtgacctactcgagaagcaaaga300acaaatggctaccctgttaatttgctagtggttgattcattatatccatctcgggtagaa360atgtgccaccaacttggggtaaaaggagctccatttttcactcactcttgtgctgttggt420gccatttattataatgctcgcttagggaaattgaagatacctcctgaggaagggttgact480tctgtttcattgccttcaattccattgttggggagagatgatttgccaattattaggact540ggcacctttcctgatctctttgagcatttggggaatcagttttcagatcttgataaagcg600gattggatctttttcaatacttttgataagcttgaaaatgaggaagcaaaatggctatct660agccaatggccaattacatccatcggaccattaatcccttcaatgtacttagacaaacaa720ttaccaaatgacaaagacaatggcattaatttctacaaggcagacgtcggatcgtgcatc780aagtggctagacgccaaagaccctggctcggtagtctacgcctcattcgggagcgtgaag840cacaacctcggcgatgactacatggacgaagtagcatggggcttgttacatagcaaatat900cacttcatatgggttgttatagaatccgaacgtacaaagctctctagcgatttcttggca960gaggcagaggcagaggaaaaaggcctaatagtgagttggtgccctcaactccaagttttg1020tcacataaatctatagggagttttatgactcattgtggttggaactcgacggttgaggca1080ttgagtttgggcgtgccaatggtggcactgccacaacagtttgatcagcctgctaatgcc1140aagtatatcgtggatgtatggcaaattggggttcgggttccgattggtgaagagggggtt1200gttttgaggggagaagttgctaactgtataaaggatgttatggagggggaaataggggat1260gagcttagagggaatgctttgaaatggaaggggttggctgtggaggcaatggagaaaggg1320ggtagctctgataagaatattgatgagttcatttcaaagcttgtttcctcctga1374<210>21<211>457<212>prt<213>人工序列<400>21metgluargglumetleuserlysthrhisilemetpheileprophe151015proalaglnglyhismetserprometmetglnphealalysargleu202530alatrplysglyleuargilethrilevalleuproalaglnilearg354045aspphemetglnilethrasnproleuileasnthrglucysileser505560pheasppheasplysaspaspglymetprotyrsermetglnalatyr65707580metglyvalvallysleulysvalthrasnlysleuseraspleuleu859095glulysglnargthrasnglytyrprovalasnleuleuvalvalasp100105110serleutyrproserargvalglumetcyshisglnleuglyvallys115120125glyalaprophephethrhissercysalavalglyalailetyrtyr130135140asnalaargleuglylysleulysileproproglugluglyleuthr145150155160servalserleuproserileproleuleuglyargaspaspleupro165170175ileileargthrglythrpheproaspleuphegluhisleuglyasn180185190glnpheseraspleuasplysalaasptrpilephepheasnthrphe195200205asplysleugluasngluglualalystrpleuserserhistrppro210215220ilethrserileglyproleuileprosermettyrleuasplysgln225230235240leuproasnasplysaspasnglyileasnphetyrlysalaaspval245250255glysercysilelystrpleuaspalalysaspproglyservalval260265270tyralaserpheglyservallyshisasnleuglyaspasptyrmet275280285aspgluvalalatrpglyleuleuhisserlystyrhispheiletrp290295300valvalileglusergluargthrlysleuserserasppheleuala305310315320gluvalglualagluglulysglyleuilevalsertrpcysprogln325330335leuglnvalleuserhislysserileglyserphemetthrhiscys340345350glytrpasnserthrvalglualaleuserleuglyvalprometval355360365alaleuproglnglnpheaspglnproalaasnalalystyrileval370375380aspvaltrpglnileglyvalargvalproileglyglugluglyval385390395400valleuargglygluvalalaasncysilelysaspvalmetglugly405410415gluileglyaspgluleuargglyasnalaleulystrplysglyleu420425430alavalglualametglulysglyglyserserasplysasnileasp435440445glupheileserlysleuvalserser450455<210>22<211>1374<212>dna<213>人工序列<400>22atggagagagaaatgttgagcaaaactcacattatgttcatcccattcccagctcaaggc60cacatgagcccaatgatgcaattcgccaagcgtttagcctggaaaggcctgcgaatcacg120atagttcttccggctcaaattcgagatttcatgcaaataaccaacccattgatcaacact180gagtgcatctcctttgattttgataaagacgatgggatgccatacagcatgcaggcttat240atgggagttgtaaaactcaaggtcacaaataaactgagtgacctactcgagaagcaaaga300acaaatggctaccctgttaatttgctagtggttgattcattatatccatctcgggtagaa360atgtgccaccaacttggggtaaaaggagctccatttttcactcactcttgtgctgttggt420gccatttattataatgctcgcttagggaaattgaagatacctcctgaggaagggttgact480tctgtttcattgccttcaattccattgttggggagagatgatttgccaattattaggact540ggcacctttcctgatctctttgagcatttggggaatcagttttcagatcttgataaagcg600gattggatctttttcaatacttttgataagcttgaaaatgaggaagcaaaatggctatct660agccattggccaattacatccatcggaccattaatcccttcaatgtacttagacaaacaa720ttaccaaatgacaaagacaatggcattaatttctacaaggcagacgtcggatcgtgcatc780aagtggctagacgccaaagaccctggctcggtagtctacgcctcattcgggagcgtgaag840cacaacctcggcgatgactacatggacgaagtagcatggggcttgttacatagcaaatat900cacttcatatgggttgttatagaatccgaacgtacaaagctctctagcgatttcttggca960gaggtagaggcagaggaaaaaggcctaatagtgagttggtgccctcaactccaagttttg1020tcacataaatctatagggagttttatgactcattgtggttggaactcgacggttgaggca1080ttgagtttgggcgtgccaatggtggcactgccacaacagtttgatcagcctgctaatgcc1140aagtatatcgtggatgtatggcaaattggggttcgggttccgattggtgaagagggggtt1200gttttgaggggagaagttgctaactgtataaaggatgttatggagggggaaataggggat1260gagcttagagggaatgctttgaaatggaaggggttggctgtggaggcaatggagaaaggg1320ggtagctctgataagaatattgatgagttcatttcaaagcttgtttcctcctga1374<210>23<211>59<212>dna<213>人工序列<400>23gcatagcaatctaatctaagttttaattacaaaatggagagagaaatgttgagcaaaac59<210>24<211>59<212>dna<213>人工序列<400>24gaaaagaagataatatttttatataattatattaatctcaggaggaaacaagctttgaa59<210>25<211>59<212>dna<213>人工序列<400>25acactggggcaataggctgtcgccattcaagagcagatagcttcaaaatgtttctactc59<210>26<211>59<212>dna<213>人工序列<400>26cataatgtgagttttgctcaacatttctctctccattttgtaattaaaacttagattag59<210>27<211>59<212>dna<213>人工序列<400>27ttgatgagttcatttcaaagcttgtttcctcctgagattaatataattatataaaaata59<210>28<211>59<212>dna<213>人工序列<400>28actgtcaaggagggtattctgggcctccatgtcgctgctatataacagttgaaatttgg59<210>29<211>27<212>dna<213>人工序列<400>29cccaaagctaagagtcccattttattc27<210>30<211>59<212>dna<213>人工序列<400>30gaagagtaaaaaaggagtagaaacattttgaagctatctgctcttgaatggcgacagcc59<210>31<211>59<212>dna<213>人工序列<400>31tgtcgattcgatactaacgccgccatccagtgtcgagaattacaatagtatgtctgatg59<210>32<211>22<212>dna<213>人工序列<400>32tctggtgaggatttacggtatg22<210>33<211>59<212>dna<213>人工序列<400>33aagatgttcttatccaaatttcaactgttatatagcagcgacatggaggcccagaatac59<210>34<211>59<212>dna<213>人工序列<400>34tacttcttgcagacatcagacatactattgtaattctcgacactggatggcggcgttag59当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1