糖基转移酶突变蛋白及其应用

文档序号:10622448阅读:617来源:国知局
糖基转移酶突变蛋白及其应用
【专利摘要】本发明公开了一种糖基转移酶突变蛋白及其应用。具体地,本发明利用同源比对以及定点突变,发现了一种新的糖基转移酶的突变蛋白,所述的突变蛋白为非天然蛋白,且所述突变蛋白具有糖基转移酶催化活性,并且所述突变蛋白含有与酶催化活性相关的以下核心氨基酸:第142位氨基酸为A;第144位氨基酸为H或F;和第339位氨基酸为G;其中,所述氨基酸位置编号基于SEQ ID NO.:13所示的序列。实验证明,对糖基转移酶中的关键位点进行改造后,可以改变原本无活性或活性较差的酶,或者赋予新的酶活性。此外,本发明人还发现,对本发明糖基转移酶进行末端截短后,其表达量具有明显的上升。
【专利说明】
糖基转移酶突变蛋白及其应用
技术领域
[0001] 本发明涉及生物技术和植物生物学领域,具体地,本发明涉及一种糖基转移酶突 变蛋白及其应用。
【背景技术】
[0002] 人参皂苷是从人参及其同属植物(如三七、西洋参等)中分离到的皂苷的总称,属 于三萜类皂苷,是人参中的主要有效成份。目前,已经从人参中分离出了至少1〇〇种皂苷。 从结构上来看,人参皂苷是皂苷元经过糖基化后形成的生物活性小分子。人参皂苷的皂苷 元只有有限的几种,主要是达玛烷型的原人参二醇和原人参三醇,以及齐墩果烷酸。皂苷元 通过糖基化后,可以提高水溶性,并产生出不同的生理活性。原人参三醇在C3, C6和C20位 都有一个羟基,目前发现的原人参三醇型皂苷都是在C6和(或C20)的羟基上结合糖基化, 在C3上结合糖基的原人参三醇型皂苷尚未见报道。糖基可以是葡萄糖、鼠李糖、木糖、和阿 拉伯糖。
[0003] 一些原人参三醇型皂苷被证实具有广泛的生理功能和药用价值:包括抗过敏和抗 炎症、免疫调节、抗疲劳、护心等功能。人参阜苷F1 (20-0-β -D-glucopyranosyl-20(S)-pr otopanaxatriol)属于原人参三醇型阜苷,它在人参中的含量也非常低,也属于稀有人参阜 苷。人参皂苷F1的结构与CK非常接近,也是在皂苷元的C-20位羟基上连有一个葡萄糖基。 人参皂苷F1也具有独特的药用价值。它具有抗衰老和抗氧化的功能。人参皂苷Rhl (6-0-β -D-glucopyranosyl_20 (S) -protopanaxatriol)属于原人参三醇型阜苷,它在人参中的 含量也非常低,也属于稀有人参皂苷。人参皂苷Rhl的结构与F1非常接近,但是它的糖基 化位点是在C6位上的羟基。人参皂苷Rhl也具有特殊的生理功能,能够抗过敏和抗炎症。 人参阜苷 Rgl (6-〇- β - (D-glucopyranosyl) -2〇-〇- β - (D-glucopyranosyl) -protopanaxad i〇l)属于原人参三醇型皂苷,具有抗疲劳、护心等功能。
[0004] 稀有人参皂苷的糖基化修饰程度一般都比较低(只含有1-2个糖基),而丰富皂 苷的糖基化修饰程度更高(由多个糖基组成的糖链)。稀有人参皂苷单体的传统生产方法, 是以人参或者三七的总皂苷或者丰富皂苷为原料,依赖化学、酶和微生物发酵的水解方法。 由于野生的人参资源已基本耗竭,人参皂苷资源目前来源于人参或三七的人工栽培,而其 人工栽培的生长周期长(一般需要5-7年以上),并且受到地域的限制,还经常受到病虫害 而需要施用大量的农药,所以,人参或三七的人工栽培有严重的连作障碍(人参或三七种 植地需要休耕5-15年以上才能克服连作障碍),所以人参皂苷的产量、品质及安全性都面 临挑战。
[0005] 合成生物学的发展为植物来源的天然产物的异源合成提供了新的机遇。以酵母 为底盘,通过代谢途径的组装和优化,已经实现了用廉价的单糖来发酵合成青蒿酸或者双 氢青蒿酸,继而再通过一步化学转化的方法生产青蒿素,这表明合成生物学在天然产物的 药物合成方面具有的巨大潜力。利用酵母底盘细胞通过合成生物学方法异源合成稀有人参 皂苷单体,原料为廉价的单糖,制备过程为安全性可调控的发酵过程,避免了任何外来污染 (例如,原料植物人工种植时使用的农药),因此,通过合成生物学技术制备稀有人参皂苷 单体,不仅具有成本优势,而且,可以保证成品的品质与安全性。利用合成生物学技术制备 足够量的各种高纯度稀有人参皂苷单体,用于活性测定及临床实验,促进稀有人参皂苷的 创新药物研发。
[0006] 利用合成生物学方法来人工合成这些具有药用活性的三醇型人参皂苷,不仅需要 构建合成原人参三醇的代谢途径,还需要鉴定催化人参皂苷的糖基化的糖基转移酶。糖基 转移酶的功能是将糖基供体(核苷二磷酸糖,例如UDP-葡萄糖)上的糖基转移到不同的糖 基受体上。根据氨基酸序列的不同,目前糖基转移酶已有94个家族。目前已测序的植物基 因组中,发现了上百种以上不同的糖基转移酶。这些糖基转移酶的糖基受体包括糖、脂、蛋 白、核酸、抗生素和其它的小分子。
[0007] 因此,本领域需要对糖基转移酶进行更多的研究和开发,通过更多高产的糖基转 移酶,以经济、高效的方式获取稀有人参皂苷。

【发明内容】

[0008] 本发明提供了一种糖基转移酶的突变蛋白,通过采用所述的突变蛋白可以改善其 酶活性或增加其表达量。
[0009] 本发明的第一方面,提供了一种糖基转移酶的突变蛋白,所述的突变蛋白为非天 然蛋白,且所述突变蛋白具有糖基转移酶催化活性,并且所述突变蛋白含有与酶催化活性 相关的以下核心氨基酸:
[0010] 第142位氨基酸为A ;
[0011] 第144位氨基酸为Η或F ;和
[0012] 第339位氨基酸为G;
[0013] 其中,所述氨基酸位置编号基于SEQ ID Ν0. : 13所示的序列。
[0014] 在另一优选例中,所述的突变蛋白除142、144、339位氨基酸外,其余氨基酸与SEQ ID N0. : 13所示的序列相同或基本相同。
[0015] 在另一优选例中,所述的基本相同是至多有50个(较佳地为1-20个,更佳地为 1-10个)氨基酸不相同,其中,所述的不相同包括氨基酸的取代、缺失或添加,且所述的突 变蛋白仍具有糖基转移酶活性。
[0016] 在另一优选例中,与SEQ ID N0. : 13所示序列的同源性至少为80%,较佳地至少为 85% -90%,更佳地至少为95%,最佳地至少为98%。
[0017] 在另一优选例中,所述的突变蛋白如SEQ ID N0. : 13、或16所示。
[0018] 在另一优选例中,所述的突变蛋白不是SEQ ID N0. :1、2或4所示的序列。
[0019] 在另一优选例中,所述糖基转移酶催化活性包括催化以下一种或多种反应:
[0020] (a)将来自糖基供体的糖基转移到四环三萜类化合物的C-20位的羟基;
[0021] (b)将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的羟基。
[0022] 在另一优选例中,所述的突变蛋白如SEQ ID N0. :6、11_12所示,且所述的糖基转 移酶催化活性包括将来自糖基供体的糖基转移到四环三萜类化合物的C-20位以及C-6位 的羟基。
[0023] 在另一优选例中,所述的突变蛋白如SEQ ID N0. :6、8、11_12、16所示,且所述的糖 基转移酶活性包括将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的羟基。
[0024] 在另一优选例中,所述的突变蛋白如SEQ ID N0. :6-7、9_13所示,且所述的糖基转 移酶活性包括将来自糖基供体的糖基转移到四环三萜类化合物的C-20位的羟基。
[0025] 在另一优选例中,所述的糖基转移酶催化活性包括催化以下一种或多种反应:
[0026] (A)
[0027]
[0028] 其中,所述式(I)化合物是原人参三醇(protopanaxatriol),式(II)化合物为人 参阜苷 F1 (2〇-〇- β -D-glucopyranosy 1-20 (S) -protopanaxatriol),所述的突变蛋白包括 SEQ ID NO. :6-7,9-13 ;
[0029] (B)
[0030]
[0031] 其中,所述式(I)化合物是原人参三醇(protopanaxatriol),式(III)化合物为人 参阜苷 Rhl (6-〇- β -D-glucopyranosyl-20 (S) -protopanaxatriol);或
[0032]
[0033] 式(II)化合物是人参阜苷 F1 (2〇-〇- β -D-glucopyranosyl-20 (S) -protopanaxat riol),式(IV)化合物是人参阜苷 Rgl (6-〇- β - (D-glucopyranosyl) -2〇-〇- β - (D-glucopy ranosyl)-protopanaxatriol);
[0034] 所述的突变蛋白包括 SEQ ID NO. :6、8、11-12、16 ;
[0035] (C)
[0036]
[0037] 其中,所述式(I)化合物是原人参三醇(protopanaxatriol),所述式(II)化合物 是人参阜苷 F1 (2〇-〇- β -D-glucopyranosyl-20 (S) -protopanaxatriol),式(IV)化合物为 人参阜苷 Rgl (6-〇- β - (D-glucopyranosyl) -2〇-〇- β - (D-glucopyranosyl) -protopanaxat riol),所述的突变蛋白包括SEQ ID NO. :6、11-12 ;
[0038] (D)
[0040] 其中,所述式(I)化合物是原人参三醇(protopanaxatriol),所述式(II)化合物 是人参阜苷 F1 (2〇-〇- β -D-glucopyranosyl-20 (S) -protopanaxatriol),式(III)化合物 为人参阜苷 Rhl (6-〇- β -D-glucopyranosyl-20 (S) -protopanaxatriol),所述的突变蛋白 包括 SEQ ID NO. :11-12。
[0041] 在另一优选例中,所述的糖基供体包括核苷二磷酸糖,优选地,所述的糖基供体选 自下组:UDP-葡萄糖,ADP-葡萄糖,TDP-葡萄糖,CDP-葡萄糖,⑶P-葡萄糖,UDP-半乳糖 醛酸,ADP-半乳糖醛酸,TDP-半乳糖醛酸,CDP-半乳糖醛酸,GDP-半乳糖醛酸,UDP-半乳 糖,ADP-半乳糖,TDP-半乳糖,CDP-半乳糖,⑶P-半乳糖,UDP-阿拉伯糖,ADP-阿拉伯糖, TDP-阿拉伯糖,CDP-阿拉伯糖,⑶P-阿拉伯糖,UDP-鼠李糖,ADP-鼠李糖,TDP-鼠李糖, CDP-鼠李糖,GDP-鼠李糖,或其他核苷二磷酸己糖或核苷二磷酸戊糖,或其组合。
[0042] 在另一优选例中,所述的糖基供体包括尿苷二磷酸(UDP)糖,优选地,所述的糖基 供体选自下组:UDP-葡萄糖,UDP-半乳糖醛酸,UDP-半乳糖,UDP-阿拉伯糖,UDP-鼠李糖, 或其他尿苷二磷酸己糖或尿苷二磷酸戊糖,或其组合。
[0043] 在另一优选例中,反应体系的pH为:pH4. 0-10. 0,优选pH为6. 0-8. 5。
[0044] 在另一优选例中,反应体系的温度为:10°C _105°C,优选25°C -35°C。
[0045] 在另一优选例中,所述的突变蛋白选自:
[0046] (al)SEQ ID N0. :13 所示的序列;或
[0047] (bl)SEQ ID N0. : 13所示的序列经过一个或多个(优选为1-50个,较佳地,为1-20 个,更佳地,为1-10个,如1、2、3、4、5、6、7、8、9或10个)氨基酸的取代、添加和/或缺失后, 并保留糖基转移酶催化活性的突变蛋白。
[0048] 在另一优选例中,所述的取代为1-50个保守氨基酸的取代,为1-20个,更佳地,为 1-10 个,如 1、2、3、4、5、6、7、8、9 或 10 个。
[0049] 在另一优选例中,所述的缺失为C端1-5个氨基酸的缺失,较佳地为2-4个氨基酸 的缺失。
[0050] 在另一优选例中,所述的突变蛋白序列如SEQ ID NO. :6-8所示。
[0051] 在另一优选例中,当所述突变蛋白的C端缺失1-5个氨基酸后,其表达量比SEQ ID N0. : 13所示的蛋白提高了至少50%,更佳地为70%-100%。
[0052] 在另一优选例中,所述的添加为添加标签序列、信号序列或分泌信号序列。
[0053] 在另一优选例中,所述的突变蛋白还含有以下一个或多个氨基酸:
[0054] 第10位氨基酸为V ;
[0055] 第13位氨基酸为F ;
[0056] 第82位氨基酸为C ;和
[0057] 第186位氨基酸为L。
[0058] 本发明第二方面,提供了一种多核苷酸,所述的多核苷酸编码本发明第一方面所 述的突变蛋白。
[0059] 在另一优选例中,所述的多核苷酸序列如SEQ ID N0. : 19和21所示,分别编码SEQ ID N0. : 13和16所示的序列。
[0060] 本发明第三方面,提供了一种载体,所述的载体含有本发明第二方面所述的多核 苷酸。
[0061] 在另一优选例中,所述载体包括表达载体、穿梭载体、整合载体。
[0062] 本发明第四方面,提供了一种宿主细胞,所述的宿主细胞含有本发明第三方面所 述的载体,或其基因组中整合有本发明第二方面所示的多核苷酸。
[0063] 在另一优选例中,所述的宿主细胞为真核细胞,如酵母细胞或植物细胞。
[0064] 在另一优选例中,所述的宿主细胞为原核细胞,如大肠杆菌。
[0065] 在另一优选例中,所述的宿主细胞为人参细胞。
[0066] 本发明第五方面,提供了一种改造糖基转移酶的方法,包括步骤:
[0067] (i)将所述糖基转移酶与SEQ ID N0. : 13所示的序列进行同源性比对;
[0068] (ii)筛选出步骤(i)中与SEQ ID N0. : 13所示序列同源性至少为80%的序列;较 佳地至少为85% -90 %,更佳地至少为95 %,最佳地至少为98% ;
[0069] (iii)对步骤(ii)中筛选出的序列进行改造,改造后的糖基转移酶含有以下核心 氨基酸:
[0070] 第142位氨基酸为A ;
[0071 ] 第144位氨基酸为Η或F ;和
[0072] 第339位氨基酸为G ;
[0073] 其中,所述氨基酸位置编号基于SEQ ID Ν0. : 13所示的序列,
[0074] 且所述的核心氨基酸至少有一个是经人为改造的。
[0075] 在另一优选例中,所述改造后的糖基转移酶还含有以下核心氨基酸:
[0076] 第10位氨基酸为V ;
[0077] 第13位氨基酸为F ;
[0078] 第82位氨基酸为C ;和/或
[0079] 第186位氨基酸为L ;
[0080] 在另一优选例中,所述改造后的糖基转移酶C末端缺失了 1-5个氨基酸。
[0081] 本发明第六方面,提供了本发明第一方面所述的突变蛋白的用途,所述的突变蛋 白用于催化以下一种或多种反应,或被用于制备催化以下一种或多种反应的催化制剂:
[0082] (a)将来自糖基供体的糖基转移到四环三萜类化合物的C-20位的羟基;
[0083] (b)将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的羟基。
[0084] 在另一优选例中,所述的突变蛋白用于催化下述一种或多种反应或被用于制备催 化下述一种或多种反应的催化制剂:
[0085] 本发明第七方面,提供了一种进行糖基催化反应的方法,包括步骤:在本发明第一 方面所述突变蛋白的存在下,进行糖基化反应。
[0086] 在另一优选例中,所述的糖基化反应包括在本发明第一方面所述突变蛋白的存在 下,将糖基供体转移到四环三萜类化合物的以下位点上:
[0087] C-20位和/或C-6位,从而形成糖基化的四环三萜类化合物。
[0088] 在另一优选例中,所述的糖基催化反应的底物包括达玛烷型四环三萜类化合物、 羊毛脂烷型四环三萜类化合物、甘遂烷型四环三萜类化合物、环阿屯烷(环阿尔廷烷)型四 环三萜类化合物、葫芦烷四环三萜类化合物、或楝烷型四环三萜类化合物。
[0089] 本发明第八方面,提供了一种提高糖基转移酶表达量的方法,包括步骤:
[0090] (i)将所述糖基转移酶与SEQ ID N0. : 13所示的序列进行同源性比对;
[0091] (ii)筛选出步骤(i)中与SEQ ID N0. : 13所示序列同源性至少为80%的序列;较 佳地至少为85% -90 %,更佳地至少为95 %,最佳地至少为98% ;
[0092] (iii)对步骤(ii)中筛选出的序列进行C端1-5个氨基酸的缺失。
[0093] 本发明第九方面,提供了本发明第四方面所述宿主细胞的用途,用于制备糖基转 移酶,或作为催化细胞、或生产糖基化后的四环三廠类化合物。
[0094] 本发明第十方面,提供了一种产生转基因植物的方法,包括步骤:将本发明第四方 面所述的宿主细胞再生为植物,其中,所述的宿主细胞为植物细胞。
[0095] 本发明第十一方面,提供了一种糖基转移酶的突变蛋白,所述的突变蛋白为非天 然蛋白,且所述突变蛋白具有糖基转移酶催化活性,并且所述突变蛋白含有与酶催化活性 相关的以下核心氨基酸:
[0096] 第82位氨基酸为C ;和/或
[0097] 第144位氨基酸为F
[0098] 其中,所述氨基酸位置编号基于SEQ ID N0. :11所示的序列,且所述的糖基转移酶 催化活性包括将来自糖基供体的糖基转移到四环三萜类化合物的C-20位以及C-6位的羟 基。
[0099] 在另一优选例中,本发明第十一方面所述的突变蛋白与SEQ ID N0. : 11所示序列 同源性至少为90%,较佳地至少为95%,更佳地至少为98%。
[0100] 在另一优选例中,本发明第十一方面所述的突变蛋白除82、和/或144位氨基酸 外,其余氨基酸与SEQ ID N0. : 11所示的序列相同或基本相同。
[0101] 在另一优选例中,所述的基本相同是至多有50个(较佳地为1-20个,更佳地为 1-10个)氨基酸不相同,其中,所述的不相同包括氨基酸的取代、缺失或添加,且所述的突 变蛋白具有将来自糖基供体的糖基转移到四环三萜类化合物的c-20位的羟的糖基转移酶 活性。
[0102] 本发明第十二方面,提供了一种糖基转移酶的突变蛋白,所述的突变蛋白为非天 然蛋白,且所述突变蛋白具有糖基转移酶催化活性,并且所述突变蛋白含有与酶催化活性 相关的以下核心氨基酸:
[0103] 第142位氨基酸为A ;
[0104] 第186位氨基酸为L;和
[0105] 第338位氨基酸为G
[0106] 其中,所述氨基酸位置编号基于SEQ ID N0. :16所示的序列,且所述的糖基转移酶 催化活性包括将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的羟基。
[0107] 在另一优选例中,本发明第十二方面所述的突变蛋白与SEQ ID N0. : 16所示序列 同源性至少为90%,较佳地至少为95%,更佳地至少为98%。
[0108] 在另一优选例中,本发明第十二方面所述的突变蛋白除142、186、338位氨基酸 外,其余氨基酸与SEQ ID N0. : 16所示的序列相同或基本相同。
[0109] 在另一优选例中,所述的基本相同是至多有50个(较佳地为1-20个,更佳地为 1-10个)氨基酸不相同,其中,所述的不相同包括氨基酸的取代、缺失或添加,且所述的突 变蛋白具有将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的羟的糖基转移酶 活性。
[0110] 应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具 体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在 此不再一一累述。
【附图说明】
[0111] 图1.五个糖基转移酶的氨基酸序列比对。
[0112] 图2.五个糖基转移酶体外催化的HPLC图。l,UGTPgl催化PPT ;2, UGTPglOO催化 PPT ;3, UGTPglOl 催化 PPT ;4, UGTPgl02 催化 PPT ;5, UGTPgl03 催化 PPT ;6, pET28a 空载体作 为 control ;7, UGTPglOl 催化 F1 ;8, UGTPglOl 催化 Rhl。
[0113] 图3.决定糖基转移酶UGTPgl和UGTPgl02催化C20-OH糖基化的关键氨基酸 位点。HPLC 图如下:1,UGTPgl 催化 PPT ;2, UGTPgl02 催化 PPT ;3, UGTPgl-L38F 催化 PPT ;4, UGTPgl-A40S 催化 PPT ;5, UGTPgl-F85L 催化 PPT ;6, UGTPgl-T134I 催化 PPT ;7, UGTPgl-H144Y 催化 PPT ;8, UGTPgl-Q388H 催化 PPT ;9, UGTPgl02-Y144H 催化 PPT。
[0114] 图4.决定糖基转移酶UGTPglOO和UGTPgl03催化C6-OH糖基化的关键氨基酸位 点。HPLC 图如下:1,UGTPglOO 催化PPT ;2,UGTPgl03 催化PPT ;3,UGTPg100 -A142T 催化 PPT ; 4,UGTPg100 -L186S 催化 PPT ;5,UGTPg100 -W205R 催化 PPT ;6,UGTPg100 -G338R 催化 PPT ;7, UGTPgl03-T142A 催化 PPT ;8, UGTPgl03-T142A/S186L 催化 PPT ;9, UGTPgl03-T142A/S186L/ G338R 催化 PPT。
[0115] 图5.改变UGTPgl底物区域特异性的关键氨基酸位点。HPLC图如下:1,UGTPgl 催化 PPT ;2, UGTPglOO 催化 PPT ;3, UGTPgl-A10V 催化 PPT ;4, UGTPgl-I13F 催化 PPT ;5, UGTPgl-H82C 催化 PPT ;6, UGTPgl-H144F 催化 PPT。
[0116] 图6.截短UGTPgl,UGTPglOO和UGTPglOl的C末端氨基酸增强其在大肠杆菌中的 可溶表达量。A,野生型UGTs以及C末端截短后的UGTs在大肠杆菌中表达后细胞裂解液上 清的168七6?1131〇102,04,05分别表示(:末端截短2,4,5个氨基酸。8,野生型1^了8以及 C末端截短后的UGTs催化PPT的TLC图。
【具体实施方式】
[0117] 通过广泛而深入的研究,本发明人通过同源比对、定点突变等方式确定了糖基转 移酶催化C-6或C-20的羟基糖基化的关键氨基酸位点。本发明发现,对糖基转移酶中的关 键位点进行改造后,可以改变原本无活性或活性较差的酶,或者赋予新的酶活性。此外,本 发明人还发现,对本发明糖基转移酶进行末端截短后,其表达量具有明显的上升。在此基础 上,完成了本发明。
[0118] 本发明突变蛋白及其编码核酸
[0119] 如本文所用,术语"突变蛋白"、"本发明突变蛋白"、"本发明糖基转移酶"均指非天 然存在的糖基转移酶突变蛋白,且所述突变蛋白为SEQ ID N0. : 13 (或SEQ ID N0. : 16)所 示蛋白,或基于SEQ ID N0. : 13 (或SEQ ID N0. : 16)所示蛋白进行人工改造的蛋白,其中, 所述的突变蛋白含有与酶催化活性相关的核心氨基酸,且所述核心氨基酸中至少有一个是 经过人工改造的;并且本发明突变蛋白具有催化以下一种或多种反应的糖基转移酶活性:
[0120] (a)将来自糖基供体的糖基转移到四环三萜类化合物的C-20位的羟基;
[0121] (b)将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的羟基。
[0122] 如非特别说明,本文所说的人参皂苷和皂苷元,是的C20位S构型的人参皂苷和皂 苷元。
[0123] 术语"核心氨基酸"指的是基于SEQ ID N0. : 13 (或SEQ ID N0. : 16),且与SEQ ID NO. :13(或 SEQ ID NO. :16)同源性达至少 80%,如 84%、85%、90%、92%、95%、98% 的序 列中,相应位点是本文所述的特定氨基酸,如基于SEQ ID N0. :13所示的序列,核心氨基酸 为:
[0124] 第142位氨基酸为A ;
[0125] 第144位氨基酸为Η或F ;和
[0126] 第339位氨基酸为G,且含有所述核心氨基酸的突变蛋白具有将来自糖基供体的 糖基转移到四环三萜类化合物的C-20位的羟基的催化活性。
[0127] 又如基于SEQ ID Ν0. : 16所示的序列,核心氨基酸为:
[0128] 第142位氨基酸为A ;
[0129] 第186位氨基酸为L ;和
[0130] 第338位氨基酸为G,且含有所述核心氨基酸的突变蛋白具有将来自糖基供体的 糖基转移到四环三萜类化合物的C-6位的羟基的催化活性。
[0131] 应理解,本发明突变蛋白中的氨基酸编号基于SEQ ID N0. : 13 (或SEQ ID N0. : 16) 作出,当某一具体突变蛋白与SEQ ID NO. :13(或SEQ ID NO. :16)所示序列的同源性达到 80%或以上时,突变蛋白的氨基酸编号可能会有相对于SEQ ID NO. :13(或SEQ ID NO. :16) 的氨基酸编号的错位,如向氨基酸的N末端或C末端错位1-5位,而采用本领域常规的序列 比对技术,本领域技术人员通常可以理解这样的错位是在合理范围内的,且不应当由于氨 基酸编号的错位而使同源性达80% (如90%、95%、98%)的、具有相同或相似糖基转移酶 活性的突变蛋白不在本发明突变蛋白的范围内。
[0132] 本发明突变蛋白是合成蛋白或重组蛋白,即可以是化学合成的产物,或使用重组 技术从原核或真核宿主(例如,细菌、酵母、植物)中产生。根据重组生产方案所用的宿主, 本发明的突变蛋白可以是糖基化的,或可以是非糖基化的。本发明的突变蛋白还可包括或 不包括起始的甲硫氨酸残基。
[0133] 本发明还包括所述突变蛋白的片段、衍生物和类似物。如本文所用,术语"片段"、 "衍生物"和"类似物"是指基本上保持所述突变蛋白相同的生物学功能或活性的蛋白。
[0134] 本发明的突变蛋白片段、衍生物或类似物可以是(i)有一个或多个保守或非保守 性氨基酸残基(优选保守性氨基酸残基)被取代的突变蛋白,而这样的取代的氨基酸残基 可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团 的突变蛋白,或(iii)成熟突变蛋白与另一个化合物(比如延长突变蛋白半衰期的化合物, 例如聚乙二醇)融合所形成的突变蛋白,或(iv)附加的氨基酸序列融合到此突变蛋白序列 而形成的突变蛋白(如前导序列或分泌序列或用来纯化此突变蛋白的序列或蛋白原序列, 或与抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于 本领域熟练技术人员公知的范围。本发明中,保守性替换的氨基酸最好根据表1进行氨基 酸替换而产生。
[0135] 表1
[0136]
[0137] 在本发明的活性突变蛋白具有糖基转移酶活性,并且能够催化以下一种或多种反 应:
[0138] (A)
[0139]
[0140] 其中,所述式(I)化合物是原人参三醇(protopanaxatriol),式(II)化合物为人 参阜苷 F1 (2〇-〇- β -D-glucopyranosy 1-20 (S) -protopanaxatriol),所述的突变蛋白包括 SEQ ID NO. :6-7,9-13 ;
[0141] (B)
[0142]
[0143] 其中,所述式(I)化合物是原人参三醇(protopanaxatriol),式(III)化合物为人 参阜苷 Rhl (6-〇- β -D-glucopyranosyl-20 (S) -protopanaxatriol);或
[0144]
[0145] 式(II)化合物是人参阜苷 F1 (2〇-〇- β -D-glucopyranosyl-20 (S) -protopanaxat riol),式(IV)化合物是人参阜苷 Rgl (6-〇- β - (D-glucopyranosyl) -2〇-〇- β - (D-glucopy ranosyl)-protopanaxatriol);
[0146] 所述的突变蛋白包括 SEQ ID NO. :6、8、11_12、16 ;
[0147] (C) 「01481
[0149] 其中,所述式(I)化合物是原人参三醇(protopanaxatriol),所述式(II)化合物 是人参阜苷 F1 (2〇-〇- β -D-glucopyranosyl-20 (S) -protopanaxatriol),式(IV)化合物为 人参阜苷 Rgl (6-〇- β - (D-glucopyranosyl) -2〇-〇- β - (D-glucopyranosyl) -protopanaxat riol),所述的突变蛋白包括SEQ ID NO. :6、11-12 ;
[0150] (D)
[0151]
[0152] 其中,所述式(I)化合物是原人参三醇(protopanaxatriol),所述式(II)化合物 是人参阜苷 F1 (2〇-〇- β -D-glucopyranosyl-20 (S) -protopanaxatriol),式(III)化合物 为人参阜苷 Rhl (6-〇- β -D-glucopyranosyl-20 (S) -protopanaxatriol),所述的突变蛋白 包括 SEQ ID NO. :11-12。
[0153] 通常,除了具有上述核心氨基酸以外,本发明突变蛋白还可以具有以下一个或多 个氨基酸:
[0154] 第10位氨基酸为V;
[0155] 第13位氨基酸为F;
[0156] 第82位氨基酸为C;和
[0157] 第186位氨基酸为L。
[0158] 优选地,所述的突变蛋白如SEQ ID N0. :9-13、16所示,且所述的突变蛋白不是SEQ ID NO. :1_3所示的序列。
[0159] 本发明突变蛋白还包括将具有糖基转移酶活性的突变蛋白经C末端缺失(截短) 后的突变蛋白,例如SEQ ID NO. :6-8所示的序列。
[0160] 应理解,本发明突变蛋白与SEQ ID N0. : 13所示的序列相比,通常具有较高的同源 性(相同性),优选地,所述的突变蛋白与SEQ ID N0. : 13所示序列的同源性至少为80%, 较佳地至少为85% -90%,更佳地至少为95%,最佳地至少为98%。
[0161] 此外,还可以对本发明突变蛋白进行修饰。修饰(通常不改变一级结构)形式包 括:体内或体外的突变蛋白的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些 在突变蛋白的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的突变蛋白。这种 修饰可以通过将突变蛋白暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶) 而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨 酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的突变蛋白。
[0162] 术语"编码突变蛋白的多核苷酸"可以是包括编码本发明突变蛋白的多核苷酸,也 可以是还包括附加编码和/或非编码序列的多核苷酸。
[0163] 本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多 肽或突变蛋白的片段、类似物和衍生物。这些核苷酸变异体包括取代变异体、缺失变异体和 插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多 个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的突变蛋白的功能。
[0164] 本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少 70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件(或严紧条件)下 与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,"严格条件"是指:(1)在较低离子 强度和较高温度下的杂交和洗脱,如〇. 2XSSC,0. 1% SDS,60°C;或(2)杂交时加有变性剂, 如50% (v/v)甲酰胺,0. 1%小牛血清/0. l%Ficoll,42°C等;或(3)仅在两条序列之间的 相同性至少在90%以上,更好是95%以上时才发生杂交。
[0165] 本发明的突变蛋白和多核苷酸优选以分离的形式提供,更佳地,被纯化至均质。
[0166] 本发明多核苷酸全长序列通常可以通过PCR扩增法、重组法或人工合成的方法获 得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设 计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模 板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次 扩增出的片段按正确次序拼接在一起。
[0167] 一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将 其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
[0168] 此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通 过先合成多个小片段,然后再进行连接可获得序列很长的片段。
[0169] 目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生 物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载 体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
[0170] 应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的多核苷酸。特别是很 难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于 PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用 常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
[0171] 野生型糖基转移酶
[0172] 在本发明中,自糖基转移酶中筛选出具有C20-OH、C6-OH糖基化活性的系列基因 进行研究。其中:
[0173] UGTPglOl基因具有序列表中SEQ ID N0:17的核苷酸序列。自SEQ ID N0:17的 5'端第1-1428位核苷酸为UGTPgl的开放阅读框,自SEQ ID NO: 17的5'端的第1-3位核 苷酸为UGTPgl基因的起始密码子ATG,自SEQ ID N0:17的5'端的第1426-1428位核苷酸 为UGTPgl基因的终止密码子TAA。糖基转移酶基因 UGTPgl编码一个含有475个氨基酸的 蛋白质UGTPgl,具有SEQ ID NO: 1的氨基酸残基序列,用软件预测到该蛋白质的理论分子量 大小为53. 4kDa,等电点pi为5. 01。自SEQ ID NO: 1的氨基端的第344位氨基酸至第387 位氨基酸为植物小分子糖基化修饰的糖基转移酶的保守PSPG基序。
[0174] UGTPgl基因具有序列表中SEQ ID N0:18的核苷酸序列。自SEQ ID N0:18的5'端 第 1-1428 位核苷酸为 UGTPgl 的开放阅读框(Open Reading Frame, 0RF),自 SEQ ID N0:18 的5'端的第1-3位核苷酸为UGTPgl基因的起始密码子ATG,自SEQ ID NO: 18的5'端的第 1426-1428位核苷酸为UGTPgl基因的终止密码子TAA。糖基转移酶基因 UGTPgl编码一个含 有475个氨基酸的蛋白质UGTPgl,具有SEQ ID N0:的氨基酸残基序列,用软件预测到该蛋 白质的理论分子量大小为53. 4kDa,等电点pi为5. 14。自SEQ ID N0:2的氨基端的第344 位氨基酸至第387位氨基酸为为植物小分子糖基化修饰的糖基转移酶的保守PSPG(Plant Secondary Product Glycosyltransferase)基序。
[0175] UGTPgl02基因具有序列表中SEQ ID N0:19的核苷酸序列。自SEQ ID N0:19的 5'端第1-1428位核苷酸为UGTPgl的开放阅读框,自SEQ ID NO: 19的5'端的第1-3位核 苷酸为UGTPgl基因的起始密码子ATG,自SEQ ID N0:19的5'端的第1426-1428位核苷酸 为UGTPgl基因的终止密码子TAA。糖基转移酶基因 UGTPgl编码一个含有475个氨基酸的 蛋白质UGTPgl,具有SEQ ID N0:3的氨基酸残基序列,用软件预测到该蛋白质的理论分子量 大小为53. 6kDa,等电点pi为5. 08。自SEQ ID N0:3的氨基端的第344位氨基酸至第387 位氨基酸为为植物小分子糖基化修饰的糖基转移酶的保守PSPG基序。
[0176] UGTPglOO基因具有序列表中SEQ ID N0:20的核苷酸序列。自SEQ ID N0:20的 5'端第1-1419位核苷酸为UGTPgl的开放阅读框,自SEQ ID NO:20的5'端的第1-3位核 苷酸为UGTPgl基因的起始密码子ATG,自SEQ ID N0:20的5'端的第1417-1419位核苷酸 为UGTPgl基因的终止密码子TAA。糖基转移酶基因 UGTPgl编码一个含有472个氨基酸的 蛋白质UGTPgl,具有SEQ ID N0:4的氨基酸残基序列,用软件预测到该蛋白质的理论分子 量大小为53. lkDa,等电点pi为5. 08。自SEQ ID N0. :4的氨基端的第343位氨基酸至第 386位氨基酸为为植物小分子糖基化修饰的糖基转移酶的保守PSPG基序。
[0177] UGTPgl03基因具有序列表中SEQ ID N0:21的核苷酸序列。自SEQ ID N0:21的 5'端第1-1419位核苷酸为UGTPgl的开放阅读框,自SEQ ID NO:21的5'端的第1-3位核 苷酸为UGTPgl基因的起始密码子ATG,自SEQ ID N0:21的5'端的第1417-1419位核苷酸 为UGTPgl基因的终止密码子TAA。糖基转移酶基因 UGTPgl编码一个含有472个氨基酸的 蛋白质UGTPgl,具有SEQ ID N0:5的氨基酸残基序列,用软件预测到该蛋白质的理论分子 量大小为53. 2kDa,等电点pi为5. 23。自SEQ ID N0. : 5的氨基端的第343位氨基酸至第 386位氨基酸为为植物小分子糖基化修饰的糖基转移酶的保守PSPG基序。
[0178] 上述涉及的野生蛋白、本发明突变蛋白及其衍生蛋白的序列信息如表2所示:
[0179] 表 2
[0180]
[0182] 表达载体
[0183] 本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或本发明突变 蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
[0184] 通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重 组的突变蛋白。一般来说有以下步骤:
[0185] (1).用本发明的编码本发明突变蛋白的多核苷酸(或变异体),或用含有该多核 苷酸的重组表达载体转化或转导合适的宿主细胞;
[0186] (2).在合适的培养基中培养的宿主细胞;
[0187] (3).从培养基或细胞中分离、纯化蛋白质
[0188] 本发明中,编码突变蛋白的多核苷酸序列可插入到重组表达载体中。术语"重组 表达载体"指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒 如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以 用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
[0189] 本领域的技术人员熟知的方法能用于构建含本发明突变蛋白编码DNA序列和合 适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体 内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合 成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真 核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录 病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。 表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
[0190] 此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的 宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋 白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
[0191] 包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适 当的宿主细胞,以使其能够表达蛋白质。
[0192] 宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高 等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细 菌细胞;真菌细胞如酵母、植物细胞(如人参细胞)。
[0193] 本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将 会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用 于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基 对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
[0194] 本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
[0195] 用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原 核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaC12法处理, 所用的步骤在本领域众所周知。另一种方法是使用MgC12。如果需要,转化也可用电穿孔的 方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方 法如显微注射、电穿孔、脂质体包装等。
[0196] 获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用 的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下 进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导) 诱导选择的启动子,将细胞再培养一段时间。
[0197] 在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如 果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这 些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用 蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、 吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的 结合。
[0198] 本发明有益效果:
[0199] 经大量筛选和改造,本发明发现了糖基转移酶催化活性位点,改造了相关位点后, 能够将原本没有催化活性的糖基转移酶改造为具有活性的新蛋白,而对高度同源性的蛋白 进行关键位点改造后可以人为改变其底物专一性。此外,在进一步缺失了 C端数个氨基酸 后,还能够有效地提商突变蛋白的表达量。
[0200] 下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本 发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照 常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press, 1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否 则百分比和份数是重量百分比和重量份数。
[0201] 实施例 1.糖基转移酶 UGTPgl、UGTPglOl、UGTPgl02、UGTPglOO 和 UGTPgl03 在大 肠杆菌BL21 (DE3)中的表达与催化功能鉴定
[0202] 分别合成如SEQ ID N0:22和SEQ ID N0:23核苷酸序列的两条引物。在合成的 引物SEQIDN0:22和SEQIDN0:23两端分别设置BamHI和XhoI两个酶切位点,分别以 pMDT-UGTPgl、pMDT-UGTPgl01、pMDT-UGTPgl02、pMDT-UGTPg100 和 pMDT-UGTPgl03 为模板进 行 PCR。
[0203] PCR 扩增程序:94 °C 2min ;94 °C 15s,58 °C 30s,68 °C 1. 5min,共 35 个循环; 68°C 10min,降至10°C。PCR产物经琼脂糖凝胶电泳分离、回收后经BamHI和Xhol双酶切, 利用NEB公司的T4DNA连接酶连入同样经BamHI和Xhol双酶切的pET28a载体(Novagen 公司)中。
[0204] 所获得的重组质粒命名为 pET28a-UGTPgl、pET28a-UGTPgl01、pET28a-UGTPgl02、 pET28a-UGTPg100 和pET28a-UGTPgl03。将这些重组质粒分别转化大肠杆菌BL21 (DE3) (Novagen 公司)中构建重组菌 pET28a-UGTPgl-BL2l、pET28a-UGTPgl01-BL 2l、 pET28a-UGTPgl02-BL21、pET28a-UGTPg100 -BL21和 pET28a-UGTPgl03-BL21。
[0205] 分别从平板挑取这5个重组菌株单克隆接种至含有50 μ g/mL卡那霉素的LB试管 中37°C 200rpm震荡培养过夜,按1%的比例接种至50mL LB培养基中37°C 200rpm震荡培 养至0D600为0. 6-0. 8,冰水浴冷却菌液,加入终浓度为0.1 mM的IPTG,16°C下llOrpm诱导 18h。12000g,离心3min收集菌体,每克湿重菌体加入10mL PBS buffer(pH8. 0)重悬后裂 解菌体,12000g离心20min取上清作为粗酶液。同时诱导含有pET28a空载体的BL21菌株 pET28a-BL21制备粗酶液作为后续实施例的对照。
[0206] 糖基转移酶催化人参皂苷苷元合成稀有人参皂苷的反应体系如下:200 μ L的反 应液中包含PBS buffer(pH8. 0),5mM UDP-葡萄糖,0. 5mM原人参三醇(ΡΡΤ), 1%吐温-20 和150 μ L粗酶液。40°C水浴条件下反应4h,加入等体积的正丁醇终止反应并进行抽提,取 正丁醇相真空浓缩,产物溶解于甲醇中,HPLC结果如图2。
[0207] 结果显示UGTPgl催化PPT生成F1,即在C20-OH加上一个糖基;UGTPglOl催化PPT 的C20-OH糖基化先生F1,再在F1的C6-OH糖基化生成少量Rgl ;UGTPg100 催化PPT生成 Rhl,即在PPT的C6-OH加上一分子葡萄糖;而UGTPgl02和UGTPgl03没有检测到酶活性。
[0208] 实施例2.决定糖基转移酶UGTPgl和UGTPgl02催化C20-OH糖基化的关键氨基酸 位点
[0209] 通过SWISS-MODEL对UGTPgl进行蛋白质同源建模,并用PyMOL软件(DeLano Scientific)进行三维结构的分析。H15和D117是UGTPgl保守的催化活性位点,在这两个 位点附近找到了 6个UGTPgl和UGTPgl02不同的氨基酸位点,即UGTPgl的L38、A40、F85、 T134、H144 和 Q388,分别对应于 UGTPgl02 的 F38、S40、L85、I134、Y144 和 H388。将 UGTPgl 的这6个氨基酸分别突变为UGTPgl02对应的氨基酸,并在大肠杆菌BL21 (DE3)中进行表 达,测定酶活性。
[0210] 合成分别具有序列表中SEQ ID N0:24和SEQ ID N0:25核苷酸序列的两条引物。 以质粒 pET28a_UGTPgl 为模板,利用 Stratagen 公司的 QuickChange II site-directed mutagenesis kit进行UGTPgl的L38位点进行定点突变。PCR扩增程序为:95 °C 30s ; 95°C 30s,55°C lmin,68°C 7min,共 16 个循环;降至 10 °C。PCR 产物用 Dpnl 酶切,37°C水 浴反应2h,取10 μ L转化大肠杆菌TOP 10感受态。
[0211] 挑取单克隆并抽提质粒,测序验证突变位点,所获得的质粒命名为 pET28a-UGTPgl-L38F。将质粒 pET28a-UGTPgl-L38F 转化到大肠杆菌 BL21 (DE3), 构建重组菌株pET28a-UGTPgl-L38F-BL21,诱导表达的步骤同实施例1。同样,对 应构建 UGTPgl 突变后的重组质粒 pET28a-UGTPgl-A40S,pET28a-UGTPgl-F85L, pET28a-UGTPgl-T143I,pET28a-UGTPgl-H144Y 和 pET28a-UGTPgl-Q388H,并构建了 重组菌 株 pET28a-UGTPgl-A40S-BL21, pET28a-UGTPgl-F85L-BL21, pET28a-UGTPgl-T143I-BL21, pET28a-UGTPgl-H144Y-BL21 和 pET28a-UGTPgl-Q388H-BL21。定点突变的方法同上(点突 变引物序列分别为SEQ ID NO: 26-SEQ ID N0:35),诱导表达和酶活测定的方法同实施例1。
[0212] 结果显示:UGTPgl-L38F,UGTPgl-A40S,UGTPgl-F85L,UGTPgl-T143I 和 UGTPgl-Q388H仍具有催化C20-OH糖基化的酶活性,即催化PPT生成Fl,而UGTPgl-H144Y 没有检测到酶活性(图3)。结果表明,H144对于UGTPgl的催化功能非常重要。
[0213] 合成分别具有序列表中SEQ ID N0:36和SEQ ID N0:37核苷酸序列的两条引物。 以质粒 pET28a_UGTPgl02 为模板,利用 Stratagen 公司的 QuickChange II site-directed mutagenesis kit对UGTPgl02的Y144位点进行定点突变,构建了 UGTPgl02突变后的重组 质粒 pET28a-UGTPgl02-Y144H和重组菌株 pET28a-UGTPgl02-Y144H-BL21。定点突变的方法 同上,诱导表达和酶活测定的方法同实施例2。UGTPgl02-Y144H获得了催化C20-OH糖基化 的功能,即能够催化PPT生成F1 (图3)。
[0214] 结论:UGTPgl和UGTPgl02氨基酸序列的identity高达95. 4%,而UGTPgl具有 C20-OH糖基转移酶活性,UGTPgl02没有酶活性,而本实施例证明,是关键氨基酸的替换导 致UGTPgl02 了催化功能的丢失。
[0215] 实施例3.决定糖基转移酶UGTPglOO和UGTPgl03催化C6-OH糖基化的关键氨基 酸位点
[0216] UGTPglOO和UGTPgl03氨基酸序列的identity高达98. 7%,即两者之间仅有6 个氨基酸的差异。通过SWISS-MODEL对UGTPglOO进行蛋白质同源建模,并用PyMOL软件 (DeLano Scientific)进行三维结构的分析。H15和D117是UGTPglOO保守的催化活性位 点,在这两个位点附近找到了 2个UGTPglOO和UGTPgl03不同的氨基酸位点,即UGTPglOO 的A142和L186,分别对应于UGTPgl02的T142和S186。另外两个个氨基酸位点分别位于 C端和N端结构域,在UGTPglOO中为G338和W205,对应于UGTPgl03的R338和R205。将 UGTPglOO的这4个氨基酸分别突变为UGTPgl03对应的氨基酸,并在大肠杆菌BL21 (DE3)中 进行表达,测定酶活性。另外,有两个氨基酸没有仔细研究,因为他们氨基酸侧链的结构和 性质非常相似,相互替换可能对酶活的影响很小,即UGTPglOO中的V111和1349分别对应 于 UGTPgl03 中的 111 1 和 V349。
[0217] 以质粒 pET28a_UGTPg100 为模板,利用 Stratagen 公司的 QuickChange II site-directed mutagenesis kit 对 UGTPglOO 的 A142, L186, W205 和 G338 位点进行定点 突变,构建了 UGTPglOO 突变后的重组质粒 pET28a-UGTPg100 -A142T, pET28a-UGTPg100 -Ll 86S, pET28a-UGTPg100 -W205R 和 pET28a-UGTPg100 -G338R(点突变引物序列分别为 SEQ ID N0:38-SEQ ID N0:45),以及重组菌株pET28a-UGTPg100 -A142T-BL21,pET28a-UGTPg100 -Ll 86S-BL21, pET28a-UGTPg100 -W205-BL21 和 pET28a-UGTPg100 -G338R-BL21。定点突变的方 法同上,诱导表达和酶活测定的方法同实施例1。
[0218] 结果如图 4 所示,UGTPg100 -A142T, UGTPg100 -L186S 和 UGTPg100 -G338R 都失去了 C6-OH糖基转移酶的活性;而UGTPg100 -W205R仍然保留着酶活性。
[0219] 以质粒 pET28a_UGTPgl03 为模板,利用 Stratagen 公司的 QuickChange II site-directed mutagenesis kit 对 UGTPglOO 的 T142, S186 和 R338 位分别进行定 点突变(点突变引物序列分别为SEQ ID N0:46-SEQ ID勵:47),构建了呢了?8103突 变后的重组质粒 pET28a-UGTPgl03-T142A,pET28a-UGTPgl03-S186L 以及重组菌株 pET28a-UGTPgl03-T142A-BL21。定点突变的方法同上,诱导表达和酶活测定的方法同实施 例2。如图4, UGTPgl03-T142A并没有检测到酶活性。
[0220] 以质粒 pET28a-UGTPgl03-T142A 为模板,核苷酸序列 SEQ ID N0:48 和 SEQ ID N0:49为引物,利用Stratagen公司的QuickChange II site-directed mutagenesis kit对 pET28a-UGTPgl03-T142A的S186位点进行定点突变,构建了 UGTPgl03双突变后的重组质粒 pET28a-UGTPgl03-T142A-S 186L,以及重组菌株 pET28a-UGTPgl03-T142A-S186L-BL21。类 似地,构建了 UGTPgl03三突变的重组质粒pET28a-UGTPgl03-T142A-S186L-R338G,以及重 组菌株pET28a-UGTPgl03-T142A-S186L-R338G-BL21。定点突变的方法同上,诱导表达和酶 活测定的方法同实施例1。
[0221] 结果如图4, UGTPgl03-T142A-S186L也没有催化C6-OH糖基化的功能,而 UGTPgl03-T142A-S186L-R338G获得了催化C6-OH糖基化的功能,即能够催化PPT生成Rhl。
[0222] 结论:UGTPglOO和UGTPgl03氨基酸序列的identity高达98. 7%,即两者之间仅 有6个氨基酸的差异,而UGTPglOO具有C6-OH糖基转移酶活性,UGTPgl03没有酶活性,说 明关键氨基酸的替换导致UGTPgl03 了催化功能的丢失。
[0223] 实施例4.决定糖基转移酶UGTPgl和UGTPglOO底物区域专一性的关键氨基酸位 点和区域
[0224] UGTPgl 和 UGTPglOO 氨基酸序列的 identity 高达 84. 1 %,而 UGTPgl 具有 C20-OH 糖基转移酶活性,UGTPglOO具有C6-OH糖基转移酶活性,说明关键氨基酸的替换改变了其 底物专一性。通过SWISS-MODEL对UGTPgl和UGTPglOO进行蛋白质同源建模,并用PyMOL软 件(DeLano Scientific)进行三维结构的分析,如图。H15和D117是UGTPgl和UGTPglOO 保守的催化活性位点,在这两个位点附近找到了 4个UGTPgl和UGTPglOO不同的氨基酸位 点,8卩1^了?81的厶10、113、!182和!1144,分别对应于1^了?8100的¥10、?13、082和?144。将 UGTPgl的这4个氨基酸分别突变为UGTPglOO对应的氨基酸,并在大肠杆菌BL21 (DE3)中进 行表达,测定酶活性。
[0225] 合成分别具有序列表中 SEQ ID N0:52 和 SEQ ID N0:53, SEQ ID N0:54 和 SEQ ID N0:55,SEQ ID N0:56 和 SEQ ID N0:57,SEQ ID N0:58 和 SEQ ID N0:59 核苷酸序 列作为引物。以质粒pET28a_UGTPgl为模板,利用Stratagen公司的QuickChange II site-directed mutagenesis kit 对 UGTPgl 的 A10、113、H82 和 H144 位点进行定点 突变,构建了 UGTPgl 突变后的重组质粒 pET28a-UGTPgl-A10V、pET28a-UGTPgl-113F、 pET28a-UGTPgl-H82C 和 pET28a-UGTPgl-H144F,以及重组菌株 pET28a-UGTPgl-A10V-BL21、 pET28a-UGTPgl-I13F-BL21、pET28a-UGTPgl-H82C-BL21 和 pET28a-UGTPgl-H144F-BL21。 定点突变的方法同上,诱导表达和酶活测定的方法同实施例2。如图5, UGTPgl-AlOV, UGTPgl-I13F 和 UGTPgl-H82C 的 C20-OH 糖基转移酶的活性降低了;UGTPgl-H82C 和 UGTPgl-H144F获得了催化C6-OH糖基化的功能,但UGTPgl-H144F催化C6-OH糖基化的活性 很弱。
[0226] 实施例5.糖基转移酶UGTPgl,UGTPgl01和UGTPglOO的C末端截短促进可溶表达
[0227] 糖基转移酶UGTPgl,UGTPglOl和UGTPglOO在大肠杆菌中表达主要以包涵体的形 式存在,可溶表达量低。在N端截短5个氨基酸后,UGTPgl,UGTPglOl和UGTPglOO对于底 物PPT都没有酶活性。在C端截短5个氨基酸后,UGTPgl,UGTPglOl和UGTPglOO对于底物 PPT的酶活力降低,但可溶表达量却显著提高。在C端截短2个、4个氨基酸后,结果发现 UGTPgl和UGTPglOl的可溶表达量相对于野生型至少有50%提高(图6, A),但酶活力没有 明显改变(图6, B)。虽然在UGTPglOO的C末端截短2个、4个氨基酸后,其可溶表达量相 对于野生型也至少提高了 50%,但是其酶活力却显著降低(图6)。
[0228] 在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独 引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可 以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范 围。
【主权项】
1. 一种糖基转移酶的突变蛋白,其特征在于,所述的突变蛋白为非天然蛋白,且所述突 变蛋白具有糖基转移酶催化活性,并且所述突变蛋白含有与酶催化活性相关的W下核必氨 基酸: 第142位氨基酸为A ; 第144位氨基酸为H或F ;和 第339位氨基酸为G ; 其中,所述氨基酸位置编号基于SEQ ID NO. : 13所示的序列。2. 如权利要求1所述的突变蛋白,其特征在于,所述糖基转移酶催化活性包括催化W 下一种或多种反应: (a)将来自糖基供体的糖基转移到四环H聰类化合物的C-20位的居基; 化)将来自糖基供体的糖基转移到四环H聰类化合物的C-6位的居基。3. 如权利要求1或2所述的突变蛋白,其特征在于,所述的糖基转移酶催化活性包括催 化W下一种或多种反应: (A)其中,所述式(I)化合物是原人参H醇(protopanaxatriol),式(II)化合物为人参皂 巧 Fl (20-0-目-D-glucopyranos}d-20 (巧-protopanaxatriol),所述的突变蛋白包括沈Q ID NO. :6-7.9-13 ; (B)其中,所述式(I)化合物是原人参H醇(protopanaxatriol),式(III)化合物为人参皂 巧 Rhl(6-0- 0 -D-glucopyranosyl-20(S)-protopanaxatriol),;或式(II)化合物是人参皂巧 Fl (2〇-〇-目-D-glucopyranos}d-20 (巧-protopanaxatri 〇1),式(IV)化合物是人参皂巧 Rgl (6-0-目-(D-glucopyranos}d) -20-0-目-值-glucopyra nosyl)-protop曰n曰X曰triol); 所述的突变蛋白包括沈Q ID NO. :6、8、11-12、16; 脚其甲,所还巧(i)化含物是原人参兰醉化rotopanaxatrioi),所还巧(ii)化含物是 人参皂巧 Fl (2〇-〇-目-D-glucopyranos}d-20 (巧-protopanaxatriol),式(IV)化合物为人 参皂巧 Rgl (6-0- 0 -值-glucopyranosyl) -20-0- 0 -值-glucopyranosyl) -protopanaxatri 〇1),所述的突变蛋白包括沈Q ID NO. :6、11-12 ; 卿其中,所述式(I)化合物是原人参H醇(protopanaxatriol),所述式(II)化合物是人 参皂巧 Fl (20-0-目-D-glucopyranos}d-20(巧-protopanaxatriol),式(III)化合物为人 参皂巧化1 (6-〇-目-D-glucopyranos}d-20 (巧-protopanaxatriol),所述的突变蛋白包括 沈Q ID NO. :11-12。4. 如权利要求1所述的蛋白,其特征在于,所述的突变蛋白还含有W下一个或多个氨 基酸: 第10位氨基酸为V; 第13位氨基酸为F ; 第82位氨基酸为C ;和 第186位氨基酸为L。5. -种多核巧酸,其特征在于,所述的多核巧酸编码权利要求1-3任一所述的突变蛋 白。6. -种载体,其特征在于,所述的载体含有权利要求5所述的多核巧酸。7. -种宿主细胞,其特征在于,所述的宿主细胞含有权利要求6所述的载体,或其基因 组中整合有权利要求5所示的多核巧酸。8. -种改造糖基转移酶的方法,其特征在于,包括步骤: (i) 将所述糖基转移酶与SEQ ID NO. : 13所示的序列进行同源性比对; (ii) 筛选出步骤(i)中与SEQ ID NO. :13所示序列同源性至少为80%的序列;较佳地 至少为85% -90 %,更佳地至少为95 %,最佳地至少为98% ; (iii)对步骤(ii)中筛选出的序列进行改造,改造后的糖基转移酶含有W下核必氨基 酸: 第142位氨基酸为A ; 第144位氨基酸为H或F ;和 第339位氨基酸为G ; 其中,所述氨基酸位置编号基于SEQ ID NO. : 13所示的序列, 且所述的核必氨基酸至少有一个是经人为改造的。9. 权利要求1所述的突变蛋白的用途,其特征在于,所述的突变蛋白用于催化W下一 种或多种反应,或被用于制备催化W下一种或多种反应的催化制剂: (a)将来自糖基供体的糖基转移到四环H聰类化合物的C-20位的居基; 化)将来自糖基供体的糖基转移到四环H聰类化合物的C-6位的居基。10. -种进行糖基催化反应的方法,其特征在于,包括步骤:在权利要求1所述突变蛋 白的存在下,进行糖基化反应。11. 一种提高糖基转移酶表达量的方法,其特征在于,包括步骤: (i) 将所述糖基转移酶与SEQ ID NO. : 13所示的序列进行同源性比对; (ii) 筛选出步骤(i)中与SEQ ID NO. : 13所示序列同源性至少为80%的序列;较佳地 至少为85% -90 %,更佳地至少为95 %,最佳地至少为98% ; (iii) 对步骤(ii)中筛选出的序列进行C端1-5个氨基酸的缺失。12. 权利要求7所述宿主细胞的用途,其特征在于,用于制备糖基转移酶,或作为催化 细胞、或生产糖基化后的四环H聰类化合物。13. -种产生转基因植物的方法,其特征在于,包括步骤;将权利要求7所述的宿主细 胞再生为植物,其中,所述的宿主细胞为植物细胞。
【文档编号】C12N5/10GK105985938SQ201510051992
【公开日】2016年10月5日
【申请日】2015年1月30日
【发明人】周志华, 魏维, 严兴, 王平平, 魏勇军, 杨成帅
【申请人】中国科学院上海生命科学研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1