一种嗜低温蛋白酯酶E10及其表达纯化、晶体结构和应用的制作方法

文档序号:11899138阅读:439来源:国知局
一种嗜低温蛋白酯酶E10及其表达纯化、晶体结构和应用的制作方法与工艺

本发明属于生物技术领域,具体涉及一种来源于海洋细菌蛋白酯酶及其表达纯化、晶体结构以及在手性药物前体筛选以及制备工业酶制剂中的应用。



背景技术:

酯酶(esterase EC 3.1.1.1)是一类能够将脂类通过化学反应分解为酸和醇的水解酶类。酯酶通常存在一个由丝氨酸、组氨酸和天冬氨酸三个氨基酸残基组成的催化三角为其活性中心;其中,丝氨酸残基经常出现在GXSXG这样一个保守的五肽序列中。大部分酯酶催化反应时不需要辅助因子参与,并且对反应底物具有广泛性和一定的立体结构特异性,这些特性使其作为一种生物催化剂越来越受到人们关注。如今,酯酶作为一种环境友好、经济并且清洁的催化剂,在食品、造纸、精细化学合成以及医疗诊断等领域扮演着越来越重要的角色。工业上应用的酯酶主要来源于不同的生物体内,特别是来自于真菌和细菌,这主要是由于微生物来源的酯酶具有产量高、反应稳定、副产物毒性小及分子生物学操作简单等优点。

海洋来源的酯酶通常具有与海洋环境相关的优良性质,例如温度稳定性、耐盐性、耐碱性、耐低温、以及优异的手性选择性等等,因此,从海洋微生物中筛选出独具特性的酯酶就成了手性药物前体筛选及开发新型工业酶制剂的一个重要方向。本发明利用结晶的方法得到了酯酶E10的蛋白晶体并解析了其三维结构。E10晶体结构可在手性药物前体筛选、工业酶制剂中底物改造及提高酶活方面具有广泛的应用前景。



技术实现要素:

本发明的目的在于提供一种来源于海洋细菌的蛋白酯酶E10及其表达纯化、晶体结构和应用。

本发明包括提供对来源于海洋细菌Croceicoccus marinus E4A9T的酯酶E10进行基因工程改造,以获得在大肠杆菌中的高效表达、纯化和结晶的方法,以及所述酯酶E10第12位到第205位氨基酸的三维晶体结构及其在工业方面的应用。

本发明首先提供一种来源于海洋细菌Croceicoccus marinus E4A9T的酯酶E10,其含有205个氨基酸,分子量为22.36kDa;氨基酸序列如SEQ.ID.NO.1所示,核酸序列如SEQ.ID.NO.2所示。

本发明还对来源于海洋细菌Croceicoccus marinus E4A9T的酯酶E10进行基因工程改造,将其全长基因克隆在pSMT3的载体上。

本发明优先选择使用大肠杆菌的原核细胞表达系统(但不排除其他的表达系统,如在其它细菌或者其他的真核生物细胞中进行表达);对以上所述蛋白以融合蛋白的方式进行表达,优先选择了His标签得到了可溶性表达(但不排除其它标签,如MBP或GST等标签也有可溶性表达)。

本发明还提供一种表达和纯化来源于海洋细菌Croceicoccus marinus E4A9T的酯酶E10的方法,该方法包括:构建融合未突变的E10全长基因的重组载体,用该载体转化大肠杆菌,从而表达带有标签的融合蛋白E10,将上述获得的蛋白通过特异性的与所述特异标签识别的方法,优选Ni亲和层析(分离原理为:低咪唑浓度缓冲液进行上样,高咪唑浓度缓冲液进行洗脱)分离目的蛋白,再通过凝胶过滤层析的方法得到高纯度的E10的蛋白。

其中,扩增酯酶全基因的上游引物为:

E10F(5’-TCGCGGATCCGTGGCGGACGGCGAGGC-3’,BamHI)(SEQ.ID.NO.3)

下游引物为:

E10R(5’-TCCGCTCGAGCTAGAGGTCGTCGATCCTGTC-3’,XhoI);(SEQ.ID.NO.4)

表达质粒为pSMT3,转化方法为CaCl2转化法,转化菌株为大肠杆菌DH5α,表达菌株为大肠杆菌BL21(DE3)。

其中,所述Ni亲和层析的平衡缓冲液优先选择50mM Tris(pH 8.0),500mM NaCl,5%甘油,10mM咪唑,2mMβ-Me,0.2mM PMSF。所述Ni亲和层析洗脱缓冲液优先选择50mM Tris,pH 8.0,500mM NaCl,5%甘油,250mM咪唑,2mMβ-Me;所述凝胶过滤层析的缓冲液优先选择20mM Tris(pH7.4),100mM NaCl,2mM DTT。

本发明还提供对上述得到的酯酶E10进行结晶的方法,具体步骤为:将酯酶E10浓缩至浓度为10-40mg/ml,使用结晶试剂盒(来自Hampton Research等公司的Crystal Screen Kit I/II,Index,Salt,PEG/Ion等)作为晶体生长的初筛条件,采用悬滴气相扩散法进行结晶。温度为4-25摄氏度,优先选择使用18摄氏度。

结晶条件:采用悬滴气相扩散法进行结晶,结晶液滴中蛋白溶液与结晶试剂体积比在2:1至1:2的范围内,优选体积比为1:1,蛋白溶液中蛋白质浓度为20-30mg/ml,结晶条件为150mM乙酸钙,100mM咪唑(pH 8.5),10%PEG 8000。晶体培养在4至25摄氏度(优选18摄氏度)进行。

本发明还提供衍射性能良好的酯酶E10蛋白质的晶体。

本发明还提供酯酶E10(酯酶E10第12位到第205位氨基酸)的三维结构,该结构描述了酯酶E10的二级结构组成,肽链走向、组织模式以及三维分子构造。其中,针对酯酶E10蛋白进行衍射,得到酯酶E10蛋白的晶体衍射数据,以来源于细菌Pseudomonas aeruginosa的同源的GDSL家族酯酶TesA(PDB ID:4JGG)为模型进行结构解析,最终得到酯酶E10蛋白的三维结构。

在具体的实施方式中,提供了酯酶E10的晶体三维结构,其中,所述晶体三维结构中的原子具有表1中所列的至少一部分的原子坐标,或者任何与该坐标中至少40%氨基酸残基的主链碳骨架的原子三维坐标的平均根方差小于或等于的结构。

本发明获得了优选酯酶E10的晶体三维结构,分辨率为其晶体结构空间群为C2。晶胞参数为:α=γ=90.000°,β=99.055°。

本发明所述的酯酶E10或其可折叠部分的晶体结构,具有图1中列出的原子坐标(x,y,z)±(1.0,1.0,1.0)确定的三维结构。

在一具体的实施方式中,所述的酯酶E10的三维结构在一个晶体学不对称单位内有两个蛋白分子。该结构共由5个β折叠、9个α螺旋及3个310螺旋组成。

其中,所述的5个β折叠位于中心,所述的9个α螺旋围绕在β折叠的周围。其中,β折叠1,即含Ile21-Gly27的氨基酸区段;α螺旋1,即含Ser29-Ala32的氨基酸区段;310螺旋1,即含Arg38-Glu40的氨基酸区段;α螺旋2,即含Tyr42-Arg53的氨基酸区段;β折叠2,即含Val57-Gly63的氨基酸区段;α螺旋3,即含Thr69-Ser82的氨基酸区段;β折叠3,即含Leu89-Glu93的氨基酸区段;α螺旋4,即含Ala96-Arg101的氨基酸区段;α螺旋5,即含Ala105-Ser170的氨基酸区段,β折叠4,即含Val126-Tyr129的氨基酸区段;310螺旋2,即含Pro135-Leu137的氨基酸区段;α螺旋6,即含Gly139-Asp146的氨基酸区段;α螺旋7,即含Ser147-Tyr156的氨基酸区段;β折叠5,即含Glu159-Val161的氨基酸区段;α螺旋8,即含Ile165-Phe170的氨基酸区段;310螺旋3,即含Ala172-Leu174的氨基酸区段;α螺旋9,即含Ala184-Asp204的氨基酸区段。

本发明还提供酯酶E10发挥酯酶水解功能的作用机制。所述的酯酶E10的晶体结构,第29位丝氨酸(Ser29),第178位天冬氨酸(Asp178)与第181位组氨酸(His181)所构成的催化三连体组成活性中心。活性中心被一个咪唑分子占据,如图3所示。

所述酯酶E10的晶体结构,第29位丝氨酸(Ser29),第66位甘氨酸(Gly66)与第97位天冬酰胺(Asn97)所构成的氧离子通道。

本发明还提供该酯酶E10的三维结构在手性药物前体筛选、工业酶制剂中底物改造及提高酶活方面的应用。

附图说明

图1为酯酶E10的三维结构示意图。其中,(a)酯酶E10三维结构卡通示意图。A链用绿色表示,B链用青色表示,活性位点的氨基酸以棍状形式展示其所在位置;(b)酯酶E10活性位点示意图,颜色标记与(a)图相同,电子云密度level=1.0;(c)酯酶E10单体三维结构卡通示意图,α螺旋用蓝色标记,β折叠使用黄色标记,310螺旋用洋红色表示,无规则卷曲用绿色表示。

图2为酯酶E10的分子筛及SDS-PAGE检测结果。其中,上:E10分子筛结果示意图,使用的柱子为Superdex 200 10/300(GE,美国);下:E10分子筛洗脱样品的SDS-PAGE检测结果,左边泳道为蛋白Marker。

图3为活性中心的咪唑分子与周围氨基酸相互作用示意图。其中,A链用绿色表示,B链用青色表示,咪唑分子用紫色表示,电子云密度level=1.0。

具体实施方式

下面采用具体实施例进一步说明本发明的内容。

以下内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

实施例1.酯酶E10的表达纯化

来源于海洋细菌Croceicoccus marinus E4A9T的酯酶E10,其氨基酸序列如SEQ.ID.NO.1所示,核酸序列如SEQ.ID.NO.2所示。

通过分子克隆技术将酯酶E10的全长基因克隆到pSMT3的载体上,用来表达氨基末端融合6个His的融合蛋白,将重组载体转化到大肠杆菌BL21(DE3)中,37℃振荡培养至OD600达到0.8时加入终浓度为0.5mM的IPTG进行诱导表达,表达条件为:16℃振荡培养20h或20℃振荡培养16h或25℃振荡培养8h。

将构建好的重组表达载体转化到大肠杆菌BL21(DE3)中进行酯酶E10的可溶性表达。将以50μg/ml卡那霉素和34μg/ml氯霉素为选择压力,转接重组表达菌株于含有上述选择压力的LB液体培养基中,37℃振荡培养至OD600达到0.8时加入终浓度为0.5mM的IPTG进行诱导表达,优选表达条件为:16℃振荡培养20h。至OD600达到0.5-0.8时加入终浓度为0.5mM的IPTG进行诱导表达。16℃,200rpm振荡培养,20小时后通过离心收集细菌,用于纯化。

将离心收集的表达菌以适量缓冲液(50mM Tris(pH 8.0),500mM NaCl,5%甘油,10mM咪唑,2mMβ-Me,0.2mM PMSF)悬菌,使用低温超高压细胞破碎仪(广州聚能生物科技有限公司)裂解菌体,以18000rpm高速离心1h去除沉淀和其它颗粒状杂质。将离心后上清液与Ni-NTA亲和介质结合后,用50mM Tris(pH 8.0),500mM NaCl,5%甘油,50mM咪唑,2mMβ-Me的缓冲液冲洗介质,去除杂蛋白。最终用50mM Tris(pH 8.0),500mM NaCl,5%甘油,250mM咪唑,2mMβ-Me的洗脱液将目的蛋白从亲和介质上洗脱下来,以10KDa截留的浓缩管将洗脱液浓缩。将浓缩后的蛋白溶液进一步用凝胶过滤层析(superdex200,10/300)的方法纯化,使用的缓冲液为20mM Tris(pH7.4),100mM NaCl,2mM DTT。将洗脱下来的目的蛋白进行浓缩至浓度为20-30mg/ml,于-80℃保存,用于结晶实验。

实施例2.酯酶E10的结晶

将如上方法表达纯化好的酯酶E10浓缩至浓度约为10-30mg/ml,使用结晶试剂盒(来自Hampton Research等公司的Crystal Screen Kit I/II,Index,Salt,PEG/Ion等)作为晶体生长的初筛条件,采用悬滴气象扩散法进行结晶。本发明在多个不同的结晶试剂条件下获得了初始晶体。通过后期的优化调整,优选150mM乙酸钙,100mM咪唑(pH 8-8.5),10-20%PEG 8000的缓冲液作为晶体生长条件,收集到一套分辨率为的X射线衍射数据。

实施例3.酯酶E10的收据收集及结构解析

本发明将制备的晶体以25%的甘油作为防冻剂处理后,冻存于液氮中。晶体X射线衍射的数据收集在上海光源(SSRF)生物大分子晶体学光束线站(五线六站BL19U)进行。数据处理使用HKL3000,结构解析以来源于细菌Pseudomonas aeruginosa的同源的GDSL家族酯酶TesA(PDB ID:4JGG)为模型,采用分子置换法,利用Refmac程序并辅以Coot软件做进一步修正,最终解析得到酯酶E10蛋白的晶体结构。本领域的普通技术人员可知,于其中所述晶体三维结构中的原子具有表1中所列的至少40%的原子坐标,或者3D蛋白的晶体三维结构中至少40%氨基酸的主链碳骨架的原子结构坐标与表1中的坐标的平均根方差小于或等于的原子坐标,均可被认为与3D蛋白具有雷同结构。

具体而言,所述的酯酶E10的晶体三维结构,一个晶体学不对称单位内有两个不对称分子。由5个β折叠、9个α螺旋及3个310螺旋组成,其中,所述的5个β折叠位于中心,所述的9个α螺旋围绕在β折叠的周围。其中,β折叠1,即含Ile21-Gly27的氨基酸区段;α螺旋1,即含Ser29-Ala32的氨基酸区段;310螺旋1,即含Arg38-Glu40的氨基酸区段;α螺旋2,即含Tyr42-Arg53的氨基酸区段;β折叠2,即含Val57-Gly63的氨基酸区段;α螺旋3,即含Thr69-Ser82的氨基酸区段;β折叠3,即含Leu89-Glu93的氨基酸区段;α螺旋4,即含Ala96-Arg101的氨基酸区段;α螺旋5,即含Ala105-Ser170的氨基酸区段,β折叠4,即含Val126-Tyr129的氨基酸区段;310螺旋2,即含Pro135-Leu137的氨基酸区段;α螺旋6,即含Gly139-Asp146的氨基酸区段;α螺旋7,即含Ser147-Tyr156的氨基酸区段;β折叠5,即含Glu159-Val161的氨基酸区段;α螺旋8,即含Ile165-Phe170的氨基酸区段;310螺旋3,即含Ala172-Leu174的氨基酸区段;α螺旋9,即含Ala184-Asp204的氨基酸区段。

表1蛋白酯酶EST22晶体的原子坐标群如下:

晶体空间群:C2

晶胞参数为:α=γ=90.000°,β=99.055°。

I/σI:16.81

Rwork/Rfree分别为:0.157和0.192

分辨率范围98.5-1.9

数据完整性(%):98.38。

表1

SEQUENCE LISTING

<110> 复旦大学

<120> 一种嗜低温蛋白酯酶E10及其表达纯化、晶体结构和应用

<130> 001

<160> 4

<170> PatentIn version 3.3

<210> 1

<211> 205

<212> PRT

<213>

<400> 1

Met Ala Asp Gly Glu Ala Ala Gly Gln Gln Ala Asp Ala Val Met Pro

1 5 10 15

Thr Gly Pro Ala Ile Asp Val Leu Ala Phe Gly Asp Ser Leu Phe Ala

20 25 30

Gly Tyr Arg Leu Asp Arg Asp Glu Ser Tyr Pro Ala Arg Leu Gln Ala

35 40 45

Ala Leu Arg Glu Arg Gly Leu Asn Val Asn Val Thr Asn Ala Gly Val

50 55 60

Ser Gly Asp Thr Thr Ala Ala Gly Leu Gln Arg Ile Asp Phe Val Leu

65 70 75 80

Asp Ser Met Ala Gly Glu Pro Asp Leu Val Leu Leu Glu Leu Gly Ala

85 90 95

Asn Asp Met Leu Arg Gly Leu Pro Ala Glu Glu Ala Arg Arg Asn Leu

100 105 110

Asp Thr Ile Leu Gln Arg Leu Asp Gln Arg Asp Ile Pro Val Met Val

115 120 125

Tyr Gly Met Arg Ala Ala Pro Asn Leu Gly Gly Asp Tyr Gly Arg Ser

130 135 140

Phe Asp Ser Ile Phe Pro Asp Leu Ala Asp Lys Tyr Asp Ala Glu Leu

145 150 155 160

Val Pro Phe Phe Ile Glu Pro Leu Ile Phe Asp Arg Ser Leu Val Gln

165 170 175

Gln Asp Gln Leu His Pro Thr Ala Gln Gly Val Asp Ala Met Val Glu

180 185 190

Gln Thr Val Glu Gln Val Glu Asp Arg Ile Asp Asp Leu

195 200 205

<210> 2

<211> 618

<212> DNA

<213>

<400> 2

gtggcggacg gcgaggcggc gggtcagcag gccgatgcgg tcatgcccac cggccccgcc 60

atcgacgtgc tggcgttcgg cgacagcctg ttcgcgggat accggctgga ccgcgacgaa 120

tcctatcccg caaggcttca ggccgcgctg cgcgagcggg ggctgaacgt caatgtcacc 180

aacgccggag tatcgggcga taccacggcg gcggggctgc agcgcatcga cttcgtgctc 240

gattccatgg cgggagagcc cgatctggtg ctgctggaac tgggcgcgaa cgacatgctg 300

cgcggccttc cggccgagga agcgcggcgc aatctcgaca cgatcctgca gcggctcgac 360

cagcgcgaca tcccggtgat ggtctatggc atgcgcgccg cgcccaacct gggtggcgat 420

tacggccgca gcttcgacag catcttcccc gatctggccg acaaatacga tgccgaactc 480

gtgcccttct tcatcgagcc gctgatcttc gaccggtcgc tggtgcagca ggaccagctg 540

catcccacgg ctcagggcgt cgacgcgatg gtcgagcaga cggtcgagca ggtcgaggac 600

aggatcgacg acctctag 618

<210> 3

<211> 27

<212> DNA

<213>

<400> 3

tcgcggatcc gtggcggacg gcgaggc 27

<210> 4

<211> 31

<212> DNA

<213>

<400> 4

tccgctcgag ctagaggtcg tcgatcctgt c 31

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1