一种筛选酶切适配融合蛋白的方法及IGF-I制备方法与流程

文档序号:23384715发布日期:2020-12-22 13:49阅读:231来源:国知局
一种筛选酶切适配融合蛋白的方法及IGF-I制备方法与流程

本发明涉及重组蛋白生产技术领域,具体涉及一种节省人力物力和时间的筛选酶切适配融合蛋白的方法,以及一种igf-i的制备方法。



背景技术:

胰岛素样生长因子-i(igf-i)在细胞的生长、发育和增殖中具有重要作用,是一种多功能调控因子。目前,人igf-i在临床上已用于治疗糖尿病、胰岛素抵抗综合征、侏儒症及神经系统疾病等多种疾病,并取得了良好的效果。若igf-i在原核表达体系中直接表达,目标蛋白通常会形成包涵体,为了提高蛋白溶解度以及便于纯化,需要加入促溶标签和纯化标签进行融合表达;为得到目标蛋白,通常在促溶标签和纯化标签与目标蛋白之间插入一段蛋白酶酶切位点序列,以便于使用相应蛋白酶酶切除去标签,获得最终的目标蛋白。

常用的蛋白酶有肠激酶、凝血酶、xa因子、hrv3c蛋白酶(人鼻病毒3c蛋白酶)等,每一种蛋白酶对其切割位点前后的氨基酸序列都有一定的限制(例如:凝血酶的最佳酶切位点序列为lvpr↓gs,↓标示该蛋白酶在此处切割开相应多肽链,下同),而蛋白药物不允许在成熟肽之前存在多余氨基酸,这就需要选出与融合蛋白相适应的蛋白酶,以保证切割后得到的目标蛋白具有天然未附加氨基酸残基的n-末端和/或c-末端。在实际生产当中,通常需要表达并纯化出多种含不同蛋白酶酶切位点序列的融合蛋白,比较不同蛋白酶的酶切效率才能选定最佳的表达系统;并且,这个过程中还会出现以下情况:(1)由于酶切位点包裹在融合蛋白内部,蛋白酶无法切割融合蛋白;(2)融合蛋白本身含有蛋白酶的多个酶切位点,蛋白酶会非特异性切割融合蛋白,甚至切割目标蛋白。无论上述哪一种情况,都会浪费人力物力成本,延长研发周期,甚至导致项目终止。

所以,迫切需要一种快速高效的方法筛选出可以成功酶切的可溶表达体系,并顺利制备出重组人胰岛素样生长因子-i,以便进行大规模生产。



技术实现要素:

针对现有技术的以上缺陷或改进需求,本发明的一个目的是提供了一种筛选酶切适配融合蛋白的方法,采用虚拟筛选技术对蛋白酶酶切融合蛋白进行高效筛选,解决了以往用大量实验才能验证酶切效果的技术风险。

本发明的另一个目的是提供了一种胰岛素样生长因子-i的制备方法,通过上述虚拟筛选方法获得了酶切效果好的胰岛素样生长因子-i融合蛋白,并实现了融合蛋白的可溶表达和成功酶切,解决了重组人胰岛素样生长因子-i难于在大肠杆菌表达系统中稳定、可溶及高活性表达的技术难题。

下面详述本发明的技术方案:

一种筛选酶切适配融合蛋白的方法,包括以下步骤:

(1)将目标蛋白序列编码基因分别插入到多个不同的含蛋白酶酶切位点的表达载体中,获得多个不同融合蛋白的氨基酸序列;所得融合蛋白的氨基酸序列通过二级结构预测算法psipred进行二级结构预测;

(2)将步骤(1)中的不同融合蛋白氨基酸序列及其对应的二级结构预测结果作为输入文件,通过结构预测算法i-tasser预测三维结构;

(3)将步骤(2)所得的三维结构预测结果与该融合蛋白相对应的蛋白酶采用cluspro算法进行分子对接,选择对接结果正确比例超过阈值的酶切体系进行实验验证,筛选出蛋白酶最适配的融合蛋白。

上述筛选方法中,可以将候选蛋白酶均一一列出,分别得出与该蛋白酶对应的含目标蛋白及酶切位点的融合蛋白序列,根据蛋白酶数量,获得相应数量的融合蛋白。后续的二级结构预测算法psipred、三级结构预测算法i-tasser、分子对接算法cluspro均为现有已知技术,本领域技术人员可以根据各算法的指导说明进行操作。

优选的,上述方法中,还包括以下步骤:

(4)对步骤(3)所得的最适配的融合蛋白编码基因进行密码子优化。经过优化以后能够提高表达量。

优选的,上述方法中,所述目标蛋白为人胰岛素样生长因子-i。

优选的,上述方法中,所述蛋白酶为肠激酶、凝血酶或hrv3c蛋白酶,不同蛋白酶与其相对应的融合蛋白三维结构预测结果进行对接时,对接位点的选择如下:

肠激酶对应的融合蛋白选择氨基酸序列中所有赖氨酸(lys)及其左右各4个氨基酸作为候选酶切位点;

凝血酶对应的融合蛋白选择精氨酸(arg)及其左右各4个氨基酸作为候选酶切位点;

hrv3c蛋白酶对应的融合蛋白选择谷氨酰胺(gln)及其左右各4个氨基酸作为候选酶切位点。

优选的,上述方法中,步骤(3)中所述的阈值为50%。

一种重组人胰岛素样生长因子-i的制备方法,使用氨基酸序列如seqidno.1所示的融合蛋白,使用pet-32a(+)载体在原核宿主中进行表达,表达所得的融合蛋白使用凝血酶进行酶切。融合蛋白编码基因克隆入pet-32a(+)载体的msci和ecorv酶切位点之间。

优选的,上述igf-i制备方法中,seqidno.1所示融合蛋白的编码基因为:

(1)如seqidno.4所示的基因序列;或

(2)与seqidno.4所示的基因序列同源性在90%至100%之间编码相同功能蛋白质的基因序列;或

(3)seqidno.4所示的基因序列经增加、缺失或替换一个或多个密码子,编码具有同等活性的蛋白质,由(1)衍生的基因序列。

一种重组人胰岛素样生长因子-i的制备方法,使用氨基酸序列如seqidno.3所示的融合蛋白,使用pet-48b(+)载体在原核宿主中进行表达,表达所得的融合蛋白使用hrv3c酶进行酶切。融合蛋白编码基因克隆入pet-48b(+)载体的sacii和hindiii酶切位点之间。

优选的,上述igf-i制备方法中,seqidno.3所示融合蛋白对应的编码基因为:

(1)如seqidno.5所示的基因序列;

(2)与seqidno.5所示的基因序列同源性在90%至100%之间编码相同功能蛋白质的基因序列;或

(3)seqidno.5所示的基因序列经增加、缺失或替换一个或多个密码子,编码具有同等活性的蛋白质,由(1)衍生的基因序列。

优选的,以上任一所述的制备方法中,所述原核宿主为bl21(de3)大肠杆菌菌株、rosetta-gamib(de3)大肠杆菌菌株、origamib(de3)大肠杆菌菌株或rosetta-gami2(de3)大肠杆菌菌株。

与现有技术相比,本发明具有如下有益效果:

本发明提供的筛选酶切适配融合蛋白的方法,采用虚拟筛选手段,通过结构模拟和分子对接,可以虚拟比较各种蛋白酶的酶切效果,在实验之前就筛选出合适的融合蛋白表达体系和蛋白酶,并且经过实验验证后,与预测结果相符合,可以大大降低资金、人力和时间成本,相比于以往只能通过试验一个一个验证筛选的高投入方式更加方便高效。

本发明通过上述筛选方法,虚拟筛选获得凝血酶、肠激酶、hrv3c蛋白酶酶切效果,在实验验证后与预测结果相符,凝血酶、hrv3c蛋白酶及其对应的融合蛋白更适合用于制备igf-i,进而获得了适用于重组人胰岛素样生长因子-i的可以成功酶切的可溶表达体系。

本发明提供的重组人胰岛素样生长因子-i融合蛋白的制备方法,具有可溶性表达,表达量大等优点,并可以使用蛋白酶酶切成功获得重组人胰岛素样生长因子-i,其解决了人胰岛素样生长因子-i不能直接获得的技术问题。

附图说明

图1为psipred在线预测服务器输入界面;

图2为i-tasser在线预测服务器输入界面;

图3为cluspro在线预测服务器输入界面;

图4为大肠杆菌表达载体pet-32a(+)图谱;

图5为大肠杆菌表达载体pet-32a(+)的多克隆位点区域图谱;

图6为凝血酶融合蛋白的sds-page电泳分析图;

图7为凝血酶融合蛋白的westernblot免疫鉴别图谱;

图8为大肠杆菌表达载体pet-48b(+)图谱;

图9为大肠杆菌表达载体pet-48b(+)的多克隆位点区域图谱;

图10为hrv3c酶融合蛋白的westernblot免疫鉴别图谱;

图11为凝血酶融合蛋白经凝血酶酶切后的sds-page分析图;

图12为hrv3c酶融合蛋白经hrv3c酶酶切后的的westernblot免疫鉴别图谱;

图13为肠激酶融合蛋白的westernblot免疫鉴别图谱;

图14为肠激酶融合蛋白经肠激酶酶切后的sds-page电泳分析图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明的技术方案进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

发明人前期通过对蛋白质结构以及分子模拟方法的深入研究,成功实现了用多种结构预测算法提高蛋白质的热稳定性(li,etal.applenvironmicrob,2018,84(2),e02129-17;li,etal.rscadv,2018,8,1948)。本发明通过结构预测算法和分子对接算法,虚拟筛选出适合制备重组人胰岛素样生长因子-i的融合蛋白,并采用相应的蛋白酶成功酶切制备得到重组人胰岛素样生长因子-i。通过本发明的技术方案,能够实现igf-i在大肠杆菌表达系统中稳定、可溶及高活性的表达,使其产业化生产成为可能,有利于新药开发和临床应用。

关于实施例,应该指出,以下具体说明都是例示性的,旨在对本发明提供进一步的说明。除非特别指明,否则所用技术术语为本领域中的普通技术人员常用术语;未注明具体条件的实验方法是按常规实验方法;所用的试验材料如无特别说明均为市售购买产品,各种试剂及培养基的成分和配制方法可参见常规实验手册中的操作。

实施例1:融合蛋白氨基酸序列的获得

经文献报道,胰岛素样生长因子-i(igf-i)在大肠杆菌中直接表达会形成包涵体(rosanogl,etal.frontmicrobiol,2014,5:172),而添加促溶蛋白标签进行融合表达可以实现蛋白的可溶表达。目前,使用最为广泛的大肠杆菌表达载体为pet系统,其载体添加了thioredoxin(硫氧还蛋白)等促溶标签以及his-tag纯化标签,可以促进融合蛋白的可溶表达及纯化。

为了实现蛋白酶酶切融合蛋白后igf-i的n端无其他氨基酸,候选蛋白酶为凝血酶、factorxa、肠激酶、tev酶、hrv3c酶;考虑到用酶成本和获取难度,采用凝血酶、肠激酶、hrv3c酶进行模拟酶切实验。在不同的pet表达载体中,含有凝血酶、肠激酶和hrv3c酶的酶切位点,可以通过蛋白酶酶切获得目标蛋白。最终,确定了pet-32a(+)-凝血酶酶切位点-igf-i、pet-32a(+)-肠激酶酶切位点-igf-i、pet-48b(+)-hrv3c酶酶切位点-igf-i三种融合蛋白进行后续实验。

igf-i的氨基酸序列如seqidno.6所示:

gpetlcgaelvdalqfvcgdrgfyfnkptgygsssrrapqtgivdeccfrscdlrrlemycaplkpaksa。

将igf-i的氨基酸序列分别插入至pet-32a(+)载体的凝血酶酶切位点序列lvpr,肠激酶酶切位点ddddk序列,以及pet-48b(+)载体的hrv3c酶酶切位点levlfq序列之后,得到相应的融合蛋白氨基酸序列,即

凝血酶融合蛋白氨基酸序列seqidno.1:

msdkiihltddsfdtdvlkadgailvdfwaewcgpckmiapildeiadeyqgkltvaklnidqnpgtapkygirgiptlllfkngevaatkvgalskgqlkefldanlagsgsghmhhhhhhssglvprgpetlcgaelvdalqfvcgdrgfyfnkptgygsssrrapqtgivdeccfrscdlrrlemycaplkpaksa

肠激酶融合蛋白氨基酸序列seqidno.2:

msdkiihltddsfdtdvlkadgailvdfwaewcgpckmiapildeiadeyqgkltvaklnidqnpgtapkygirgiptlllfkngevaatkvgalskgqlkefldanlagsgsghmhhhhhhssglvprgsgmketaaakferqhmdspdlgtddddkgpetlcgaelvdalqfvcgdrgfyfnkptgygsssrrapqtgivdeccfrscdlrrlemycaplkpaksa

hrv3c酶融合蛋白氨基酸序列seqidno.3:

msdkiihltddsfdtdvlkadgailvdfwaewcgpckmiapildeiadeyqgkltvaklnidqnpgtapkygirgiptlllfkngevaatkvgalskgqlkefldanlagsgsghtsggggsnnnpptptpssgsghhhhhhsaalevlfqgpetlcgaelvdalqfvcgdrgfyfnkptgygsssrrapqtgivdeccfrscdlrrlemycaplkpaksa

实施例2融合蛋白二级结构预测

打开psipred在线预测服务器(http://bioinf.cs.ucl.ac.uk/psipred/),其页面如图1所示。将实施例1中所获得的氨基酸序列输入至“proteinsequence”空白栏当中,并填写jobname(任务名称)和email(电子邮件地址),提交任务后,预测结果的ss2文件会发送至指定邮箱当中。

实施例1中凝血酶融合蛋白二级结构预测结果如下,其中c代表无规则卷曲,s代表β折叠,h代表α螺旋:

cccccsscchhhhhhhhhhccccsssssscccchhhhhhhhhhhhhhhhhcccssssssscccccchhhhhccccccssssssccssssssscccchhhhhhhhhhhhcccccccccccccccccccccccccccchhhhhhhhhhhccccsssccccccccccccccccccccchhcccccssssssssccccccccc

实施例1中肠激酶融合蛋白二级结构预测结果如下:

cccccssccccchhhhhhcccccsssssccccchhhhhhhhhhhhhhhhhcccssssssscccccccccccccccccssssssccssssssscccchhhhhhhhhhhcccccccccccccccccccccccccchhhhhhhhhhhhcccccccccccccccccchhhhhhhhhhhhhccccsssccccccccccccccccccccchhccccccchhhhhcccccccccc

实施例1中hrv3c酶融合蛋白二级结构预测结果如下:

cccccssccccchhhhhhcccccsssssccccchhhhhhhhhhhhhhhhhcccssssssscccccccccccccccccssssssccssssssscccchhhhhhhhhhhhccccccccccccccccccccccccccccccccchhhhhhhhhcccccchhhhhhhhhhhhhccccsssccccccccccccccccccccchhccccccchhhhhcccccccccc

实施例3融合蛋白三维结构的预测

打开i-tasser在线预测服务器(https://zhanglab.ccmb.med.umich.edu/i-tasser/),其页面如图2所示。将融合蛋白的氨基酸序列输入序列框中,再点击“optioniii:specifysecondarystructureforspecificresidues”选项中的上传按钮,将实施例2中获得ss2文件上传。随后,填写电子邮箱地址和任务名称,提交预测任务。在任务结束后,即可收到预测得到的融合蛋白三维结构pdb文件。

实施例4融合蛋白与蛋白酶进行分子对接

打开cluspro在线预测服务器(https://cluspro.bu.edu/home.php),其页面如图3所示。点击“receptor”一栏中的“uploadpdb”按钮,上传实施例3中预测的融合蛋白pdb文件;再在“ligand”一栏中,分别将融合蛋白对应的蛋白酶pdbid填入,其中,凝血酶填写“1etr”、肠激酶填写“1ekb”、hrv3c酶填写“2in2”。

为了加快对接速度、提高对接准确度,在下面“attractionandrepulsion”选项中,在receptor对应的“attraction”空白栏中填入融合蛋白的候选酶切位点,在ligand对应的“attraction”空白栏中填入蛋白酶活性位点附近表面可能与融合蛋白接触的氨基酸残基位点。

凝血酶融合蛋白选择arg及其左右各4个氨基酸作为候选酶切位点,肠激酶融合蛋白选择氨基酸序列中所有lys及其左右各4个氨基酸作为候选酶切位点,hrv3c酶融合蛋白选择gln及其左右各4个氨基酸作为候选酶切位点;优选地,凝血酶融合蛋白进行对接的区域为seqidno.1序列中第49-57,66-78,93-101,125-133,146-154位;肠激酶融合蛋白进行对接的区域为seqidno.2序列中第1-8,15-23,33-41,49-62,66-75,79-105,130-144,154-162,181-189,219-228位;hrv3c酶融合蛋白进行对接的区域为seqidno.3序列中第47-55,59-67,95-103,147-155,162-170,187-195位。

凝血酶(pdbid:1etr)的氨基酸序列如seqidno.7所示:

tfgageadcglrplfekkqvqdqtekelfesyiegrivegqdaevglspwqvmlfrkspqellcgaslisdrwvltaahcllyppwdknftvddllvrigkhsrtryerkvekismldkiyihprynwkenldrdiallklkrpielsdyihpvclpdkqtaakllhagfkgrvtgwgnrretwttsvaevqpsvlqvvnlplverpvckastriritdnmfcagykpgegkrgdacegdsggpfvmkspynnrwyqmgivswgegcdrdgkygfythvfrlkkwiqkvidrlgs

其对接区域为第51-53,55-56,58-65,79-80,83,85-86,88,90,101,104-105,131-132,135,175-179,182-190,192,194,214-215,224-225,234-241,261-267,269,273-276位;

肠激酶(pdbid:1ekb)的氨基酸序列如seqidno.8所示:

cgkklvtqevspkivggsdsregawpwvvalyfddqqvcgaslvsrdwlvsaahcvygrnmepskwkavlglhmasnltspqietrlidqivinphynkrrknndiammhlemkvnytdyiqpiclpeenqvfppgricsiagwgaliyqgstadvlqeadvpllsnekcqqqmpeynitenmvcagyeaggvdscqgdsggplmcqennrwllagvtsfgyqcalpnrpgvyarvprftewiqsflh

其对接区域为第33,36-39,54-55,57-59,97,99-100,102,105,195-200,218-221,231-232位;

hrv3c酶(pdbid:2in2)的氨基酸序列如seqidno.9所示:

gpntefalsllrknimtittskgeftglgihdrvcvipthaqpgddvlvngqkirvkdkyklvdpeninleltvltldrnekfrdirgfisedlegvdatlvvhsnnftntilevgpvtmaglinlsstptnrmirydyatktgqcggvlcatgkifgihvggngrqgfsaqlkkqyfvekq

其对接区域为第26-30,44-48,64-68,74,76-78,111-112,131-137,139,147-152,166-170,174位。

输入上述对接文件和对接位点后,点击“dock”按钮进行对接预测,cluspro会输出20个最可能的对接复合物结构集合及其pdb结构文件,并给出各集合含有的结构数量。观察这20个集合的复合物结构文件,得出各复合物的对接位置。

凝血酶与融合蛋白对接输出结果如下:

1)最大的结构集合共包含220个复合物结构,酶切位置为pr↓gp;2)ir↓gi(161个);3)无明确对接位置;4)pr↓gp(64个);5)无明确对接位置;6)ir↓gi(49个);7)pr↓gp(46个);8)pr↓gp(43个);9)pr↓gp(29个);10)dr↓gf(26个);11)无明确对接位置;12)无明确对接位置;13)无明确对接位置;14)dr↓gf(15个);15)ir↓gi(14个);16)pr↓gp(12个);17)pr↓gp(10个);18)无明确对接位置;19)ir↓gi(4个);20)dr↓gf(1个)。

将各个对接位置及其数量进行统计,可得出凝血酶活性位点在正确酶切位置(pr↓gp)进行对接所占百分比为61.1%:

msdkiihltddsfdtdvlkadgailvdfwaewcgpckmiapildeiadeyqgkltvaklnidqnpgtapkygir(32.8%)giptlllfkngevaatkvgalskgqlkefldanlagsgsghmhhhhhhssglvpr(61.1%)gpetlcgaelvdalqfvcgdr(6.1%)gfyfnkptgygsssrrapqtgivdeccfrscdlrrlemycaplkpaksa

同理,以下是肠激酶各酶切位置及其百分比,可知正确酶切位置(dk↓gp)的比例为14.7%:

msdk(17.1%)iihltddsfdtdvlkadgailvdfwaewcgpck(1.8%)miapildeiadeyqgkltvaklnidqnpgtapk(30.1%)ygirgiptlllfkngevaatk(10.4%)vgalsk(2.3%)gqlkefldanlagsgsghmhhhhhhssglvprgsgmk(14.4%)etaaak(3.0%)ferqhmdspdlgtddddk(14.7%)gpetlcgaelvdalqfvcgdrgfyfnkptgygsssrrapqtgivdeccfrscdlrrlemycaplk(6.1%)paksa

以下是hrv3c酶各酶切位置及其百分比,可知正确酶切位置(fq↓gp)的比例为56.6%:

msdkiihltddsfdtdvlkadgailvdfwaewcgpckmiapildeiadeyqgkltvaklnidqnpgtapkygirgiptlllfkngevaatkvgalskgqlkefldanlagsgsghtsggggsnnnpptptpssgsghhhhhhsaalevlfq(56.6%)gpetlcgaelvdalq(43.4%)fvcgdrgfyfnkptgygsssrrapqtgivdeccfrscdlrrlemycaplkpaksa

我们认为,预测结果正确酶切位置的比例超过50%意味着蛋白酶可以顺利与底物进行接触,并特异性地针对正确的酶切位点进行切割,所以将50%作为阈值进行筛选。随后,选择凝血酶酶切体系和hrv3c酶酶切体系作为实施例进行表达实验,而肠激酶酶切体系作为对比例进行表达实验。

实施例5融合蛋白的获得及酶切

5.1融合蛋白基因序列的获得

为了实现各融合蛋白在大肠杆菌中大量、高效表达,发明人参照大肠杆菌密码子偏好性,并考虑密码子简并性、gc含量、合适的限制性内切酶等因素,最终设计出合适的基因序列用于表达。

具体地,凝血酶融合蛋白基因序列如seqidno.4所示,其5’端带有msci限制性内切酶位点(tggcca),3’端带有连续的终止密码子(taatga),以及ecorv的识别位点(gatatc):

tggccatatgcaccatcatcatcatcattcttctggtctggtgccacgcggtccggagaccctgtgcggtgcggaactggtggacgcgctgcaatttgtttgcggtgatcgtggcttctactttaacaagccgaccggttatggtagcagcagccgtcgtgcgccgcagaccggtatcgttgacgagtgctgcttccgtagctgcgatctgcgtcgtctggaaatgtattgcgcgccgctgaagccggcgaaaagcgcgtaatgagatatc

hrv3c酶融合蛋白基因序列如seqidno.5所示,其5’端带有saci限制性内切酶位点(ccgcgg),3’端带有终止密码子(taa),以及hindiii的识别位点(aagctt):

ccgcggctctggaagtgctgtttcaaggtccggagaccctgtgcggtgcggaactggtggacgcgctgcaatttgtttgcggtgatcgtggcttctactttaacaagccgaccggttatggtagcagcagccgtcgtgcgccgcagaccggtatcgttgacgagtgctgcttccgtagctgcgatctgcgtcgtctggaaatgtattgcgcgccgctgaagccggcgaaaagcgcgtaaaagctt

通过化学合成方式获取以上序列。

5.2构建凝血酶融合蛋白的重组表达载体及融合表达工程菌

pet-32a(+)表达载体图谱及其多克隆位点序列如图4和图5所示。将人工合成的凝血酶融合蛋白的cdna序列(seqidno.4),用msci和ecorv双酶切后,通过t4dna连接酶连接到同样经双酶切的pet-32a(+)表达载体上,构建重组表达载体,记作pet-32a-thrombin-igf-i;转化大肠杆菌克隆菌株top10,在含有50μg/ml氨苄青霉素的lb培养基上37℃培养筛选重组子,经pcr与酶切鉴定正确后,测序验证其序列正确性。

提取鉴定正确的重组子,转化到大肠杆菌表达菌株origamib(de3)中,在含有50μg/ml氨苄青霉素(amp)、15μg/ml卡那霉素(kan)以及12.5μg/ml四环素(tet)的lb培养基上,37℃培养筛选重组子,获得的重组子即为trx融合表达的igf-i工程菌,命名为thrombin-igf。将其保存于15%甘油中,冻存于-80℃冰箱。其中,thrombin-igf工程菌表达产生的融合蛋白应含有硫氧还蛋白(trx)标签、his-tag纯化标签、凝血酶(thrombin)酶切位点以及成熟肽igf-i序列,理论分子量约为21.6kda。

取甘油管冻存的thrombin-igf工程菌,按0.2%接种于含有新鲜lb抗性培养基(含50μg/mlamp,15μg/mlkan以及12.5μg/mltet)的试管中,振荡培养过夜,活化菌株;再转接至300ml的lb培养基中,37℃振荡培养约3h,测其od600值在0.6~0.8时,加入终浓度为0.05mm异丙基-β-d-硫代半乳糖苷(iptg),于25℃诱导表达24h,离心收集菌体;称量菌体湿重,按菌体和破菌液(50mmtris-hcl,0.5mnacl,ph8.0)重量比为1:15的比例加入破菌液,超声破菌后,进行sds-page检测。结果如图6所示,其中m为蛋白marker;1为诱导前全菌液;2为诱导后全菌液;3为诱导后破菌上清。结果说明破菌上清中有分子量接近26kda的融合蛋白表达,与理论分子量接近。

将上述融合蛋白采用igf-i单抗(abcam公司产品,货号:ab9572,下同)进行蛋白质免疫印迹(westernblot)鉴定,结果如图7所示,其中m为蛋白marker;1为诱导前全菌液;2为诱导后全菌液;3为诱导后的破菌上清。结果表明破菌上清中的融合蛋白具有igf-i的免疫活性,并且通过图中可以看到,融合蛋白还会形成少量二聚体结构。

5.3构建hrv3c酶融合蛋白的重组表达载体及融合表达工程菌

pet-48b(+)表达载体图谱及其多克隆位点序列如图8和图9所示。将人工合成的hrv3c酶融合蛋白的cdna序列(seqidno.5),用saci和hindiii双酶切后,通过t4dna连接酶连接到同样经双酶切的pet-48b(+)表达载体上,构建重组表达载体,记作pet-48b-hrv3c-igf-i;转化大肠杆菌克隆菌株top10,在含有50μg/ml卡那霉素的lb培养基上37℃培养筛选重组子,经pcr与酶切鉴定正确后,测序验证其序列正确性。

提取鉴定正确的重组子,转化到大肠杆菌表达菌株rosetta-gami2(de3)中,在含有50μg/mlkan,34μg/mlchl,50μg/ml链霉素(str)以及12.5μg/mltet的lb培养基上,37℃培养筛选重组子,获得的重组子即为trx融合表达的igf-i工程菌,命名为hrv3c-igf。将其保存于15%甘油中,冻存于-80℃冰箱。其中,hrv3c-igf工程菌表达产生的融合蛋白应含有硫氧还蛋白(trx)标签、his-tag纯化标签、hrv3c酶酶切位点以及成熟肽igf-i序列,理论分子量约为23.5kda。

取甘油管冻存的hrv3c-igf工程菌,按0.2%接种于含有新鲜lb抗性培养基(含50μg/mlkan,50μg/mlstr,34μg/mlchl以及12.5μg/mltet)的试管中,振荡培养过夜,活化菌株;再转接至300ml的lb培养基中,37℃振荡培养约3h,测其od600值在0.6~0.8时,加入终浓度为0.5mm异丙基-β-d-硫代半乳糖苷(iptg),于25℃诱导表达25h,离心收集菌体;称量菌体湿重,按菌体和破菌液(50mmtris-hcl,0.5mnacl,ph8.0)重量比为1:15的比例加入破菌液,超声破菌后,将诱导前后的菌液以及破菌上清采用igf-i单抗进行westernblot检测,结果如图10所示,其中m为蛋白marker;1为诱导后全菌液;2为诱导后的破菌上清。结果表明破菌上清中的融合蛋白具有igf-i免疫活性,蛋白大小在26kda附近,与理论分子量接近。

5.4融合蛋白的纯化

凝血酶融合蛋白和hrv3c酶融合蛋白的表达是采用实施例5.2和5.3中构建的thrombin-igf工程菌和hrv3c-igf工程菌来完成。发酵液离心收集菌体,超声破菌,收集上清,使用ni-sepharose6ff柱进行亲和层析,使用20mmtris-hcl(ph7.8)-0.5mnacl进行平衡,使用50mm→500mm咪唑梯度洗脱收集目的蛋白。为了减少高浓度盐溶液对蛋白酶活性的影响,使用g-15脱盐柱除去多余盐分。

5.5融合蛋白的酶切

igf-i成熟肽的大小约为10kda,若正确酶切,则可以在10kda附近检测到条带,并具有igf-i的免疫活性。

凝血酶切割融合蛋白的体系采用1u凝血酶(solarbio公司产品,货号:t8021)切割100μg融合蛋白,酶切缓冲体系终浓度为20mmtris-hcl(ph8.0),0.15mnacl,0/2.5/10/20mmcacl2,使用37℃摇床酶切24h。酶切结果如图11所示,其中m为蛋白marker,1为无cacl2,2为2.5mmcacl2,3为10mmcacl2,4为20mmcacl2。如图所示,cacl2终浓度为10mm时,酶切效果最好,凝血酶几乎可以完全切割融合蛋白,而cacl2浓度再提高后会影响酶活力,降低切割效果。

hrv3c酶切割融合蛋白的体系采用1u/10uhrv3c酶(takara公司产品,货号:7360)切割100μg融合蛋白,酶切缓冲体系终浓度为50mmtris-hcl(ph7.5),0.15mnacl,使用4℃酶切24h。酶切产物的igf-i单抗wb结果如图12所示,其中m为蛋白marker,1为加入1u酶,2为加入10u酶。由图可知,加入1u酶能够切割融合蛋白,获得少量igf-i成熟肽;而加入10u酶酶切效果较好,可以获得大量igf-i成熟肽。

对比例1肠激酶融合蛋白的获得及酶切

1.1融合蛋白基因序列的获得

肠激酶融合蛋白基因序列如seqidno.10所示,其5’端带有kpni限制性内切酶位点(ggtacc),3’端带有连续的终止密码子(taatga),以及hindiii的识别位点(aagctt):

ggtaccgacgacgacgacaagggtccggagaccctgtgcggtgcggaactggtggacgcgctgcaatttgtttgcggtgatcgtggcttctactttaacaagccgaccggttatggtagcagcagccgtcgtgcgccgcagaccggtatcgttgacgagtgctgcttccgtagctgcgatctgcgtcgtctggaaatgtattgcgcgccgctgaagccggcgaaaagcgcgtaatgaaagctt

1.2构建肠激酶融合蛋白的重组表达载体及融合表达工程菌

将人工合成的肠激酶融合蛋白的cdna序列(seqidno.10),用kpni和hindiii双酶切后,通过t4dna连接酶连接到同样经双酶切的pet-32a(+)表达载体上,构建重组表达载体,记作pet-32a-enterokinase-igf-i;转化大肠杆菌克隆菌株top10,在含有50μg/ml氨苄青霉素的lb培养基上37℃培养筛选重组子,经pcr与酶切鉴定正确后,测序验证其序列正确性。

提取鉴定正确的重组子,转化到大肠杆菌感受态表达菌株origamib(de3)中,在含有50μg/ml氨苄青霉素(amp)、15μg/ml卡那霉素(kan)以及12.5μg/ml四环素(tet)的lb培养基上,37℃培养筛选重组子,获得的重组子即为trx融合表达的igf-i工程菌,命名为ek-igf。将其保存于15%甘油中,冻存于-80℃冰箱。其中,ek-igf工程菌表达产生的融合蛋白应含有硫氧还蛋白(trx)标签、his-tag纯化标签、肠激酶(enterokinase)酶切位点以及成熟肽igf-i序列,理论分子量约为24.7kda。

取甘油管冻存的ek-igf工程菌,按0.2%接种于含有新鲜lb抗性培养基(含50μg/mlamp,15μg/mlkan以及12.5μg/mltet)的试管中,振荡培养过夜,活化菌株;再转接至300ml的lb培养基中,37℃振荡培养约3h,测其od600值在0.6~0.8时,加入终浓度为0.5mmiptg,于25℃诱导表达24h,离心收集菌体;称量菌体湿重,按菌体和破菌液(50mmtris-hcl,0.5mnacl,ph8.0)重量比为1:15的比例加入破菌液,超声破菌后,将破菌上清和沉淀进行igf-i单抗的westernblot鉴定,结果如图13所示,其中m为蛋白marker;1为破菌上清;2为破菌沉淀。结果表明破菌上清中的融合蛋白具有igf-i免疫活性,蛋白大小在26-34kda之间。

1.3肠激酶融合蛋白的纯化

肠激酶融合蛋白的表达是采用对比例1.1中构建的ek-igf工程菌来完成。发酵液离心收集菌体,超声破菌,收集上清,使用ni-sepharose6ff柱进行亲和层析,使用20mmtris-hcl(ph7.8)-0.5mnacl进行平衡,使用50mm→500mm咪唑梯度洗脱收集目的蛋白。为了减少高浓度盐溶液对蛋白酶活性的影响,使用g-15脱盐柱除去多余盐分。

1.4肠激酶融合蛋白的酶切

肠激酶切割肠激酶融合蛋白的体系采用不同量的重组牛肠激酶(耀海生物公司产品,货号:ez00001)切割1mg融合蛋白,酶切缓冲体系终浓度为20mmtris-hcl(ph8.0),50mmnacl,2mmcacl2,使用16℃酶切24h。酶切产物的sds-page结果如图14所示,其中m为蛋白marker,1为加入1iu酶,2为加入5iu酶,3为加入10iu酶,4为加入50iu酶,5为加入100iu酶,6为肠激酶切割阳性对照融合蛋白,7为未加酶的阳性对照融合蛋白。由图可知,肠激酶可以切割相应阳性对照蛋白,但无法切割肠激酶融合蛋白。

以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

序列表

<110>武汉海特生物制药股份有限公司

<120>一种筛选酶切适配融合蛋白的方法及igf-i制备方法

<130>wh2008252-1

<160>10

<170>siposequencelisting1.0

<210>1

<211>199

<212>prt

<213>人工序列(artificialsequence)

<400>1

metserasplysileilehisleuthraspaspserpheaspthrasp

151015

valleulysalaaspglyalaileleuvalaspphetrpalaglutrp

202530

cysglyprocyslysmetilealaproileleuaspgluilealaasp

354045

glutyrglnglylysleuthrvalalalysleuasnileaspglnasn

505560

proglythralaprolystyrglyileargglyileprothrleuleu

65707580

leuphelysasnglygluvalalaalathrlysvalglyalaleuser

859095

lysglyglnleulysglupheleuaspalaasnleualaglysergly

100105110

serglyhismethishishishishishisserserglyleuvalpro

115120125

argglyprogluthrleucysglyalagluleuvalaspalaleugln

130135140

phevalcysglyaspargglyphetyrpheasnlysprothrglytyr

145150155160

glyserserserargargalaproglnthrglyilevalaspglucys

165170175

cyspheargsercysaspleuargargleuglumettyrcysalapro

180185190

leulysproalalysserala

195

<210>2

<211>228

<212>prt

<213>人工序列(artificialsequence)

<400>2

metserasplysileilehisleuthraspaspserpheaspthrasp

151015

valleulysalaaspglyalaileleuvalaspphetrpalaglutrp

202530

cysglyprocyslysmetilealaproileleuaspgluilealaasp

354045

glutyrglnglylysleuthrvalalalysleuasnileaspglnasn

505560

proglythralaprolystyrglyileargglyileprothrleuleu

65707580

leuphelysasnglygluvalalaalathrlysvalglyalaleuser

859095

lysglyglnleulysglupheleuaspalaasnleualaglysergly

100105110

serglyhismethishishishishishisserserglyleuvalpro

115120125

argglyserglymetlysgluthralaalaalalysphegluarggln

130135140

hismetaspserproaspleuglythraspaspaspasplysglypro

145150155160

gluthrleucysglyalagluleuvalaspalaleuglnphevalcys

165170175

glyaspargglyphetyrpheasnlysprothrglytyrglyserser

180185190

serargargalaproglnthrglyilevalaspglucyscysphearg

195200205

sercysaspleuargargleuglumettyrcysalaproleulyspro

210215220

alalysserala

225

<210>3

<211>221

<212>prt

<213>人工序列(artificialsequence)

<400>3

metserasplysileilehisleuthraspaspserpheaspthrasp

151015

valleulysalaaspglyalaileleuvalaspphetrpalaglutrp

202530

cysglyprocyslysmetilealaproileleuaspgluilealaasp

354045

glutyrglnglylysleuthrvalalalysleuasnileaspglnasn

505560

proglythralaprolystyrglyileargglyileprothrleuleu

65707580

leuphelysasnglygluvalalaalathrlysvalglyalaleuser

859095

lysglyglnleulysglupheleuaspalaasnleualaglysergly

100105110

serglyhisthrserglyglyglyglyserasnasnasnproprothr

115120125

prothrproserserglyserglyhishishishishishisserala

130135140

alaleugluvalleupheglnglyprogluthrleucysglyalaglu

145150155160

leuvalaspalaleuglnphevalcysglyaspargglyphetyrphe

165170175

asnlysprothrglytyrglyserserserargargalaproglnthr

180185190

glyilevalaspglucyscyspheargsercysaspleuargargleu

195200205

glumettyrcysalaproleulysproalalysserala

210215220

<210>4

<211>271

<212>dna

<213>人工序列(artificialsequence)

<400>4

tggccatatgcaccatcatcatcatcattcttctggtctggtgccacgcggtccggagac60

cctgtgcggtgcggaactggtggacgcgctgcaatttgtttgcggtgatcgtggcttcta120

ctttaacaagccgaccggttatggtagcagcagccgtcgtgcgccgcagaccggtatcgt180

tgacgagtgctgcttccgtagctgcgatctgcgtcgtctggaaatgtattgcgcgccgct240

gaagccggcgaaaagcgcgtaatgagatatc271

<210>5

<211>245

<212>dna

<213>人工序列(artificialsequence)

<400>5

ccgcggctctggaagtgctgtttcaaggtccggagaccctgtgcggtgcggaactggtgg60

acgcgctgcaatttgtttgcggtgatcgtggcttctactttaacaagccgaccggttatg120

gtagcagcagccgtcgtgcgccgcagaccggtatcgttgacgagtgctgcttccgtagct180

gcgatctgcgtcgtctggaaatgtattgcgcgccgctgaagccggcgaaaagcgcgtaaa240

agctt245

<210>6

<211>70

<212>prt

<213>人工序列(artificialsequence)

<400>6

glyprogluthrleucysglyalagluleuvalaspalaleuglnphe

151015

valcysglyaspargglyphetyrpheasnlysprothrglytyrgly

202530

serserserargargalaproglnthrglyilevalaspglucyscys

354045

pheargsercysaspleuargargleuglumettyrcysalaproleu

505560

lysproalalysserala

6570

<210>7

<211>295

<212>prt

<213>人工序列(artificialsequence)

<400>7

thrpheglyalaglyglualaaspcysglyleuargproleupheglu

151015

lyslysglnvalglnaspglnthrglulysgluleupheglusertyr

202530

ilegluglyargilevalgluglyglnaspalagluvalglyleuser

354045

protrpglnvalmetleuphearglysserproglngluleuleucys

505560

glyalaserleuileseraspargtrpvalleuthralaalahiscys

65707580

leuleutyrproprotrpasplysasnphethrvalaspaspleuleu

859095

valargileglylyshisserargthrargtyrgluarglysvalglu

100105110

lysilesermetleuasplysiletyrilehisproargtyrasntrp

115120125

lysgluasnleuaspargaspilealaleuleulysleulysargpro

130135140

ilegluleuserasptyrilehisprovalcysleuproasplysgln

145150155160

thralaalalysleuleuhisalaglyphelysglyargvalthrgly

165170175

trpglyasnargarggluthrtrpthrthrservalalagluvalgln

180185190

proservalleuglnvalvalasnleuproleuvalgluargproval

195200205

cyslysalaserthrargileargilethraspasnmetphecysala

210215220

glytyrlysproglygluglylysargglyaspalacysgluglyasp

225230235240

serglyglyprophevalmetlysserprotyrasnasnargtrptyr

245250255

glnmetglyilevalsertrpglygluglycysaspargaspglylys

260265270

tyrglyphetyrthrhisvalpheargleulyslystrpileglnlys

275280285

valileaspargleuglyser

290295

<210>8

<211>248

<212>prt

<213>人工序列(artificialsequence)

<400>8

cysglylyslysleuvalthrglngluvalserprolysilevalgly

151015

glyseraspserarggluglyalatrpprotrpvalvalalaleutyr

202530

pheaspaspglnglnvalcysglyalaserleuvalserargasptrp

354045

leuvalseralaalahiscysvaltyrglyargasnmetgluproser

505560

lystrplysalavalleuglyleuhismetalaserasnleuthrser

65707580

proglnilegluthrargleuileaspglnilevalileasnprohis

859095

tyrasnlysargarglysasnasnaspilealametmethisleuglu

100105110

metlysvalasntyrthrasptyrileglnproilecysleuproglu

115120125

gluasnglnvalpheproproglyargilecysserilealaglytrp

130135140

glyalaleuiletyrglnglyserthralaaspvalleuglngluala

145150155160

aspvalproleuleuserasnglulyscysglnglnglnmetproglu

165170175

tyrasnilethrgluasnmetvalcysalaglytyrglualaglygly

180185190

valaspsercysglnglyaspserglyglyproleumetcysglnglu

195200205

asnasnargtrpleuleualaglyvalthrserpheglytyrglncys

210215220

alaleuproasnargproglyvaltyralaargvalproargphethr

225230235240

glutrpileglnserpheleuhis

245

<210>9

<211>182

<212>prt

<213>人工序列(artificialsequence)

<400>9

glyproasnthrgluphealaleuserleuleuarglysasnilemet

151015

thrilethrthrserlysglygluphethrglyleuglyilehisasp

202530

argvalcysvalileprothrhisalaglnproglyaspaspvalleu

354045

valasnglyglnlysileargvallysasplystyrlysleuvalasp

505560

progluasnileasnleugluleuthrvalleuthrleuaspargasn

65707580

glulyspheargaspileargglypheilesergluaspleuglugly

859095

valaspalathrleuvalvalhisserasnasnphethrasnthrile

100105110

leugluvalglyprovalthrmetalaglyleuileasnleuserser

115120125

thrprothrasnargmetileargtyrasptyralathrlysthrgly

130135140

glncysglyglyvalleucysalathrglylysilepheglyilehis

145150155160

valglyglyasnglyargglnglypheseralaglnleulyslysgln

165170175

tyrphevalglulysgln

180

<210>10

<211>243

<212>dna

<213>人工序列(artificialsequence)

<400>10

ggtaccgacgacgacgacaagggtccggagaccctgtgcggtgcggaactggtggacgcg60

ctgcaatttgtttgcggtgatcgtggcttctactttaacaagccgaccggttatggtagc120

agcagccgtcgtgcgccgcagaccggtatcgttgacgagtgctgcttccgtagctgcgat180

ctgcgtcgtctggaaatgtattgcgcgccgctgaagccggcgaaaagcgcgtaatgaaag240

ctt243

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1