一种基因工程新药-安琪抗栓因子的高效生产方法

文档序号:1173241阅读:475来源:国知局
专利名称:一种基因工程新药-安琪抗栓因子的高效生产方法
技术领域
本发明涉及用基因工程技术高效生产新型抗栓药物安琪(Anqi)因子的方法。
背景技术
血栓形成、肿瘤转移及骨质破坏吸收长期以来严重影响着人类的健康,因其发病机制尚未被完全认识,一直缺乏有效的治疗方法。近年来,随着关于细胞间相互作用的学说——细胞粘附理论的不断完善,细胞与细胞、细胞与细胞外基质之间的粘附、转运被认为是以上疾病发生的中心环节。进一步研究发现,一种三肽序列RGD(Arg-Gly-Asp)和其相应配体的结合是细胞相互作用的必需环节,阻断此环节的研究将对以上疾病的发病机制和治疗有着重要的理论和现实意义。安琪因子是一种存在于蝰蛇蛇毒中的天然蛋白分子(Echistatin),共有49个氨基酸,分子量5400Da,其24-25-26位氨基酸为Arg-Gly-Asp(精氨酸—甘氨酸—天冬氨酸)三肽序列,即RGD序列。安琪因子中的RGD序列及其它活性结构(尤其是其特有的C-末端)使它具有多种生物学功能。安琪因子可选择性地抑制活化血小板和纤维蛋白原的结合,并抑制血小板聚集正调节通路中蛋白因子的活化而具有抗血栓的作用;安琪因子可抑制破骨细胞的功能,抑制骨质吸收过程;安琪因子也可促进肿瘤细胞发生凋亡,抑制由TGF因子介导的肿瘤细胞转移等抗肿瘤功能。
安琪因子分子量小、RGD序列及其与周围序列所形成的空间结构使该物质在作用效果、免疫原性、副作用、基因工程制备方面具有明显的优势,成为目前全球抗栓、抗肿瘤药物研究的热点。经国内外专家科学实验证明,安琦因子显示出抗栓、抑制肿瘤转移、抗骨质疏松等药理作用,具有重大的临床应用价值。
由于蛇毒来源少、提取困难且价格昂贵,难以用传统提取工艺大量制备安琪因子,采用基因工程技术制备安琪因子是一种经济实用的方法。有学者已制备了重组Echistatin并证实其具有与野生蛋白同等的功效。但目前所使用的制备方法均以科学实验为目的,产率低且活性不稳定,不适于其进一步开发和大量制备。
发明目的本发明的目的是运用基因工程技术制备抗栓药物——安琪因子,主要是通过对目的基因的全新设计以及对传统制备工艺的合理改进,以实现安琪因子的高效表达。

发明内容
本发明运用基因工程、蛋白质工程及现代分子生物学技术构建了人工全合成的安琪因子基因,利用原核表达载体pBV220在大肠杆菌DH5α中以包涵体形式获得高效表达。运用该表达体系可大幅度降低安琪因子的生产成本,从而创立了一套独特高效的大规模制备重组安琪因子的生产工艺,这将带来抗栓药物及相关产业的更新换代,具有极大的社会经济效益和商业前景。
下面将对本发明进行详细描述。
本发明以运用基因工程技术高效制备安琪因子为目的,通过对目的基因的全新设计以及对传统制备工艺的合理改进,实现安琪因子的高效表达。
采用通常的技术改进手段,如上游表达载体序列的优化、下游工程的改良等,对安琪因子的表达量的提高无明显效果。本发明从异源蛋白在大肠杆菌中表达水平的另一重要影响因素——基因的密码子构成入手,对安琪因子基因进行了全面的设计与合成。
同一种氨基酸乃至蛋白质多肽分子,根据密码子的简并性,可由不同的DNA序列来编码。不同生物种对蛋白质编码基因的密码子的喜好性是不同的。采用大肠杆菌的喜好密码子替代安琪因子基因原有的密码子,并充分考虑密码子间的合理组合,是提高安琪因子表达量的可行手段。
本发明根据各种密码子在大肠杆菌中的使用频率以及密码子的常见组合,保留安琪因子基因的氨基酸序列不变,选用大肠杆菌的喜好密码子取代安琪因子基因DNA序列中的非喜好密码子,设计了全新的安琪因子基因DNA序列(图1)。
根据所设计的DNA序列,采用全基因分段合成和PCR拼接的策略,构建人工合成的安琪因子基因。
用EcoR I和Pst I完全酶切全长的安琪因子基因,插入经EcoR1和Pst I双切的pBV220原核表达载体中,获得重组质粒pBV220-Anqi(图2),转化大肠杆菌DH5α。阳性克隆37℃过夜活化后,采用温度诱导的表达方式使其表达。离心收集菌体,加入100μl1X上样缓冲液,100℃煮沸5min,15%SDS-PAGE电泳检测安琪因子表达(图3),经凝胶扫描分析,安琪因子表达量达到菌体蛋白的26%,比原有菌种的表达水平提高了约30%。
人工全合成的安琪因子的大量表达及纯化将工程菌单菌落挑入5ml含60μg/ml氨苄的LB培养基中,37℃培养过夜,次日转入500ml含60μg/ml氨苄的LB培养基中,37℃培养至其进入对数生长期,转入5升发酵罐中,37℃培养至其OD600=0.8,快速升温至42℃,诱导6h,离心收集菌体,菌体湿重可达30g。
离心收集发酵的菌体经TE缓冲液洗涤后,室温下溶菌酶、2M盐酸胍处理后,4℃超声破菌,12000转离心得到包涵体,以6M尿素在4℃悬浮包涵体,继以8M盐酸胍裂解包涵体,PBS复性。透析去除盐酸胍后,离心取上清,HPLC纯化,得到电泳纯的半成品,加入稳定剂后分装为成品。
结果及产物活性测定由于安琪因子基因的成功改造,安琪因子的表达水平有了较大的提高,经蛋白N端测序,结果证实纯化蛋白为安琪因子,具有与野生安琪因子蛋白同等的功效。将纯化的安琪因子半成品经蛋白定量后,其活性IC50=3.0*10-8,与标准的安琪因子蛋白多肽比活一致。
本发明还包括安琪因子的一种串联表达模式,其特征在于它在DNA水平上,将安琪因子的DNA序列串联为多聚体,并用原核或真核细胞表达安琪因子的串联重复多聚体。
利用DNA限制性内切酶中的同尾酶具有识别水解不同核苷酸序列,但产生相同的粘性末端,且当二者的粘性末端相连后,该片段不能再被同尾酶识别切割的特点,通过将安琪因子的基因序列重复串联为多聚体,在原核细胞中进行表达,表达产物大多为目标肽段成分,表达效率高,生产成本低。
安琪因子的天然蛋白分子共有49个氨基酸,仅28位氨基酸为蛋氨酸,由多种具有相同生物学活性的蛇毒多肽的一级结构揭示蛋氨酸28并非安琪因子多肽发挥生物学活性所必须(Huang等,J.Biol.Chem.26216157-16163,1987)。因此,用亮氨酸取代蛋氨酸28,并将蛋氨酸插入安琪因子基因单体分子间作为溴化氰裂解位点,将目标肽段的多聚体断裂加工为目标肽段单体。
本发明利用同尾酶的特点,可以很方便地使目标肽段单体分子定向克隆为多聚体,且多聚体的聚合度可以随意选择(2,3,4,5···体)。将同尾酶PstI(识别序列 )和Nsi I(识别序列 )的识别序列分别置于安琪因子多肽核苷序列的5’端和3’端,Pst I和Nsi I酶切产生的粘性末端相连后形成的序列 和 不能被Pst I和Nsi I酶识别切割,且两对密码子ATG,CAG是E.coli的喜好密码子(分别编码Met和Gln)。根据图1的安琪因子DNA序列,设计安琪因子多肽单体及间隔片段的核苷酸序列如下 其中带下划线的核苷酸序列为插入序列,序列中的方框部分分别为Pst I和Nsi I的识别位点,用于安琪因子基因多聚体的拼接。Pst I识别序列之后的6个组氨酸密码子用于表达产物的亲和层析,其后的密码子ATG编码蛋氨酸,用于多聚体表达产物的断裂加工。在Pst I识别序列之前以及Nsi I识别序列之后分别加上了核酸内切酶EcoR I和BamH I的识别序列(斜体字母),目的是为了将串联好的多聚体能方便地装入表达载体,在安琪因子单体及间隔片段的酶切拼接过程中,EcoR I和BamH I的识别位点均被去除,因而间隔片段并不包含EcoR I或BamH I的序列,该序列仅存在于安琪因子单体或重复片段多聚体的5’端或3’端。
根据上述设计的安琪因子单体序列,利用实施例一的方法进行分段合成和PCR拼接,使成单体双链。扩增产物直接连到pUC18载体中,并转导DH5α菌,插入序列经测序鉴定,即可得到安琪因子单体基因质粒pUCAnqi(1)。(括号内1代表单体,2代表双体,3代表三体,依此类推)。
安琪因子多聚体基因的构建首先将pUCAnqi(1)分别用Nsi I/Hind III,以及Pst I/Hind III酶切,将Nsi I/Hind III酶切后纯化回收的DNA大片段与Pst I/Hind III酶切后纯化回收的DNA小片段连接,连接产物转导至JM109菌中扩增DNA,此时可得到安琪因子基因的二聚体质粒pUCAnqi(2)。将pUCAnqi(2)分别用Nsi I/Hind III,以及Pst I/Hind III酶切,将Nsi I/Hind III酶切后纯化回收的DNA大片段与Pst I/Hind III酶切后纯化回收的DNA小片段连接,连接产物转导JM109菌以扩增DNA,即可得到安琪因子基因的四聚体质粒pUC-Anqi(4)。重复上述方法即可得到安琪因子基因的八聚体质粒pUC-Anqi(8)。将pUC-Anqi(4)用Nsi I/Hind III酶切并纯化回收DNA大片段,将pUC-Anqi(8)用PstI/Hind III酶切并纯化回收其DNA小片段,把这两个基因片段连接后转导JM109菌并扩增DNA,由此得到安琪因子基因的12聚体质粒pUC-Anqi(12)。将pUC-Anqi(12)和表达载体pBV220均用EcoR I/BamH I双酶切,将pUC-Anqi(12)酶切产生的小片段与pBV220酶切产生的大片段连接并转导至DH5α菌以扩增安琪因子十二聚体基因表达质粒pBV220-Anqi(12)。
将安琪因子十二聚体基因表达质粒转导入DH5α菌中,挑单菌落培养过夜,过夜菌按2%接种至LB培养基中,37℃培养至其进入对数生长期,转入5升发酵罐,37℃培养至OD600=0.8,快速升温至42℃,诱导6h,离心收集菌体。表达产物用Ni-sepharose亲和层析纯化,纯化产物经凝胶扫描分析,纯度达90%以上。
安琪因子十二聚体的大量表达及纯化将工程菌单菌落挑入5ml含50μg/ml氨苄的LB培养基中,37℃培养过夜,次日转入500ml含50μg/ml氨苄的LB培养基中,37℃培养至其进入对数生长期,转入5升发酵罐中,37℃培养至其OD600=0.8,快速升温至42℃,诱导6h,离心收集菌体,经TE缓冲液洗涤后,溶菌酶、8M盐酸胍处理后,超声破菌,12000转离心得到包涵体,以6M尿素在4℃悬浮包涵体,继以8M盐酸胍裂解包涵体,PBS复性。透析去除盐酸胍后,离心取上清,过Ni-sepharose柱,得到电泳纯的安琪因子十二聚体多肽。
将纯化后的安琪因子多肽按1mg/ml的浓度溶于溴化氰溶液中(溴化氰溶液用70/%的甲酸配制,浓度为5mg/ml)。将反应溶液在室温置通风橱中反应24h,以断裂蛋氨酸的羧基参与形成的肽键。反应完毕,加入8倍体积的10M NaOH以中和溴化氰,将降解产物超滤、脱盐冻干。
将经溴化氰降解处理的安琪因子多肽溶于1.8M的羟氨中,使肽段的浓度为0.25mg/ml。以0.1%的三氟醋酸为起始缓冲夜,以0.1%三氟醋酸+75%的乙腈为终极缓冲液,用C18反相色谱柱纯化安琪因子多肽,收集安琪因子单体吸收峰,得到色谱纯的安琪因子多肽。
实施例一安琪因子基因DNA序列的设计1在通用的DNA自动合成仪上采用亚磷酸酰胺法化学合成以下3段长度为70bp左右的DNA片段,编号分别为L1,L2,R1。其中L1的5’端含EcoR1位点,R1的3’端含Pst I位点,以便向表达载体插入。 序列中的方框部分表示该处是两段DNA片段互补搭接之处2利用PCR反应体系,搭桥法分步延长合成安琪因子基因片段(1)DNA片段L2,R1的链延长反应根据设计,L2与R1的末端有20个碱基互补,这使两链相连,在PCR反应体系中,两链末端部分互为模板发生链延长。反应条件L25μl(0.1OD/μl),R15μl(0.1OD/μl),10x TaKaRa La buffer 10μl,dNTP(25mmol/l)16μl,H2O 63μl,反应体系共100μl。94℃恒温5min,55℃恒温加入TaKaRa La Taq酶1μl后,恒温5min,72℃,5min,即可得到由L2和R1拼接而成的两条互补长链,名为L2-R1,为下一步PCR反应的模板。
(2)DNA片段L1的链延长反应与前一步同理,依据设计,L1与L2有20bp的互补序列,利用引物L1进行如下的PCR反应,反应条件L1(0.01OD/μl)1μl,模板L2-R11μl,10×TaKaRa La buffer10μl,dNTP(25mmol/l)10μl,TaKaRa La Taq酶1μl后,H2O 77μl,反应体系共100μl。94℃30s,55℃30s,72℃30s,共30循环。产物名为L1-L2-R1,即为合成的全长的安琪因子基因。实施例二人工全合成的安琪因子基因表达载体pBV220-Anqi的构建及表达用EcoR I和Pst I完全酶切全长的安琪因子基因,插入经EcoR1和Pst I双切的pBV220原核表达载体中,获得重组质粒pBV220-Anqi,转化大肠杆菌DH5α,所选转化克隆经PCR、酶切鉴定和DNA序列测定证明克隆正确。阳性克隆37℃过夜活化后,按1∶100比例转接共5ml含Amp的LB培养液中,30℃振荡培养至OD600=0.8,转42℃继续培养6h,离心收集菌体,加入100μl 2×上样缓冲液,100℃煮沸5min,15%SDS-PAGE电泳检测安琪因子表达,经凝胶扫描分析,安琪因子表达量达到菌体蛋白的26%,比原有菌种的表达水平提高了约30%。


图1—安琪因子基因DNA序列图2--重组质粒pBV220-Anqi构建3--SDS-PAGE电泳检测安琪因子表达其中1DH5α-pBV220-Anqi筛选菌落5,42℃诱导表达5h后样品2DH5α-pBV220-Anqi筛选菌落5,表达前样品3DH5α-pBV220-Anqi筛选菌落4,42℃诱导表达5h后样品4DH5α-pBV220-Anqi筛选菌落4,表达前样品5DH5α-pBV220-Anqi筛选菌落3,42℃诱导表达5h后样品6DH5α-pBV220-Anqi筛选菌落3,表达前样品7DH5α空菌落样品8分子量Marker
附录序列表<110>牛勃<120>一种基因工程新药--安琪抗栓因子的高效生产方法<160>4<170>PatentIn Version 2.1<210>1<211>147<212>DNA<213>人工序列<220><221>misc_feature<222>(1)...(147)<223>根据野生蛋白氨基酸序列,采用大肠杆菌喜好密码子设计合成。<220><221>CDS<222>(1)...(147)<400>1gaa tgc gaa tcc ggt ccg tgc tgc cgt aac tgc aaa ttc ctg aaa gaa 48Glu Cys Glu Ser Gly Pro Cys Cys Arg Asn Cys Lys Phe Leu Lys Glu1 5 10 15ggt act atc tgc aaa cgt gct cgt ggt gac gac atg gac gac tac tgc 96Gly Thr Ile Cys Lys Arg Ala Arg Gly Asp Asp Met Asp Asp Tyr Cys20 25 30aac ggt aaa act tgc gac tgc ccg cgt aac ccg cac aaa ggt ccg gct 144Asn Gly Lys Thr Cys Asp Cys Pro Arg Asn Pro His Lys Gly Pro Ala35 40 45act 147Thr<210>2<211>49<212>PRT<213>小蝰蛇种(Echis carinatus sp.)<400>2Glu Cys Glu Ser Gly Pro Cys Cys Arg Asn Cys Lys Phe Leu Lys Glu1 5 10 15Gly Thr Ile Cys Lys Arg Ala Arg Gly Asp Asp Met Asp Asp Tyr Cys20 25 30Asn Gly Lys Thr Cys Asp Cys Pro Arg Asn Pro His Lys Gly Pro Ala35 40 45Thr<210>3<211>192<212>DNA<213>人工序列<220><221>misc_recomb<222>(1)...(6)<223>限制性核酸内切酶EcoR I的识别位点,为了将串联好的多聚体能方便的装入表达载体。<220><221>misc_recomb<222>(7)...(12)<223>限制性核酸内切酶Pst I的识别位点,用于安琪因子基因多聚体的拼接。<220><221>CDS<222>(13)...(180)<220><221>Old_sequence<222>(115)...(117)<223>在不影响蛋白质生物学活性的前提下,为分离纯化方便,改为亮氨酸密码子。<220><221>misc_recomb<222>(181)...(186)<223>限制性核酸内切酶Nsi I的识别位点,用于安琪因子基因多聚体的拼接。<220><221>misc_recomb<222>(187)...(192)<223>限制性核酸内切酶Bam III的识别位点,为了将串联好的多聚体能方便的装入表达载体。<400>3gaa ttc ctg cag cac cac cac cac cac cac atg gaa tgc gaa tcc ggt 48His His His His His Hsi Met Glu Cys Glu Ser Gly1 5 10ccg tgc tgc cgt aac tgc aaa ttc ctg aaa gaa ggt act atc tgc aaa 96Pro Cys Cys Arg Asn Cys Lys Phe Leu Lys Glu Gly Thr Ile Cys Lys15 20 25cgt gct cgt ggt gac gac ctc gac gac tac tgc aac ggt aaa act tgc 144Arg Ala Arg Gly Asp Asp Leu Asp Asp Tyr Cys Asn Gly Lys Thr Cys30 35 40gac tgc ccg cgt aac ccg cac aaa ggt ccg gct act tgc gca gga tcc 192Asp Cys Pro Arg Asn Pro His Lys Gly Pro Ala Thr45 50 55<210>4<211>56<212>PRT<213>人工序列<220><221>NON_TER<222>(1)<220><221>MUTAGEN<222>(1)…(6)<223>此处的六个组氨酸残基用于表达产物的纯化。<220><221>MUTAGEN<222>(35)<223>天然蛋白质此处为蛋氨酸,但此处蛋氨酸并非天然蛋白质发挥生物学活性所必须,为分离纯化方便,将其改为亮氨酸。<220><221>NON_TER<222>(56)<400>4His His His His His His Met Glu Cys Glu Ser Gly Pro Cys Cys Arg1 5 10 15Asn Cys Lys Phe Leu Lys Glu Gly Thr Ile Cys Lys Arg Ala Arg Gly20 25 30Asp Asp Leu Asp Asp Tyr Cys Asn Gly Lys Thr Cys Asp Cys Pro Arg35 40 45Asn Pro His Lys Gly Pro Ala Thr50 5权利要求
1.一种基因工程新药安琪抗栓因子的高效制备方法,其特征在于人工设计编码基因DNA序列,并采用全基因分段合成、PCR拼接获得所说因子基因序列,通过将其串联为多聚体与表达载体连接,构建为重组表达质粒,转化原核或真核细胞,表达安琪因子蛋白质并进行提取、分离与纯化。
2.如权利要求1所述的制备方法,其特征在于人工设计编码基因是选用大肠杆菌的喜好密码子替代安琪因子基因DNA序列中的非喜好密码子,并考虑密码子间的合理组合,设计全新的安琪因子基因DNA序列如下1 atggaatgcg aatccggtcc gtgctgccgt aactgcaaat tcctgaaaga aggtactatc61 tgcaaacgtg ctcgtggtga cgacatggac gactactgca acggtaaaac ttgcgactgc121 ccgcgtaacc cgcacaaagg tccggctact
3.如权利要求1或2所述的制备方法,其特征是采用全基因分段合成、PCR拼接,分步延长合成安琪因子基因片段L1、L2和R1L11 gggaattcat ggaatgcgaa tccggtccgt gctgccgtaa ctgcaaattc ctgaaagaag61 gtactatctL21 cctgaaagaa ggtactatct gcaaacgtgc tcgtggtgac gacatggacg actactgcaa61 cggtaaaaR11 agtagccgga cctttgtgcg ggttacgcgg gcagtcgcaa gttttaccgt tgcagtagtc61 g
4.如权利要求1、2或3所述的制备方法,其特征是先以L2、R1两链末端部分互为模板进行PCR反应,获得L2-R1PCR产物;再以L1与L2-R1互为模板进行PCR反应,获得安琪因子基因全序列。
5.如权利要求1所述的制备方法,其特征在于一种基因串联表达模式,是在DNA水平上,将安琪因子的DNA序列串联为多聚体,并用原核或真核细胞表达安琪因子基因串联重复多聚体。
6.如权利要求5所述的制备方法,其特征是根据安琪因子的DNA序列,设计安琪因子多肽单体及间隔片段的核苷酸序列 其中,划线的核苷酸序列为插入间隔片段序列;方框部分序列为同尾酶如Pst1和Nst1的识别位点,在同尾酶识别位点前后加上合适的酶切位点如EcoR1和BamH1用于安琪因子基因多聚体的拼接。
7.如权利要求1或5所述的制备方法,其特征是利用同尾酶具有识别水解不同核苷酸序列但产生相同粘性末端、且当二者的粘性末端相连后该片段不能再被同尾酶识别切割的特点,通过将安琪因子的基因序列重复串联为多聚体,优选在原核细胞中进行表达,获得表达效率高、生产成本低的目标肽段成分。
8.如权利要求1、5、6或7所述的制备方法,其特征是将编码该因子的49个氨基酸中的第28位氨基酸(蛋氨酸)用亮氨酸取代,形成安琪因子突变体,并将蛋氨酸插入安琪因子基因单体分子间作为溴化氰裂解位点,以便在表达后纯化时将目的肽段的多聚体断裂加工为目标肽段单体。
9.如权利要求1、5、6、7或8所述的制备方法,其特征是将该因子基因序列单体或串联的多聚体分别与表达载体连接,构建为重组表达质粒,转化原核细胞或真核细胞,表达安琪抗栓因子蛋白质。
10.如权利要求1、5、6、7、8或9所述的制备方法,其特征是将表达的安抗琪栓因子蛋白质从细胞中,经溶菌、裂解、提取、纯化,并经溴化氰降解,最后得到色谱纯化的安琪因子蛋白质。
全文摘要
本发明涉及一种基因工程新药安琪抗栓因子的高效制备方法,其特征在于人工设计编码基因DNA序列,并采用全基因分段合成、PCR拼接获得所说因子基因序列,通过将其串联为多聚体与表达载体连接,构建为重组表达质粒,转化原核或真核细胞,表达安琪因子蛋白质并进行提取、分离与纯化,本发明的表达产物大多为目标肽段成分,表达效率高,生产成本低,市场前景很好。
文档编号A61P7/00GK1384112SQ0212089
公开日2002年12月11日 申请日期2002年6月7日 优先权日2002年6月7日
发明者牛勃, 韩兵社, 杨琦, 向前, 阎占清, 解军, 常冰梅, 杨涛, 郭勇, 李乐意 申请人:牛勃
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1