一种利用甲醇酵母系统高效表达tPA等外源蛋白的方法及其表达产物的纯化制备技术的制作方法

文档序号:456021阅读:477来源:国知局
专利名称:一种利用甲醇酵母系统高效表达tPA等外源蛋白的方法及其表达产物的纯化制备技术的制作方法
技术领域
本发明是有关采用一种甲醇酵母表达载体PICZa-DoI,以融合分泌表达的方式生产一类重组蛋白的方法。特别是采用该系统已成功地利用甲醇酵母表达出重组人组织纤溶酶原激活物突变体(rPA)、人膜联蛋白V-尿激酶活性片段融合蛋白(Anx-scUK)以及人神经生长因子(hNGF)及其突变体等。
背景技术
酵母表达体系具有许多优于大肠杆菌(E.coli)和哺乳动物细胞(如CHO等)表达系统的特点,譬如,培养方便、产量高、纯化相对简单、生产成本低等。但实际研究发现,许多外源蛋白在酵母表达系统中难以实现高表达,有的表达量甚微,甚至根本就没有表达。我们能检索到许多在酵母系统中表达成功的研究报道,但这些研究报道中很多都没有后续的研究开发工作,其中最为典型的如重组人组织纤溶酶原激活物(tPA)、重组人尿激酶原(rhPro-UK)等(Joan Lin Cereghino,James M.CreggHeterologous protein expression in the methylotrophic yeast Pichia pastoris FEMS Micro-biology Reviews,20002445~66)。研究者对于表达产量低的原因有各种推测,并且也有许多大胆的尝试。例如,通过扩大筛选量或采用抗性筛选,提高克隆的拷贝数,利用基因的剂量效提高表达量,现在已经商品化的Invitrogen公司pPIC9K、pPICZa系列的表达载体就是用于此种目的的;有通过基因定点突变或人工全合成基因,将目的基因的密码子尽可能选用酵母喜好的密码子,希望提高目的基因在酵母细胞中的转录、翻译的效率来获得目的蛋白高表达等。但是,除少数成功外,现有的许多手段在多数情况下并不能从根本上对目的蛋白的表达产量有显著的改善。
在回顾酵母表达系统中已经高效表达的一些外源蛋白(如,人血白蛋白、明胶蛋白等)研究资料的基础上,我们发现将这类在酵母中可以获得高表达的外源蛋白或这些蛋白的一部分结构域同难以在酵母系统中实现高表达的外源蛋白融合在一起,组成融合蛋白,通过这些可以高表达蛋白或者说通过这类蛋白的mRNA片段的引导,就可以实现对原来难以表达的外源蛋白的高水平表达。采用这种方法我们成功的实现了突变型人组织纤溶酶原激活物活性片段(rPA)、尿激酶原(Pro-UK)、尿激酶(UK)、膜联蛋白V-单链尿激酶活性片段融合蛋白(Anx-scUK)、胰岛素原(Pro-Insulin)、人神经生长因子(hNGF)、人甲状旁腺素(hPTH1~84和hPTH1~34)、Exendin-4、Flt3 Ligand和Flt-3L-G-CSF等外源蛋白及其突变体以融合蛋白的形式高效表达。由于在融合蛋白的中间接头区域引入相应的蛋白酶或化学试剂(例如,CNBr、羟胺等)的切割位点,所以,通过酶法或化学法切割就可以获得同目的蛋白天然N-端一样的目的蛋白分子。考虑到酵母发酵上清液中盐、色素、杂蛋白和多糖等干扰离子交换层析的物质很多,而Ni2+-螯合层析介质在加入大量无机盐(如,NaCl等)的复杂体系中,层析介质对融合蛋白的结合受发酵液中的成分的影响很小,所以我们在目的蛋白与融合Tag的接头处特别设计插入了由六个组氨酸组成的Tag,即(His)6。这样只要将发酵上清液的pH调节到略碱性并补充0.2~0.8M的NaCl,因此该体系产生的目的蛋白可以用Ni2+-螯合层析介质来进行第一步层析纯化,如此一来,就极大地简化了纯化工艺。
本专利描述了该表达系统的构造过程,同时也详细描述了采用该表达系统成功实现某些目的蛋白(如,rPA、Anx-scUK、mut-hNGF等)大量表达的实例,因为这类外源蛋白一般在甲醇酵母中都没有成功实现过高表达的正式报道或没有相关的用于规模生产的研究工作。

发明内容
1.PICZa-DoI载体的构造过程我们将自行构建的表达载体简称PICZα-DoI,这是因为本载体是以Invitrogen公司商品化的载体pPICZαA为基础改造而成,所以取原始载体命名中的PICZα,而DoI是指原始表达载体pPICZαA的α-信号肽后紧连的是完整的人血白蛋白基因序列或人血白蛋白的第一结构域(Domain I,DoI)。本载体的最大特点在于,表达出的目的蛋白是融合蛋白,该融合蛋白的N-端是人血白蛋白的N-端序列,最终要获得目的蛋白则需要用酶或化学试剂处理(或切割)融合蛋白,从中释放出目的蛋白,另外,其多克隆位点区域的序列同pPICZαA也略有差别。但是其上游构建、表达筛选以及发酵等方式同Invitrogen公司的甲醇酵母表达系统没有区别。本专利中的PICZa-DoI载体构造过程类似将将一个待克隆基因片段插入到Invitrogen公司的pPICZaA载体中的过程合成能PCR人血白蛋白基因的5`-端和3`-端引物,从人胎肝cDNA文库中,通过PCR钓出全长的HSA基因序列。
根据现在对HSA空间结构的研究资料(Michael Dockal etal,J.Biol.Chem.Vol.274(41)29303-29310,1999),分别尝试用HSA的结构域I(Domain I,DoI)、结构域II(Domain II,DoII)和结构域III(Domain HI,DoIII)作为融合基因的5`-端区段,在HSA结构域基因片段后面插入两个(Gly)4-Ser序列对应的DNA序列GGT GGT GGCGGC TCT GGC GGT GGC GGT TCC,同时为便于纯化融合蛋白,又在两个(Gly)4-Ser序列和待表达目的蛋白之间插入(His)6对应的DNA序列CAT CAT CAC CAT CACCAT,接着又连接上一个(Gly)4-Ser序列对应的DNA序列GGA GGT GGA GGT TCA,最后再连接上多克隆位点的限制性内切酶KpnI、ScaI、BamHI、NotI、XbaI以及烟草蚀纹病毒蛋白酶(rTEV,recombinant Tobacco Etch Virus Protease)识别序列对应的DNA序列GGTACC AGTACT GGATCC GAA AAC TTG TAC TTC CAA GCGGCCGC CAT TCTAGAKpnIScaIBamHIrTEV识别序列NotIXbaI将目的基因从KpnI或ScaI或BamHI和NotI或XbaI之间插入就能确保HSA或HSA的结构域能同待表达目的蛋白(如,rPA、Pro-UK等)之间有如下一个21肽序列Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly-Ser-His-His-His-His-His-His-Gly-Gly-Gly-Gly-Ser该段插入肽或连接肽可以保证HSA与目的蛋白的结构独立,而不会相互干扰。不过需要说明的是,为保证待表达的目的蛋白具有天然的N-端,需要从KpnI、ScaI或BamHI后重新合成蛋白酶识别序列(rEK、rTEV等)或化学试剂识别序列氨基酸残基所对应的DNA片段(图1a和1b)。具体构造过程参见实施例1,该表达载体的基本序列参见SEQ-1。
这种改造后的表达载体可以用来表达一系列常规方法难以实现高效表达的外源蛋白。本专利将以rPA、Anx-scUK和mut-hNGF蛋白的表达等为例,具体描述如何使用该套改造后的系统,以及如何对表达产物进行生产规模的纯化制备策略。采用本专利表达系统构造的rPA、Anx-scUK和mut-hNGF蛋白的巴斯德毕氏酵母(Pichia pastoris)工程菌在武汉大学的中国典型培养物保藏中心(China Center for Type Culture,CCTCC)均有菌种保藏,其保藏编号依次分别为rPA/X3301(CCTCC No.M204029)、Anx-scUK/X3302(CCTCC No.M204030)和mut-hNGF/X3303(CCTCC No.M204031),这三个工程菌种在CCTCC的开始保藏时间均为2004年4月12日。
2.人的组织纤溶酶原激活物设计改造过程人的组织纤溶酶原激活物(tissue plasminogen activator,tPA)属丝氨酸蛋白酶类分子。早在1983年,Pennica等就从人的黑色素瘤细胞株(Bowes melanoma)中获得了tPA的全长cDNA序列,并在E.coli中表达成功。但是由于包含体的变复性困难,所以利用E.coli生产有医药用途的完整tPA分子的工作一直没有成功(Genbank GI137119;PennicaD,etal Nature 301(5897)214-21,1983)。尽管在E.coli中表达有生物学活性tPA分子有比较大的难度,但是研究者通过基因工程手段表达各种tPA衍生物的研究却进行了很多尝试,这也促成了一系列tPA突变体的问世,如最早于1996年批准上市的德国Boeringher Mannheim公司在E.coli中表达的Reteplase(商品名Retavase)。虽然早在1987年就有用黑色素瘤细胞株产生的天然tPA作医药用途的研究报道,但基因工程方法生产完整tPA的工作却是美国的Genetech公司最先在CHO细胞中完成的(商品名Activase),并于1998年经FDA批准上市。
tPA分子中有五个结构域这包括环形指状结构域(Val4~Ser50,F区)、生长因子结构域(Cys51~Asp87,G区)、Kringlel(Thr88~Gly176,K1区)和Kringle2(Asn177~Arg275,K2区)和丝氨酸蛋白酶(Ile276~Pro527,SP区)结构域,其中丝氨酸蛋白酶结构域是tPA分子的活性结构域,其活性中心由His325、Asp374和Ser481组成(Allen,S.,etal.,J.Biol.Chem.2704797-4804,1995)。研究证实,在这五大结构域中,F区和K2区具有特异性结合血栓中纤维蛋白的功能,相当于分子的导向性结构域。tPA同纤维蛋白结合后发生构象变化,进而有利于同游离血浆中纤溶酶原的进一步结合,从而形成“纤维蛋白-tPA-纤溶酶原”的三联复合物,由于复合物内tPA的丝氨酸蛋白酶(即SP区)的积聚,加速了催化复合物中纤溶酶原转变成纤溶酶的过程,就使血栓处的纤溶酶量大增,保证了快速溶栓过程的进行。也就是这种溶栓机制保证了tPA只溶解已形成的血栓,而不会导致全身广泛性出血的发生,这也正是它优于尿激酶和链激酶之处。天然tPA或Genetech公司的Activase是由527个氨基酸残基组成的单链糖蛋白分子,有17对二硫键,三个糖基化位点,由于糖基化程度上的差别,所以实际分子量在67~72kDa之间(简称sc-tPA,单链tPA)。sc-tPA分子在纤溶酶、组织激肽释放酶等作用下,其分子中Arg275-Ile276间的肽键水解断裂就形成双链的tPA分子(简称dc-tPA,双链tPA),这种转变就使得sc-tPA的N端片段(Ser1~Arg275)成为dc-tPA的A-链(也称重链),而分子的C-端片段(Ile276~Pro527)就是dc-tPA的B-链(也称轻链),不过dc-tPA分子中的A-链和B-链仍然依靠二硫键连接在一起。
需要特别指出的是,由于生产工艺上的差别,早期生产的tPA往往是sc-tPA和dc-tPA的混合物,而且实际研究也发现,虽然sc-tPA和dc-tPA的分子量相同,但是dc-tPA的活性比sc-tPA的约高出10倍,不过sc-tPA结合纤维蛋白的能力却比dc-tPA高,而且sc-tPA一旦结合纤维蛋白后就很快转变成dc-tPA。因此,tPA在作溶栓用途时可以使用含少量dc-tPA的sc-tPA,当然最好是用sc-tPA或K2+SP组成的单链tPA作为治疗用途。
由上面的描述可见,tPA的活性中心区是一种纤维蛋白依赖型丝氨酸蛋白酶(fibrin-dependent serine protease)分子,只不过是它结合了纤维蛋白后再有很强的结合并激活纤溶酶原的功能,所以临床使用tPA不会广泛地激活游离在血液中的纤溶酶原,因此也就不会对全身的纤溶系统产生不良影响。正基于此,tPA被公认为继链激酶和尿激酶之后的“第二代溶栓药物”,所以基因重组tPA是目前溶栓治疗中作为“黄金标准”的首选药物。
综上所述,从分子生物学水平上看,只要保留天然tPA的K2区和SP区,也就能保证tPA分子主要功能区纤维蛋白结合区和纤溶酶原激活区,这种精简后的分子仍然具有完整tPA的全部功能,而这正是现已上市的Reteplase的核心序列。本专利中设计的tPA突变体就是以此为基础,突变掉两个可能的N-糖基化位点后的一种变异体rPA,其基因及氨基酸序列参见SEQ-2和SEQ-3。
完整tPA分子临床应用的最大缺点是半衰期短,使用剂量大。这种在体内降解快速的本质原因是肝细胞表面有tPA受体,血浆中有破坏tPA的蛋白PAI-1。利用基因工程技术去除tPA分子的某些结构域或突变掉某些氨基酸残基,获得很多仍然具有完整tPA活性的tPA衍生物,更为关键的是,这些突变体的药代特征明显得到了改善,已经有两个tPA衍生物(Reteplase和Tenecteplase)被批准上市就是最好的例证。
自1983~1996年这十多年间,利用原核系统,特别是E.coli生产tPA的工作一直都没有停止过,但由于在原核表达系统中tPA都是以包含体的形式存在,最终的tPA活性收率都不理想。不过,研究者通过分子生物学的手段,删除tPA的非关键性结构域(如,F区、G区和K1区),将这种突变型tPA在大肠杆菌中表达-纯化成功,如Boeringher Mannheim公司的Reteplase(Retavase)就在技术上克服了这一难题。不过需要指出的是,国内目前也有四到五家制药企业成功仿制了Reteplase,但是整个生产工艺流程中rPA的活性收率仍不尽人意,生产成本居高不下。虽然Genetech公司成功开发了Activase,但是2000年他又推出对天然tPA的多个氨基酸残基(103、117、296~299位六个氨基酸残基)进行突变的tPA,简称TNK-tPA(商品名Tenecteplase),这种突变后的tPA在体内的半衰期显著增加,减少了临床的用药量。这些事实都表明,进一步开发生产成本低,使用效果好的tPA的研究工作是必要的也是可能实现的。
tPA及其各种突变体在临床上主要用于治疗血栓性疾病,如急性心肌梗塞(AMI,acute myocardial infarction)、肺栓塞(PE,pulmonary embolism)、外周动脉栓塞(PAO,peripheral arterial occlusions)、中风、视网膜动脉栓塞、冠脉造影和冠脉溶栓术等。其主要的生理功能是将纤维蛋白酶原转变成纤维蛋白酶,并进而启动血栓的水解或纤维蛋白的水解。
对研究者有关tPA表达纯化研究情况进行回顾可见不论在原核体系,如E.coli、Bacillus subtilis等(Wang LF,Hum WT,Kalyan NK,Lee SG,Hung PP,Doi RH.Synthesisand refolding of human tissue-type plasminogen activator in Bacillus subtilis.Gene 1989Dec 7;84(1)127-33),还是哺乳动物细胞,如CHO、TRBM6、C127等(Dodd I,JalalpourS,Southwick W,Newsome P,Browne MJ,Robinson JH.Large scale,rapid purification ofrecombinant tissue-type plasminogen activator.FEBS Lett 1986 Dec 1;209(1)13-7)以及酵母(啤酒酵母、巴斯德毕赤酵母等)体系中都能成功表达出有生物学活性的tPA分子(Martegani E,Forlani N,Mauri etal Expression of high levels of human tissueplasminogen activator in yeast under the control of an inducible GAL promoter.ApplMicrobiol Biotechnol Aug;37(5)604-8,1992)。
Martegani E等用Kluyveromyces lactis的一种杀手毒素(Killer Toxin)蛋白前导肽引导,在可诱导、杂合型USAgal/CYC1强启动子控制下,用YEp-sec1载体啤酒酵母表达出单链糖基化的tPA蛋白,分子量为66-72kDa,表达产物主要聚集在胞内膜结构上,采用葡萄糖/半乳糖混合培养的两步补料(two-step fed-batch)发酵法,tPA在细胞内表达量可到100mg/L有活性的tPA,相当于5,000万U/L的表达量。对于位于膜上的tPA是采用高浓度的Tween-80(0.1%)溶液洗脱出来,再用ZnCl2沉淀-透析制备,最终纯品的比活性为160,000U/mg(Martegani E,Forlani N,Mauri etal.Appl MicrobiolBiotechnol Aug;37(5)604-8,1992)但是令人遗憾的是,到目前为止,利用酵母系统表达的tPA尚未有达到生产规模的成功报道,究其原因,主要是产量底,但是酵母对tPA的糖基化修饰也应是原因之一。虽然采用胞内表达或通过突变消除tPA分子中的N-糖基化位点后进行直接分泌表达的尝试也有研究者进行过,但是这两种表达方式的产量也都很低。因此,如何提高tPA在酵母体系中的表达量将是一项理论和实际意义都很重大的研究工作。
根据大量的研究结果得知,tPA是一种多二硫键多结构域的糖蛋白,在E.coli中实现表达是不成问题的,但是E.coli的蛋白表达体系自身的不足就决定了产生正确折叠的tPA分子是十分困难的。CHO细胞等真核系统可以突破这一瓶颈,因为自然状态下,哺乳动物的许多组织细胞都能分泌tPA。据此推测,哺乳动物细胞中应该存在一套加工处理tPA的分泌修饰体系,tPA前提分子转变成的活性tPA分子不会对细胞构成损害,也就是表达量可以维持在比较高的水平,我们推测酵母系统中没有CHO等哺乳动物细胞所具有的这样一种分泌加工处理体系,所以表达的tPA对酵母细胞是有毒害作用的,细胞会自发地阻止tPA的表达,所以不论胞内或是分泌表达都难以保证高产量。当然也有一种可能是,tPA基因转录出的mRNA很不稳定,使tPA蛋白的翻译产量十分有限,自然表达产量不会高。能不能利用一种蛋白来促进tPA的折叠、转运出细胞,或利用一段mRNA分子保护tPA的mRNA,来减少其降解呢?为此,我们考虑到用象原核表达系统一样,采用的融合表达方式,利用分子伴侣(或Tag)来实现tPA在酵母体系中的高效率表达。事实证明,这种尝试是成功的。
众所周知,人血浆白蛋白(HSA,Human Serum Albumin)在甲醇酵母(Pichiapastoris、Pichia methanolica、Hansenula polymorpha)中能够实现高表达,一般表达可达到5.0~8.0g/L,而现有可检索到在甲醇酵母体系中分泌表达的产量最高的蛋白是非羟化明胶蛋白(gelatin)或非羟化αIII-胶原蛋白,其产量可以高达14.8g/L(Marc.W.T.Werten,etal,Yeast 15,1087-1096,1999)。据此,我们推测,这类极容易被酵母表达的蛋白应该是酵母细胞中也有一套适合表达它们的途径。将这两种蛋白或它们的特定结构域与一些在酵母中难表达蛋白或稳定性差的蛋白连接在一起,就能利用这类蛋白(如,tPA等)的分泌表达方式来实现一些难表达蛋白的高效表达。
如果将完整的HSA或胶原蛋白同tPA连接在一起,进行融合表达,由于HSA、αIII-胶原和tPA的分子都比较大,虽然融合在一起的表达产量可以很高,但是有效(或目的蛋白)产量就不及分子相对较小的分子,所以我们就将完整的HSA、HSA或胶原的特定结构域和tPA的K2+SP结构域融合在一起进行表达,事实证明,这种尝试也是完全成功的。
HSA是由585个氨基酸组成的蛋白,其分子中没有糖基化位点,酵母表达的HAS分子中没有糖基化修饰。研究发现HSA三级结构含有三个相对独立结构域(Domain),分别称结构域I(HSA-DoI,1~197)、结构域II(HSA-DoII,189~385)和结构域III(HSA-DoIII,381~585),利用甲醇酵母不仅能实现高效表达完整的HSA,同样也能单独表达每一个独立的结构域或结构域的组合物分子。这些结构域在融合蛋白中仍能保持自身结构的独立性,不会同其相连接的目的蛋白形成聚合体,所以融合蛋白仍然能显示出目的蛋白的生物学活性。如果在HSA结构域和目的蛋白(如tPA、rPA、Pro-UK、NGF、Pro-Insulin、GLP-1、Exendin-4等)之间插入特定的蛋白酶识别序列,就可以利用蛋白酶切开融合蛋白,得到具有天然N-端的目的蛋白分子。如果在HSA结构域和目的蛋白连接的接头处插入(His)6六聚体,还可以利用螯和层析介质(例如,PharmaciaBiotech公司的Chelating SepharoseFF)从成分复杂的发酵上清液中直接捕获融合蛋白,从而避免了对发酵液进行稀释、超滤等费力耗时的前处理过程,这也极大地缩短了纯化周期,减少了目的蛋白在发酵液中因降解所带来的损失,自发酵液中螯合纯化的rPA融合蛋白及其酶切结果参见图2。
重组tPA已经在Ecoli、鼠的L细胞、CHO细胞和酵母中表达成功。高纯度的tPA活性应该在2~5×105IU/mg。不同来源的tPA比活性有比较大的差别,从下表数据中可以见,单从产量和生物学活性上来比较,利用甲醇酵母系统表达tPA是完全可行的一种方法。

3.膜联蛋白-单链尿激酶活性活性片段融合蛋白(Anx-scUK)的构建临床中广泛使用的溶栓药物主要有尿激酶(Urokinase,UK)、链激酶(Streptokinase,SK)和重组人组织纤溶酶原激活物(tPA)等,在tPA未上市前溶栓治疗的首选药物是UK和SK,但由于UK溶栓的特异性低,而SK的抗原性高,因而它们的临床用途明显将不如tPA及其突变体。目前可用于临床的尿激酶类产品主要有从胎肾细胞培养液中分离制备的UK(商品名Abbokinase,美国Abbott公司)、大肠杆菌中制备的重组尿激酶原(Prourokinase,Pro-UK)(商品名Saruplase,德国Grunrnthal公司)以及国内从尿液中提取的尿激酶(如,天普洛欣等,广东天普(Techpool)公司)。
人尿激酶原(pro-Urokinase,pro-UK)由411个氨基酸残基组成,含有24个半胱氨酸,形成12对二硫键,构成三个结构域表皮生长因子结构域,环柄状结构域和丝氨酸蛋白酶活性结构域。
临床使用尿激酶类产品已经有相当一段时间了,其最大的缺点是溶栓特异性差,大剂量使用时伴有出血等副作用,同时,溶栓治疗后短期内常发生再栓现象,这就给病人造成比较大的危害。因此,国内外的研究者对尿激酶分子的改造一直都在进行着,目的是希望得到一种安全有效的新型溶栓制剂。我国这方面的研究在南京和北京的研究机构(南京大学,中国药科大学,北京大学和中国人民解放军军事医学科学院等)进行的最多也比较系统,譬如现已进入到II期临床研究的Pro-UK就是由军事医学科学院生物工程研究所在国家“863”计划支持下开展的项目,从设计意图上看,有点类似德国Grunrnthal公司的Saruplase,当然其纯化工艺研究中也同样将会面临Grunrnthal公司所遭遇到的难题。一系列基础研究结果都表明,Pro-UK比UK特异性高、半衰期长,但是由于Pro-UK有自催化作用,所以设计表达出Pro-UK的工作无论是在真核细胞(如,CHO、胎肾细胞等)还是在原核细胞(如,E.coli等)中进行,如何避免Pro-UK转变成UK,以及如何除去Pro-UK中的UK都是一个十分棘手的问题,如果用E.coli表达还牵涉到包含体变复性这一难题。在美国FDA及欧洲药典(EP)中都明确规定尿激酶制剂中,Pro-UK的含量必须大于90%,这也证明残留的UK是Pro-UK类药物的最大缺点。
自1985年Holmes克隆了尿激酶原cDNA基因以来,尿激酶原在哺乳动物细胞、昆虫细胞、酵母等体系中都成功的进行了表达。针对现有开发中的尿激酶原类项目中的难点,自1995年以来,Jonathan F等研究者(Jonathan F.T,Shelley E etal,J.Biol.Chem.Vol.270(37)21594-21599,1995)就尝试将人ProUK或UK与人膜联蛋白V(AnnexinV)连接形成ProUK-Annexin V或UK-Annexin V型融合蛋白的研究。
膜联蛋白家族(Annexin)是一类钙离子依赖型磷脂结合蛋白。到目前为止,在人的组织中已发现了至少13个家族成员,这类蛋白质结构具比较高的同源性。其中的膜联蛋白V在钙离子存在条件下,对磷脂酰丝氨酸(Phosphatidylserine,PS)有高亲和力。当血小板活化或细胞凋亡时,位于正常血小板细胞膜内侧的PS就暴露到细胞膜外侧面。而膜联蛋白V与带阴离子磷脂PS的结合就抑制了磷脂依赖型凝血复合物的形成。所以,膜联蛋白V可以和溶栓药物联合,将溶栓药物的引导至血栓形成部位,实现抗凝和溶栓的双重功能,这也将为主动脉栓塞的治疗开辟一个新途径(Perumal Thiagarajan,MD,etal Circulation.1997,962339-2347.)。
在国内,第二军医大学医学遗传室的研究者将一种源于猪绦虫(Taenia solium)的膜结合蛋白B1(Annixin B1)的基因与截短型的人Pro-UK的活性区(即低分子量尿激酶片段)的基因片段用PCR方式拼接形成融合基因anxB1-scuPA,从而利用Novagen公司的pET28a载体在E.coli BL21-CodonPlusTMRIL(DE3)中表达出anxB1-scuPA融合蛋白(Hong-Li Yang etal Acta Biochimical et Biophysica Sinica 36(3)184-190,2004),这种融合蛋白在动物试验研究中发现,它不仅具有UK或Pro-UK的溶栓功能,同时也具有溶栓的特异性。但是到目前为止,具有生产价值的重组尿激酶原方面研究工作都集中在CHO细胞和E.coli中进行的,虽然日本的研究者报道了在甲醇酵母(Pichia pastoris)中实现了ProUK-annexin V融合蛋白的高效表达,但是其发酵过程的非常规性控制方式表明要最终生产的难度还很大(T.Ohya etal Joural of Bioscience and Bioengineering94(5)467~473,2002)。不过这些开创性的研究工作都表明,将完整的UK或UK的活性片段同Annexin连接,不论Annexin在ProUK、UK的N-端或是在C-短,ProUK、UK或Annexin的各自功能都未受影响。
利用PICZa-DoI载体,将Annexin V基因同ProUK的活性片段基因scUK连接,形成Anx-scUK融合基因,在酵母菌中成功实现了Anx-scUK蛋白的高效表达,有关该融合蛋白的基因序列和氨基酸序列参见SEQ-4和SEQ-5,具体构造过程参见实施例3。
4.人的神经生长因子基因及其突变体人神经生长因子(human nerve growth factor,hNGF)是由α,β,γ三种肽链以α2βγ2的形式非共价键结合而成的,该分子含2个锌原子,这有助于复合物分子的稳定。hNGF是对中枢和周围神经元的存活和分化起着重要作用的神经营养因子,并且参与维系神经、免疫和内分泌系统之间的平衡,它对老年痴呆病、某些周围神经病变和脊髓损伤有治疗作用。α亚基MW为26.5kD,无酶活性;γ亚基MW为26.0kD,它含有共价结合的碳水化合物,并具有脂酶活性,γ亚基可将无活性的β亚基转化为有活性的β亚基。β亚基是hNGF的活性亚基部分,它由2个118个氨基酸组成的单链通过非共价键结合形成二聚体,每个单体内有三对二硫键,二聚体的分子量约为26.0kD。利用基因工程的方法生产hNGF制品有深远的研究和应用价值。
人体中产生的hNGF的Asn45位会发生一定比例的N-糖基化修饰,但是糖基化并不是hNGF生物学活性必须的。在CHO细胞中表达的hNGF有几种形式,其组成的单体有117(N-端,SSHP-)、118(N-端,SSSHP-)和120(N-端,RSSSHP-)三种形式,由它们组合的二聚体就118/118(占40~70%)、120/120、118/120及117/118(极少量)。120/120的活性并不是最好,它只有118/118型活性的80~90%,而在患者的临床试验中证实118/118型hNGF的活性比120/120型hNGF高4~5倍。CHO细胞表达的120/120NGF的单体N-端多一个R(Arg)。这也表明N-端序列对NFG的活性非常重要,即使在CHO细胞中表达也难以保证hNGF的N-端的均一性(Burton,Louis E.etalUnited States Patent 6,184,360 Purification of NGF)。
1993年,Nishizawa等人报道,在啤酒酵母(S.cerevisiae)表达系统中,利用α-因子的信号肽,能够表达hNGF,但是分泌表达产量很底,只有1μg/ml(Nishizawa M,Ozawa F,Higashizaki T,et al.Biologically active human and mouse nerve growth factorssecreted by the yeast Saccharom cerevise.Appl Microbiol Biotechnol,1993,38624~630);1998年,国内的研究者范乔等报道了用甲醇酵母(Pichia pastoris)表达了hNGF,表达产量占总发酵上清液总蛋白的14.4%,但是该报道并没有活性测定和表达量方面的具体数据(范乔、刘宏迪等人神经生长因子β亚基的基因在P.pastoris和E.coli中的表达,科学通报,1998,44(6)637~642)。不过,令人遗憾的是,我们没有能够重复出他们的研究结果,也没有检索到有关该项研究的后续报道。因此,我们认为有理由认为Nishizawa等人在酵母中的研究结果是比较可信的,也就是说,采用直接表达的方式在酵母表达系统很难大量产生具有生物学活性的hNGF蛋白。
采用PICZα-DoI系统就可以将hNGF面临的N-端不均一和表达产量低这两个难题很好地解决,由于Asn45位的N-糖基化并不是hNGF活性所必须的,所以我们通过定点突变将Asn替换成Gln,形成如SEQ-6、SEQ-7所示的基因及氨基酸序列,这样重组得到的突变型hNGF(简称mut-hNGF)同天然的hNGF一样有活性。具体过程参见实施例4。
5.纯化制备PICZa-DoI表达系统分泌的融合蛋白的基本过程甲醇酵母分泌表达系统产生的目的蛋白一般都分泌到发酵液中,但是由于酵母发酵采用的是成本低廉的基础盐培养基,所以最终发酵液中盐的浓度很高,一般需要稀释8~15倍,并调节pH才能进行离子交换层析,这样非常不利于大规模纯化。在实际生产中,有人开发出采用超滤浓缩并替换发酵液缓冲体系的方式作为层析纯化之前的处理步骤,但是由于甲醇酵母发酵的时间比较长,一般在50~80小时,而在期间,酵母会产生大量的多糖、杂蛋白和水解蛋白的各种酶等成分,一般超滤膜在处理发酵液后很快就被堵塞,由于超滤膜堆制造的技术上局限,一般在使用有限几次后就有明显的渗漏,使超滤浓缩过程的中的损失大大增加。正是基于酵母表达系统这方面的难题,所以本专利特意在融合蛋白的接头处设计了六个组氨酸组成的(His)6序列,采用价格同常规的离子交换介质向相当的Ni2+-螯合亲和层析,就可直接从发酵液中捕获融合蛋白,采用降低pH洗脱目的蛋白或采用增加咪唑浓度就可以从亲和介质上洗脱下融合蛋白;由此采用脱盐柱(G25)脱盐或咪唑就可以进行酶切或化学切割,之后,上离子交换或再进行Ni2+-螯合层析就可以获得纯度合乎要求的目的蛋白。
由于Ni2+-螯合介质受普通的盐和变性剂影响很小,高浓度的盐(如,NaCl等)和变性剂(如,尿素、盐酸胍等)还有利于其特异性结合,所以发酵上清液不仅不需要稀释或脱盐处理,还需要向其中添加NaCl或尿素等,因此此套表达方式虽然多了一步酶切或化学切割,但是整个生产工艺的时间并没有增加。由于下游纯化过程中目的蛋白(即融合蛋白)在发酵液中存在的时间比较短暂,这也有利于产量的稳定。将该表达系统纯化的工艺流程可以概括如图3。


图1.PICZa-DoI载体表达载体PICZa-DoI的构造过程示意图(图1a),表达载体PICZa-DoI的物理图谱(图1b)及该载体多克隆位点(MCS)区域的碱基序列(图1c)。
图2.甲醇酵母分泌表达HSA-DoI-rPA融合蛋白及其酶切产物的SDS-PAGE电泳A代表Ni2+螯合纯化产物,B为A经过rTEV蛋白酶酶切后的产物,其中箭头所指为rPA蛋白。M为蛋白分子量标准。
图3.PICZa-DoI分泌表达产物的纯化的一般流程实施例1表达载体PICZa-DoI的构建本载体是在Invitrogen公司商品化分泌型载体pPICZαA的基础上改造而成,它同pPICZαA的最大区别在于α-信号肽序列之后插入HSA的结构域I(HSA-DoI),而且消除了pPICZα系列载体中多克隆位点之后的c-myc epitope和6×His区。
1.pPICZαA载体参见Invitrogen公司的操作手册pPICZαA,B,and C-----Pichia expression vectors forselection on ZeocinTMand purification of secreted,recombinant proteins(Catalog no.V 195-20)。
2.HSA的结构域I(DoI)基因-接头区DNA序列的获得以及PICZa-DoI载体构建购买Biochain公司的商品化人胎肝cDNA文库(LotA604235),合成引物HSA55`-catctc gagaaa aga gat gca cac aag agt gag gtt gct cat cgg ttt aag-3`HSA35`-catgcg gcc gct att ata agc cta agg cag ctt gac-3`按常规PCR操作,就可以PCR出HSA的全基因,长度约1754bp,用限制性内切酶XhoI和NotI双切HSA片段,插入到pPICZαA载体的多克隆位点的XhoI和NotI之间,按常规分子生物学操作方法,就构建pPICZa-HSA载体,测序确认HSA序列的正确无误后,作为获得HSA各结构域基因片段的模板。
HSA-DoI的基因片段的获得是以pPICZa-HSA为模板,用前面从cDNA文库中PCR出HSA基因的5`-端引物HSA5和下面重新合成的HS1R、HS2R和HS3R三条引物经过三轮PCRHS1R5`-cat gcggccgc aga aag ctg gcg gcc ttg gaa gta caa gtt ttc gct aat gga tcc agt act ggt acc tga acc-3`HS2R5`-agt act ggt acc tga acc tcc acc tcc atg gtg atg gtg atg atg gga acc gcc-3HS3R5`-gtg atg atg gga acc gcc acc gcc aga gcc gcc acc acc ggc aga cga agc ctt ccc ttc-5`整个PCR拼接过程见图1a,PCR拼接完成后,柱回收PCR产物,限制性内切酶XhoI和NotI,就得到了含HSA-DoI、Linker等组成的基因片段。以pPICZαA为模板,用下面的DoIA5和DoIA3引物,通过PCR就可以得到pPICZαA载体的1338~1682之间的DNA序列,这段序列中就不包含原载体多克隆位点后面的c-myc epitope和polyhistidine tag区域。
DoIA55`-catgcg gcc gct cattct agatga gtt tgt agc ctt aga cat g-3`DoIA35`-catgga ttcgca caa acg aag gtc tca c-3`将上面PCR得到的两个经限制性内切酶处理后的基因片段同经XhoI和BamHI双切并胶回收的载体片段建立连接反应,转化CaCl2法制备的大肠杆菌NovaBlue(Novagen)感受态,筛选LB+Zeocin平板上的阳性克隆,进行全载体测序,确定序列完全正确的作为标准化载体PICZa-DoI,其全序列参见SEQ-1,整个构造的过程参见图1a。
3.表达载体PICZa-DoIPICZa-DoI的物理图谱及多克隆位点区域的序列参见图1b和图1c。具体使用该载体的要点是将目的基因片段插入到KpnI、ScaI或BamHI与NotI或XbaI之间,但是为保证目的蛋白的N-端同其天然的序列完全一致,必须在KpnI或ScaI或BamHI位点之后再造一个蛋白酶或化学试剂的切割位点对应的DNA序列,这样就可以保证目的蛋白能从表达产生的融合蛋白中顺利切割出来。由于rEK酶对目的蛋白的N-端要求比较低,除了Pro为目的蛋白N-端的蛋白外,一般的氨基酸都可以,所以实际应用最为广泛,但是如果目的蛋白中含有rEK识别的序列或相似序列,就不能使用rEK酶作为切割融合蛋白的手段,例如本专利实施例2中描述的tPA就因为其序列中含有一个rEK酶相似序列(346~355位之间),所以就采用rTEV蛋白酶。但是rTEV蛋白酶的使用范围非常有限,因为该酶切割后的融合蛋白的N-端必须位Gly或Ser,这样大部分蛋白就不适合用rTEV蛋白酶。不过本专利中描述的tPA和hNGF由于N-端分别位Gly和Ser,所以用rTEV蛋白酶均可以。当然,hNGF还可以用rEK酶。
实施例2突变型tPA的表达、测活、纯化和制剂1.突变型tPA基因的获得根据研究的文献报道,人工合成了tPA活性片段的全基因序列,并且在合成时就将原tPA的第184和448位Asn均突变为Gln,这样可以避免酵母分泌表达时tPA蛋白分子中可能发生的N-糖基化修饰。人工合成的全基因序列见SEQ-2,对应的氨基酸序列见SEQ-3。
2.表达产物的活性测定表达载体的构建及工程菌株的筛选均采用Invitrogen手册中的常规方法。tPA基因片段在KpnI和NotI之间插入,在KpnI位点后面再造了rTEV蛋白酶的识别序列Glu-Asn-Leu-Tyr-Phe-Gln-Ser对应的DNA序列,其中Ser是tPA的N-端第一个氨基酸残基。将tPA基因插入PICZa-DoI载体所用的两条引物如下TPA55`-catggt accgaa aac ttg tac ttc caa tct tac caa ggt aac tct gac tgc tac ttt g-3`TPA35`-catgcggccgccctagaa ttctta tca tgg tct cat att gtc acg aat c-3`表达克隆的筛选采用发色底物(S2251)法,筛选同样发酵诱导条件下表达产量(活性)高的菌株作为工程菌株,并送交CCTCC保藏,其保藏编号为CCTCC No.M204029。
3.突变型tPA的纯化将上面M204029的工程菌在30L发酵罐中按甲醇酵母常规方法发酵,增殖阶段的pH为5.0,诱导时阶段补加甲醇时,用氨水将发酵的pH调整至6.4,保持DO(发酵溶氧值)不低于20%,诱导45小时,终止发酵,离心收集发酵上清液,向发酵液中加5M的NaCl溶液至NaCl在发酵液中终浓度为0.2~0.3M,再加入30%的Tween-80至终浓度为0.05~0.10%,然后,用1N的NaOH将发酵液pH调为7.4。最后,将1.0M pH7.4磷酸钠缓冲加入到发酵液中,使其在发酵液中的终浓度约为40mM,0.45Φ膜过滤或高速离心除去沉淀后的发酵液就可以上样于Ni2+-螯合层析介质,开始第一步纯化。
4.变型tPA的制剂tPA蛋白在水溶液中的溶解性不高,采用精氨酸/柠檬酸缓冲体系能保证它有很好的溶解性,我们选择在50M pH6.0柠檬酸-柠檬酸钠、0.15M盐酸精氨酸体系中tPA溶解性最好,所以,制剂配方的基本缓冲体系为柠檬酸盐-盐酸精氨酸组分,pH6.0,另外添加0.5%的人血白蛋白作保护剂,4%的甘露醇作为冻干时的赋型剂。该体系中tPA的溶解量在10~50mg/ml,可以根据不同的规格来确定每支(或毫升)的tPA装量。
实施例3人膜联蛋白V-人尿激酶活性片段融合蛋白(Anx-scUK)的表达合成两条引物,通过PCR方法人胎盘组织cDNA文库中获得人膜联蛋白V的全基因(AnnexinV),而人尿激酶活性片段(简称,scUK)是根据ProUK氨基酸序列144~411位共268个氨基酸序列,采用全基因合成的方法合成该基因片段,其基因序列如SEQ-4所描述。
1.人膜联蛋白V基因的获得人膜联蛋白V基因是通过如下的AnxP5、AnxP3两条引物从Biochiain公司商品化cDNA文库(LotA700109)中PCR得到基因片段,插入pUC18载体之中。引物AnxP5为Annexin V基因的5`-端引入了一个限制性内切酶KpnI切点,同时在Annexin V N-端第一位Met之前导入了肠激酶识别位点Asp-Asp-Asp-Asp-Lys对应的密码子GATGAT GAC GAC AAG;引物AnxP3为Annexin V基因的3`-端添加了连接肽序列Gly-Gly-Gly-Gly-Ala对应的密码子GGA GGA GGT GGC GCC以及限制性内切酶NarI识别序列,通过全基因测序确认后序列完整无误后,用KpnI和NarI双切出AnnexinV片段,作进一步拼接之用。
AnxP55`-catggt accgat gat gac gac aag atg gca cag gtt ctc aga ggc act gtg-3`AnxP35`-catggcgccgcc acc tcc gtc atc ttc tcc aca gag cag-3`2.活性片段基因(scUK)人工全合成人尿激酶144~411位氨基酸序列对应的DNA序列scUK,同时在其5`-端引进限制性内切酶NarI和连接肽Gly-Gly-Gly-Gly-Ser对应的基因序列GGC GCCGGA GGC GGT GGT TCA;在scUK的3`-端添加终止密码子TAA和限制性内切酶NotI对应的序列GCGGCCGC。用NarI和NotI双切出scUK基因。
3.人膜联蛋白V-尿激酶活性片段融合蛋白基因(Anx-scUK)的表达载体的构建将上述双切后的AnnexinV和scUK基因片段同用KpnI和NotI双切后的PICZa-DoI载体建立连接反应,转化E.coli Top10F`感受态,筛选LB+Zeocin平板上的阳性克隆,最终得到表达载体PICZa-DoI-Anx-scUK,按照常规的方法转化甲醇酵母X-33宿主菌,根据中华人民共和国药典2000年二版P323~324中描述的方法,对阳性克隆进行筛选,选择表达量高的克隆作为工程菌株,送交CCTCC保藏,保藏编号为CCTCCNo.M204030。
实施例4重组突变型人神经生长因子(mut-hNGF)表达与活性测定1.突变型人神经生长因子(mut-hNGF)基因的获得人mut-hNGF基因是以天然118个氨基酸组成人hNGF序列为基础改造而成。因为hNGF的第45位Asn可能会发生N-糖基化修饰,所以,人工全合成其cDNA序列时将该位Asn突变成Gln,该突变型hNGF基因及氨基酸序列组成如SEQ-6、SEQ-7,因而我们将此突变型hNGF特称mut-hNGF。
2.mut-hNGF的表达设计上述人工合成的mut-hNGF序列时就已经在其基因的5`-端加入了KpnI识别位点和rTEV酶对应的DNA序列,3`-端有终止密码子和NotI位点,所以只要将上述1中人工合成的基因用KpnI和NotI双切,就能得到可以插入到PICZa-DoI载体的KpnI-NotI位点的hNGF基因片段,连接转化后就可以筛选-测定出合乎要求的PICZa-DoI-mut-hNGF表达载体。
按常规方法转化,并SDS-PAGE电泳筛选出合乎要求的高表达的克隆,并递交CCTCC进行菌种保藏,保藏编号为CCTCC No.M204031。采用如下3中所述的方法,纯化出mut-hNGF蛋白,并根据下面4中描述的方法确定mut-hNGF的比活性为每毫克蛋白为3.0×104。
3.mut-hNGF的纯化纯化的开始步骤同实施例2,但是,将Ni2+-螯合层析的目的蛋白洗脱液经G-25脱盐柱后,置换融合蛋白于50mM的Tris缓冲液(50mM Tris-HCl,pH8.0,1mM CaCl2,0.1%Tween-20(w/v))中,加入rTEV酶在约15℃条件下酶切融合蛋白约20小时。
当融合蛋白切割效率达到80%左右时向整个体系中加入NaCl至终浓度为0.2M,同时加入尿素至终浓度为4.0M,再上样至Ni2+-螯合层析介质,收集流出液,其中主要成分为mut-hNGF,将流出液用50mM Tris-HCl,pH8.0对倍稀释,上样于Q-Sepharose FF介质上,用10mM Tris-HCl,pH8.0缓冲平衡4~6个柱床体积,再用50mM的醋酸盐缓冲,pH4.0加0.4M的NaCl的溶液一次性洗脱目Q-Sepharose FF介质上的目的蛋白mut-hNGF,将此步收集的目的蛋白洗脱液上CM-Sepharose FF层析介质,用50mM醋酸盐缓冲,pH4.0,0.4M NaCl溶液平衡后,用50mM Tris-HCl,pH9.0缓冲洗脱除去杂蛋白,再用50mM Tris-HCl,pH9.0,0.5mNaCl溶液洗脱目的蛋白mut-hNGF,此时目的蛋白的浓度可达1.2g/ml,纯度不低于98%。
4.mut-hNGF的活性测定参考孙卫民等编著的《细胞因子研究方法学》(人民卫生出版社,1999年7月第1版)P702面中描述的方法,并结合Levi-Montalcini等(Levi-Montalcini,R.,Meyer,H.,&Hamburger,V.Cancer Res.1449~57,1954)的方法,测定上述3中纯化出的mut-hNGF的活性a).解剖8~9日龄的鸡胚背神经根细胞,用含10%小牛血清的DMEM培养液悬浮细胞并计数;b).用多聚赖氨酸(Sigma公司,MW为56kDa)包被的过的24孔培养板,用含小牛血清的DMEM培养液稀释细胞,按4.5×104细胞/cm2密度加入每个培养孔中。42℃,5%CO2饱和的水汽二氧化碳培养箱中培养15小时;c).用无钙、镁离子的Hanks液洗涤培养孔2次。加入无血清培养液,5ng/ml的bFGF和一系列稀释后的mtu-hNGF待测样品及标准品,每孔总体积为0.5ml。在42℃,5%CO2饱和的水汽二氧化碳培养箱中培养48小时;d).更换同样稀释浓度的mut-hNGF待测样品和标准品的无血清培养液。以后每48小时更换一次,更换2次(约140~150小时);e).在显微镜下对每个视野中的细胞计数。用细胞数对标准品稀释浓度(活性)作图,计算并确定纯化的mut-hNGF的比活性。
最后确定本专利中的巴斯德酵母工程菌表达的mut-hNGF比活性为3.0×104/毫克。蛋白质和DNA序列描述SEQ-1序列的资料(1).序列特征a.长度4159bpb.类型核苷酸c.拓扑学环状(2).分子类型人工合成的DNA(3).序列描述SEQ-1agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg 50
acatccacag gtccattctc acacataagt gccaaacgca acaggagggg 100atacactagc agcagaccgt tgcaaacgca ggacctccac tcctcttctc 150ctcaacaccc acttttgcca tcgaaaaacc agcccagtta ttgggcttga 200ttggagctcg ctcattccaa ttccttctat taggctacta acaccatgac 250tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga 350gggctttctg agtgtggggt caaatagttt catgttcccc aaatggccca 400aaactgacag tttaaacgct gtcttggaac ctaatatgac aaaagcgtga 450tctcatccaa gatgaactaa gtttggttcg ttgaaatgct aacggccagt 500tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt cttgtttggt 550attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga 650aacacccgct ttttggatga ttatgcattg tctccacatt gtatgcttcc 700aagattctgg tgggaatact gctgatagcc taacgttcat gatcaaaatt 750taactgttct aacccctact tgacagcaat atataaacag aaggaagctg 800ccctgtctta aacctttttt tttatcatca ttattagctt actttcataa 850ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc 950cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 1000ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc 1050tgtcatcggt tactcagatt tagaagggga tttcgatgtt gctgttttgc 1100cattttccaa cagcacaaat aacgggttat tgtttataaa tactactatt 1150gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagatgc 1200acacaagagt gaggttgctc atcggtttaa agatttggga gaagaaaatt 1250tcaaagcctt ggtgttgatt gcctttgctc agtatcttca gcagtgtcca 1300tttgaagatc atgtaaaatt agtgaatgaa gtaactgaat ttgcaaaaac 1350atgtgttgct gatgagtcag ctgaaaattg tgacaaatca cttcataccc 1400tttttggaga caaattatgc acagttgcaa ctcttcgtga aacctatggt 1450aaaatggctg actgctgtgc aaaacaagaa cctgagagaa atgaatgctt 1500cttgcaactc aaagatgaca acccaaacct cccccgattg gtgagaccag 1550aggttgatgt gatgtgcact gcttttcatg acaatgaaga gacatttttg 1600aaaaaatact tatatgaaat tgccagaaga catccttact tttatgcccc 1650ggaactcctt ttctttgcta aaaggtataa agctgctttt acagaatgtt 1700gccaagctgc tgataaagct gcctgcctgt tgccaaagct cgatgaactt 1750cgggatgaag ggaaggcttc gtctgccggt ggtggcggct ctggcggtgg 1800cggttcccat catcaccatc accatggagg tggaggttca ggtaccagta 1850ctggatccga aaacttgtac ttccaagcgg ccgccattct agatgagttt 1900gtagccttag acatgactgt tcctcagttc aagttgggca cttacgagaa 1950gaccggtctt gctagattct aatcaagagg atgtcagaat gccatttgcc 2000tgagagatgc aggcttcatt tttgatactt ttttatttgt aacctatata 2050gtataggatt ttttttgtca ttttgtttct tctcgtacga gcttgctcct 2100gatcagccta tctcgcagct gatgaatatc ttgtggtagg ggtttgggaa 2150aatcattcga gtttgatgtt tttcttggta tttcccactc ctcttcagag 2200tacagaagat taagtgagac cttcgtttgt gcggatcccc cacacaccat 2250
agcttcaaaa tgtttctact ccttttttac tcttccagat tttctcggac 2300tccgcgcatc gccgtaccac ttcaaaacac ccaagcacag catactaaat 2350tttccctctt tcttcctcta gggtgtcgtt aattacccgt actaaaggtt 2400tggaaaagaa aaaagagacc gcctcgtttc tttttcttcg tcgaaaaagg 2450caataaaaat ttttatcacg tttctttttc ttgaaatttt tttttttagt 2500ttttttctct ttcagtgacc tccattgata tttaagttaa taaacggtct 2550tcaatttctc aagtttcagt ttcatttttc ttgttctatt acaacttttt 2600ttacttcttg ttcattagaa agaaagcata gcaatctaat ctaaggggcg 2650gtgttgacaa ttaatcatcg gcatagtata tcggcatagt ataatacgac 2700aaggtgagga actaaaccat ggccaagttg accagtgccg ttccggtgct 2750caccgcgcgc gacgtcgccg gagcggtcga gttctggacc gaccggctcg 2800ggttctcccg ggacttcgtg gaggacgact tcgccggtgt ggtccgggac 2850gacgtgaccc tgttcatcag cgcggtccag gaccaggtgg tgccggacaa 2900caccctggcc tgggtgtggg tgcgcggcct ggacgagctg tacgccgagt 2950ggtcggaggt cgtgtccacg aacttccggg acgcctccgg gccggccatg 3000accgagatcg gcgagcagcc gtgggggcgg gagttcgccc tgcgcgaccc 3050ggccggcaac tgcgtgcact tcgtggccga ggagcaggac tgacacgtcc 3100gacggcggcc cacgggtccc aggcctcgga gatccgtccc ccttttcctt 3150tgtcgatatc atgtaattag ttatgtcacg cttacattca cgccctcccc 3200ccacatccgc tctaaccgaa aaggaaggag ttagacaacc tgaagtctag 3250gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 3300atttcaaatt tttctttttt ttctgtacag acgcgtgtac gcatgtaaca 3350ttatactgaa aaccttgctt gagaaggttt tgggacgctc gaaggcttta 3400atttgcaagc tggagaccaa catgtgagca aaaggccagc aaaaggccag 3450gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 3500ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 3550acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 3600ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 3650cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 3700tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 3750tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 3800cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 3850agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 3900taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 3950agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 4000accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 4050cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 4100acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatc 4159SEQ-2序列的资料(1).序列特征a.长度1103bpb.类型核苷酸c.拓扑学线性
(2).分子类型人工合成的DNA(3).序列描述SEQ-21ggtaccgaaa acttgtactt ccaatcttac caaggtaact ctgactgcta51 ctttggccag ggatcagcct atcgtggcac tcactcttta accgagtcag101 gtgcttcctg tttaccatgg aatagtatga tattgatagg caaggtttac151 acagcacaga atccatctgc tcaaacattg ggtttgggta aacataatta201 ttgtagaaat cctgatggtg atgctaagcc ctggtgccat gtattgaaga251 acagaagatt gacttgggaa tactgtgatg ttcctagctg ttctacctgc301 ggcttgagac aatattctca acctcagttt agaatcaaag gaggtttatt351 cgctgacatt gcctcccacc cctggcaagc tgcaatcttt gctaagcata401 ggaggtcgcc aggagaacgt ttcctatgtg gtggtatatt aatctctagt451 tgttggattt tatctgccgc ccattgcttc caagaaaggt ttccaccaca501 ccacttgact gttattttgg gtagaacata tagagttgtc cctggcgagg551 aagaacagaa atttgaagta gaaaaataca ttgtccataa ggagttcgat601 gatgacactt acgataatga cattgctctg ttgcaattaa aatcagattc651 atccagatgt gctcaagagt cttctgttgt cagaactgtt tgtcttcctc701 cagctgattt gcaactacca gactggacag aatgtgagtt atccggttat751 ggcaagcatg aagccttgtc tcctttctat tcagaacgtt taaaagaagc801 tcatgtgaga ttgtatccct cctctagatg cacatcacaa catttacttc851 aaagaacagt caccgataac atgctgtgcg ctggagatac caggtctggt901 ggtccacaag caaacttgca tgacgcctgc cagggcgatt ctggaggtcc951 gttagtttgt ttgaacgatg gtagaatgac tttggttggt attatctctt1001 ggggtctagg ttgtggacaa aaagatgtcc ctggtgtgta caccaaagtt1051 accaattacc tggactggat tcgtgacaat atgagaccat gataagcggc1101 cgcSEQ-3序列的资料(1).序列特征a.长度355氨基酸b.类型氨基酸c.拓扑学未知(2).分子类型蛋白质(3).序列描述SEQ-3Ser Tyr Gln Gly Asn Ser Asp Cys Tyr Phe Gly Gln Gly Ser Ala1 5 10 15Tyr Arg Gly Thr His Ser Leu Thr Glu Ser Gly Ala Ser Cys Leu20 25 30Pro Trp Asn Ser Met Ile Leu Ile Gly Lys Val Tyr Thr Ala Gln35 40 45Asn Pro Ser Ala Gln Ala Leu Gly Leu Gly Lys His Asn Tyr Cys50 55 60Arg Asn Pro Asp Gly Asp Ala Lys Pro Trp Cys His Val Leu Lys65 70 75Asn Arg Arg Leu Thr Trp Glu Tyr Cys Asp Val Pro Thr Cys Ser
80 85 90Thr Cys Gly Leu Arg Gln Tyr Ser Gln Pro Gln Phe Arg Ile Lys95 100 105Gly Gly Leu Phe Ala Asp Ile Ala Ser His Pro Trp Gln Ala Ala110 115 120Ile Phe Ala Lys His Arg Arg Ser Pro Gly Glu Arg Phe Leu Cys125 130 135Gly Gly Ile Leu Ile Ser Ser Cys Trp Ile Leu Ser Ala Ala His140 145 150Cys Phe Gln Glu Arg Phe Pro Pro His His Leu Thr Val Ile Leu155 160 165Gly Arg Thr Tyr Arg Val Val Pro Gly Glu Glu Glu Gln Lys Phe170 175 180Glu Val Glu Lys Tyr Ile Val His Lys Glu Phe Asp Asp Asp Thr185 190 195Tyr Asp Ash Asp Ile Ala Leu Leu Gln Leu Lys Ser Asp Ser Ser200 205 210Arg Cys Ala Gln Glu Ser Ser Val Val Arg Thr Val Cys Leu Pro215 220 225Pro Ala Asp Leu Gln Leu Pro Asp Trp Thr Glu Cys Glu Leu Ser230 235 240Gly Tyr Gly Lys His Glu Ala Leu Ser Pro Phe Tyr Ser Glu Arg245 250 255Leu Lys Glu Ala His Val Arg Leu Tyr Pro Ser Ser Arg Cys Thr260 265 270Ser Gln His Leu Leu Gln Arg Thr Val Thr Asp Asn Met Leu Cys275 280 285Ala Gly Asp Thr Arg Ser Gly Gly Pro Gln Ala Asn Leu His Asp290 295 300Ala Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Cys Leu Asn Asp305 310 315Gly Arg Met Thr Leu Val Gly Ile Ile Ser Trp Gly Leu Gly Cys320 325 330Gly Gln Lys Asp Val Pro Gly Val Tyr Thr Lys Val Thr Asn Tyr335 340 345Leu Asp Trp Ile Arg Asp Asn Met Arg Pro350 355SEQ-4序列的资料(1).序列特征a.长度1794bpb.类型核苷酸c.拓扑学线性(2).分子类型人Annexin V基因和人工合成的尿激酶基因片段的融合DNA
(3).序列描述SEQ-41 atggcacagg ttctcagagg cactgtgact gacttccctg gatttgatga51 gcgggctgat gcagaaactc ttcggaaggc tatgaaaggc ttgggcacag101 atgaggagag catcctgact ctgttgacat cccgaagtaa tgctcagcgc151 caggaaatct ctgcagcttt taagactctg tttggcaggg atcttctgga201 tgacctgaaa tcagaactaa ctggaaaatt tgaaaaatta attgtggctc251 tgatgaaacc ctctcggctt tatgatgctt atgaactgaa acatgccttg301 aagggagctg gaacaaatga aaaagtactg acagaaatta ttgcttcaag351 gacacctgaa gaactgagag ccatcaaaca agtttatgaa gaagaatatg401 gctcaagcct ggaagatgac gtggtggggg acacttcagg gtactaccag451 cggatgttgg tggttctcct tcaggctaac agagaccctg atgctggaat501 tgatgaagct caagttgaac aagatgctca ggctttattt caggctggag551 aacttaaatg ggggacagat gaagaaaagt ttatcaccat ctttggaaca601 cgaagtgtgt ctcatttgag aaaggtgttt gacaagtaca tgactatatc651 aggatttcaa attgaggaaa ccattgaccg cgagacttct ggcaatttag701 agcaactact ccttgctgtt gtgaaatcta ttcgaagtat acctgcctac751 cttgcagaga ccctctatta tgctatgaag ggagctggga cagatgatca801 taccctcatc agagtcatgg tttccaggag tgagattgat ctgtttaaca851 tcaggaagga gtttaggaag aattttgcca cctctcttta ttccatgatt901 aagggagata catctgggga ctataagaaa gctcttctgc tgctctgtgg951 agaagatgac ggaggtggcg gcgccggagg cggtggttca ttaaaatttc1001 agtgtggcca aaagactctg aggccccgct ttaagattat tgggggagaa1051 ttcaccacca tcgagaacca gccctggttt gcggccatct acaggaggca1101 ccgggggggc tctgtcacct acgtgtgtgg aggcagcctc atgagccctt1151 gctgggtgat cagcgccaca cactgcttca ttgattaccc aaagaaggag1201 gactacatcg tctacctggg tcgctcaagg cttaactcca acacgcaagg1251 ggagatgaag tttgaggtgg aaaacctcat cctacacaag gactacagcg1301 ctgacacgct tgctcaccac aacgacattg ccttgctgaa gatccgttcc1351 aaggagggca ggtgtgcgca gccatcccgg actatacaga ccatctgcct1401 gccctcgatg tataacgatc cccagtttgg cacaagctgt gagatcactg1451 gctttggaaa agagaattca tccgactatc tctatccgga gcagctgaaa1501 atgactgttg tgaagctgat ttcccaccgg gagtgtcagc agccccacta1551 ctacggctct gaagtcacca ccaaaatgct atgtgctgct gacccccaat1601 ggaaaacaga ttcctgccag ggagactcag ggggacccct cgtctgttcc1651 ctccaaggcc gcatgacttt gactggaatt gtgagctggg gccgtggatg1701 tgccctgaag gacaagccag gcgtctacac gagagtctca cacttcttac1751 cctggatccg cagtcacacc aaggaagaga atggcctggc cctcSEQ-5序列的资料(1).序列特征a.长度598氨基酸b.类型氨基酸c.拓扑学未知(2).分子类型蛋白质
(3).序列描述SEQ-5Met Ala Gln Val Leu Arg Gly Thr Val Thr Asp Phe Pro Gly Phe1 5 10 15Asp Glu Arg Ala Asp Ala Glu Thr Leu Arg Lys Ala Met Lys Gly20 25 30Leu Gly Thr Asp Glu Glu Ser Ile Leu Thr Leu Leu Thr Ser Arg35 40 45Ser Ash Ala Gln Arg Gln Glu Ile Ser Ala Ala Phe Lys Thr Leu50 55 60Phe Gly Arg Asp Leu Leu Asp Asp Leu Lys Ser Glu Leu Thr Gly65 70 75Lys Phe Glu Lys Leu Ile Val Ala Leu Met Lys Pro Ser Arg Leu80 85 90Tyr Asp Ala Tyr Glu Leu Lys His Ala Leu Lys Gly Ala Gly Thr95 100 105Asn Glu Lys Val Leu Thr Glu Ile Ile Ala Ser Arg Thr Pro Glu110 115 120Glu Leu Arg Ala Ile Lys Gln Val Tyr Glu Glu Glu Tyr Gly Ser125 130 135Ser Leu Glu Asp Asp Val Val Gly Asp Thr Ser Gly Tyr Tyr Gln140 145 150Arg Met Leu Val Val Leu Leu Gln Ala Asn Arg Asp Pro Asp Ala155 160 165Gly Ile Asp Glu Ala Gln Val Glu Gln Asp Ala Gln Ala Leu Phe170 175 180Gln Ala Gly Glu Leu Lys Trp Gly Thr Asp Glu Glu Lys Phe Ile185 190 195Thr Ile Phe Gly Thr Arg Ser Val Ser His Leu Arg Lys Val Phe200 205 210Asp Lys Tyr Met Thr Ile Ser Gly Phe Gln Ile Glu Glu Thr Ile215 220 225Asp Arg Glu Thr Ser Gly Asn Leu Glu Gln Leu Leu Leu Ala Val230 235 240Val Lys Ser Ile Arg Ser Ile Pro Ala Tyr Leu Ala Glu Thr Leu245 250 255Tyr Tyr Ala Met Lys Gly Ala Gly Thr Asp Asp His Thr Leu Ile260 265 270Arg Val Met Val Ser Arg Ser Glu Ile Asp Leu Phe Asn Ile Arg275 280 285Lys Glu Phe Arg Lys Asn Phe Ala Thr Ser Leu Tyr Ser Met Ile290 295 300Lys Gly Asp Thr Ser Gly Asp Tyr Lys Lys Ala Leu Leu Leu Leu305 310 315Cys Gly Glu Asp Asp Gly Gly Gly Gly Ala Gly Gly Gly Gly Ser
320 325 330Leu Lys Phe Gln Cys Gly Gln Lys Thr Leu Arg Pro Arg Phe Lys335 340 345Ile Ile Gly Gly Glu Phe Thr Thr Ile Glu Asn Gln Pro Trp Phe350 355 360Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Val Thr Tyr Val365 370 375Cys Gly Gly Ser Leu Met Ser Pro Cys Trp Val Ile Ser Ala Thr380 385 390His Cys Phe Ile Asp Tyr Pro Lys Lys Glu Asp Tyr Ile Val Tyr395 400 405Leu Gly Arg Ser Arg Leu Asn Ser Asn Thr Gln Gly Glu Met Lys410 415 420Phe Glu Val Glu Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Asp425 430 435Thr Leu Ala His His Asn Asp Ile Ala Leu Leu Lys Ile Arg Ser440 445 450Lys Glu Gly Arg Cys Ala Gln Pro Ser Arg Thr Ile Gln Thr Ile455 460 465Cys Leu Pro Ser Met Tyr Asn Asp Pro Gln Phe Gly Thr Ser Cys470 475 480Glu Ile Thr Gly Phe Gly Lys Glu Asn Ser Ser Asp Tyr Leu Tyr485 490 495Pro Glu Gln Leu Lys Met Thr Val Val Lys Leu Ile Ser His Arg500 505 510Glu Cys Gln Gln Pro His Tyr Tyr Gly Ser Glu Val Thr Thr Lys515 520 525Met Leu Cys Ala Ala Asp Pro Gln Trp Lys Thr Asp Ser Cys Gln530 535 540Gly Asp Ser Gly Gly Pro Leu Val Cys Ser Leu Gln Gly Arg Met545 550 555Thr Leu Thr Gly Ile Val Ser Trp Gly Arg Gly Cys Ala Leu Lys560 565 570Asp Lys Pro Gly Val Tyr Thr Arg Val Ser His Phe Leu Pro Trp575 580 585Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu590 595SEQ-6序列的资料(1).序列特征a.长度354bpb.类型核苷酸c.拓扑学线性(2).分子类型人工合成的DNA
(3).序列描述SEQ-6tcttcttctc acccgatctt ccacaggggc gaattctcgg tgtgtgacag 50tgtcagcgtg tgggttgggg ataagaccac cgccacagac atcaagggca 100aggaggtgat ggtgttggga gaggtgaaca ttcaaaacag tgtattcaaa 150cagtactttt ttgagaccaa gtgccgggac ccaaatcccg ttgacagcgg 200gtgccggggc attgactcaa agcactggaa ctcatattgt accacgactc 250acacctttgt caaggcgctg accatggatg gcaagcaggc tgcctggcgg 300tttatccgga tagatacggc ctgtgtgtgt gtgctcagca ggaaggctgt 350gaga 354SEQ-7序列的资料(1).序列特征a.长度118氨基酸b.类型氨基酸c.拓扑学未知(2).分子类型蛋白质(3).序列描述SEQ-7Ser Ser Ser His Pro Ile Phe His Arg Gly Glu Phe Ser Val Cys1 5 10 15Asp Ser Val Ser Val Trp Val Gly Asp Lys Thr Thr Ala Thr Asp20 25 30Ile Lys Gly Lys Glu Val Met Val Leu Gly Glu Val Asn Ile Gln35 40 45Asn Ser Val Phe Lys Gln Tyr Phe Phe Glu Thr Lys Cys Arg Asp50 55 60Pro Asn Pro Val Asp Ser Gly Cys Arg Gly Ile Asp Ser Lys His65 70 75Trp Asn Ser Tyr Cys Thr Thr Thr His Thr Phe Val Lys Ala Leu80 85 90Thr Met Asp Gly Lys Gln Ala Ala Trp Arg Phe Ile Arg Ile Asp95 100 105Thr Ala Cys Val Cys Val Leu Ser Arg Lys Ala Val Arg110 118
权利要求
1.一种通过基因工程菌株制备一大类目的蛋白或多肽的方法,通过此方法表达出的蛋白质具有CP-LS-CS-IP样的特征性结构,其中CP-代表伴侣蛋白(CP-,Chaperon Protein)LS-指连接肽的序列(LS-,Linker Squence)CS-是蛋白酶法或化学法切割时的识别肽段序列(CS-,Cleavage Squence)IP-表示目的蛋白或多肽(IP,Interest of Protein/Peptide)。
2.根据权利要求1,CP-可以是哺乳动物的血浆白蛋白或胶原蛋白分子。
3.根据权利要求2,其中的血浆白蛋白可以是完整的血浆白蛋白分子,也可以是血浆白蛋白三个结构域(Domain)中的一个或二个结构域的组合。
4.权利要求3中的血浆白蛋白分子最合适的是人的血浆白蛋白分子(HSA),或HSA的结构域I(HSA-Do I)、结构域II(HSA-Do II)或结构域III(HSA-Do III),也可以是这HAS两个结构域的组合。
5.根据权利要求2,其中的胶原蛋白分子可以是任何一种哺乳动物胶原蛋白的序列,特别是I-型和III-型胶原序列的全部或部分。
6.根据权利要求1,LS-是甘氨酸(Gly)、丝氨酸(Ser)组成的一个或多个Gly4Ser单元或由Gly、Ser组成的随机序列或仅有Gly组成的序列,且在这些单元或序列中分布着一个或几个由六个组氨酸组成的序列(His)6。
7.权利要求6中的LS-连接序列可以是(Gly4-Ser)m-(His)6-(Gly4-Ser)n样序列或(Gly)m-(His)6-(Gly)n、或(Gly/Ser)m-(His)6-(Gly/Ser)n序列,其中的m和n的值可以是1~10之间的任一自然数。
8.根据权利要求1,CS-代表能将目的蛋白或多肽与融合蛋白切割分开的蛋白酶识别的氨基酸序列或化学切割时的特定的氨基酸序列。
9.权利要求8中蛋白酶的识别序列主要有肠激酶(rEK)识别序列-Asp-Asp-Asp-Asp-Arg-(IP)、烟草蚀纹病毒蛋白酶(rTEV)的识别序列-Glu-Asn-Leu-Tyr-Phe-Gln-(Gly/Ser-IP)、凝血酶(Thrombin)识别序列-Leu-Val-Pro-Arg-(IP)或凝血因子Xa的识别序列-Ile-Glu-Gly-Arg-(IP)。
10.根据权利要求1,其中的IP是采用此项技术可以成功表达的目的蛋白或多肽分子,这些目的蛋白或多肽分子就包括组织纤溶酶原激活物(tPA)、尿激酶原(Pro-UK)、尿激酶(UK)、膜联蛋白-尿激酶活性片段融合蛋白(Anx-scUK)、fms-样酪氨酸激酶-3配体(Flt3-Ligand)、神经生长因子(NGF)、甲状旁腺激素(PTH)、Exendin-4、胰岛素原(Pro-Insulin)、Tumastatin、尿胰蛋白酶抑制剂(Bikunin)等,同时也包括不改变其生物学活性的这些蛋白的各种突变体。
11.根据权利要求10中所述的组织纤溶酶原激活物(tPA)可以是人的完整的tPA分子,也可以只是tPA分子的活性功能区。
12.权利要求11中的活性功能区是指人tPA分子的Ser1~Gln3和Gly175~Pro527共355个氨基酸残基共同组成,其中的第186位和450位的Asn均定点突变为Gln,这种突变体具有完整tPA分子的相同或相似的生理作用的rPA。
13.根据权利要求7、9和12,通过人工合成的方法合成LS区、CS区的DNA片段,并借助PCR法拼接出序列SEQ-2所描述的rPA基因序列,该基因序列对应的氨基酸序列为SEQ-3。
14.权利要求1、10,IP可以是完整的人尿激酶原分子,也可以是尿激酶的活性片段,特别是由人的膜联蛋白V(Annexin V,Anx)与尿激酶活性片段(scUK)组成的具有导向性溶栓作用的人膜联蛋白V-尿激酶活性片段融合蛋白(Anx-scUK)。
15.根据权利要求14中所述的膜联蛋白V-尿激酶活性片段融合蛋白(Anx-scUK)具有如SEQ-4、SEQ-5所组成的基因序列和氨基酸序列,其中的尿激酶活性片段是由人尿激酶原的Leu183至Leu450的267个氨基酸残基组成。
16.根据权利要求14、15,融合蛋白中的CS-序列为rEK酶识别序列Asp-Asp-Asp-Asp-Arg-。
17.根据权利要求1、10,IP-可以是118个氨基酸残基组成的人神经生长因子(hNGF),其序列如SEQ-4,融合蛋白中的CS-序列为rTEV酶或rEK酶识别序列,它们均能保证酶切后能得到具有天然N-端的活性mut-hNGF蛋白。
18.根据权利要求1、6、8、9和10,所有采用该表达系统的生产工艺具有从发酵液或纯化洗脱液中捕获融合蛋白用螯合层析介质,接着用酶切或化学法切割融合蛋白这些特征。
全文摘要
本发明涉及一种甲醇酵母通用表达载体PICZa-DoI的构建,其关键是可以利用该表达系统以融合蛋白的方式生产一类常规方法难以高水平表达的外源重组蛋白。采用此表达系统已经成功的表达了突变型人组织纤溶酶原激活物(rPA)、人膜联蛋白V-尿激酶活性片段融合蛋白(Anx-scUK)和突变型人神经生长因子(mut-hNGF)等。该表达系统的产生的融合蛋白可以通过螯合层析(Chelating Sepharose FF)介质从发酵液中直接捕获,经过脱盐、酶切或化学切割开融合蛋白,再用常规的层析介质就可以纯化制备出纯度合乎要求的目的蛋白作为医药用途。
文档编号C12N15/62GK1757745SQ20041001788
公开日2006年4月12日 申请日期2004年4月23日 优先权日2004年4月23日
发明者黄秀东, 李树刚, 于廷和 申请人:黄秀东, 唐德江
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1