肝细胞生长因子的n-端片段的重组表达的方法

文档序号:430444阅读:357来源:国知局
专利名称:肝细胞生长因子的n-端片段的重组表达的方法
技术领域
本发明涉及肝细胞生长因子的包含N-端4个三环的片段的重组表达的方法。
背景技术
肝细胞生长因子(HGF/SF)是由Nakamura,T.,et al.,Biochem.Biophys.Res.Commun.22(1984)1450-1459鉴定和纯化的多肽。还发现肝细胞生长因子与分散因子(scatter factor)(SF)相同,Weidner,K.M.,et al.,Proc.Natl.Acad.Sci.USA 88(1991)7001-7005。HGF是涉及许多细胞表型的发展的糖蛋白,所述细胞表型包括增殖、细胞分裂发生、分支小管的形成并且在肿瘤细胞的情形中,包括侵入和转移。对于情况综述,见Stuart,K.A.,et al.,Int.J.Exp.Pathol.81(2000)17-30。
已经对于大鼠HGF和人HGF进行了测序和克隆(Miyazawa,K.et al.,Biochem.Biophys.Res.Comm.163(1989)967-973;Nakamura,T.,et al.,Nature 342(1989)440-443;Seki,T.,et al.,Biochem.and Biophys.Res.Comm.172(1990)321-327;Tashiro,K.,et al.,Proc.Natl.Acad.Sci.USA 87(1990)3200-3204;Okajima,A.,et al.,Eur.J.Biochem.193(1990)375-381)。
HGF是与人纤维蛋白溶酶原具有高类似性的蛋白质(38%的氨基酸序列同一性)。HGF和纤维蛋白溶酶原都作为单链多肽进行合成,所述单链多肽被蛋白水解加工为二硫键连接的杂二聚体。HGF包含N端结构域四个连续的三环结构域和羧基端蛋白酶样的结构域。已经描述了不同的截短的HGF变体。NK1是描述的最短的HGF变体。NK1包含氨基酸32-210,并且在第一个三环结构域后被截短(Lokker,N.A.,和Godowski,P.J.,J.Biol.Chem.268(1993)17145-17150)。NK2由N-端氨基酸末端和三环1和三环2组成并且是备选剪接的HGF mRNA的天然存在的产物(Chan,A.M.,et al.,Science 254(1991)1382-1385)。此外,包含HGF的重链的部分(氨基酸1-494,包含来自氨基酸1-463的HGF的α-亚基)的HGF变体由Lokker,N.A.,EMBO J.11(1992)2503-2510)所述。
还发现由HGF/SF的N-端发夹序列结构域和四个三环结构域组成的称为NK4的HGF/SF片段具有完全不同于HGF/SF的那些的药理学性质,是HGF/SF影响结肠癌细胞的运动性和侵入的拮抗剂,并且此外,是抑制肿瘤生长和转移的血管发生抑制剂(Parr,C.,et al.,Int.J.Cancer 85(2000)563-570;Kuba,K.,et al.,Cancer Res.60(2000)6737-6743;Date,K.,et al.,FEBS Lett.420(1997)1-6;Date,K.,et al.,Oncogene 17(1989)3045-3054)。
按照现有技术(Date,K.,et al.,FEBS Lett.420(1997)1-6)通过HGFcDNA在CHO细胞中的重组表达和随后用胰腺弹性蛋白酶进行消化来制备NK4。在大肠杆菌中产生分别编码N-端结构域和三环1,和N-端结构域和三环1和2的HGF的两种其它同种型(NK1和NK2)(Stahl,S.J.,Biochem.J.326(1997)763-772)。然而,该方法仅导致约一定量的HGF-衍生的蛋白质,其是总蛋白质的约10-20%。
发明概述本发明提供制备HGF的α-链或其片段(NK多肽)的方法,其通过在微生物宿主细胞中表达编码所述NK多肽的核酸,分离包含以变性形式存在的所述NK多肽的内含体,溶解内含体并且使变性的NK多肽复性(naturation)来进行,其特征在于在所述核酸中,选自由在位点33,35和36的密码子组成的组的氨基酸的密码子的至少其中之一是CGT。
氨基酸(aa)和密码子编号按照在Swiss-Prot P14210中显示的序列来进行,其中aa(氨基酸)1-31指信号序列,aa 32-494指α链,aa 128-206三环1,aa 211-288三环2,aa305-383三环3和aa391-469三环4。
令人惊奇的是发现位点33,35和36的DNA序列(密码子33,35和36编码精氨酸,编号按照M73239)的密码子的至少其中之一的修饰导致表达产量增加约100%或更多。还优选的是氨基酸32的密码子从编码Gln改变为编码Ser从而提高分离N-端甲硫氨酸。
按照本发明的NK多肽由aa 32-494或其N-端片段(总是以aa32开始),优选地片段aa 32-478组成,最小的片段是aa 32-207。按照本发明的所有的NK多肽在按照实施例4的分散测定中显示活性。
本发明还提供编码NK多肽的核酸,所述NK多肽由aa 32-494或其N-端片段组成,以aa32开始,优选地是片段aa 32-x,其中x是介于207和478之间的数字,并且x优选地是207或478,其特征在于选自由位点33,35和36的密码子组成的组的氨基酸的密码子的至少其中之一是CGT。优选地,在位点33,35和36的所有密码子是CGT。
在本发明的优选的实施方案中,aa 32从谷氨酰胺改变为丝氨酸从而提高蛋白质的同质性(N-端甲硫氨酸的裂解)。
还优选的是将两个翻译终止密码子(TAA,TAG和/或和TGA)引入编码NK多肽的核酸的末端从而在等价于需要的多肽的末端的位点终止翻译。
发明详述人HGF是二硫键连接的杂二聚体,其可以通过在氨基酸R494和V495之间的裂解,在463个氨基酸的α-亚基和234个氨基酸的β-亚基中裂解。α-链的N-端的前面是以甲硫氨酸基团开始的31个氨基酸。该片段包括31个氨基酸的信号序列。α-链开始于氨基酸32,并包含四个三环结构域。所谓的“发夹序列结构域”由氨基酸70-96组成。三环1结构域由氨基酸128-206组成。大致上,三环2结构域由α-链的氨基酸211-288组成,三环3结构域由α-链的氨基酸305-383组成,且三环4结构域由α-链的氨基酸391-469组成。存在这些序列的各种变化,其基本上不影响NK多肽的生物学性质(基本上不影响其对HGF拮抗的活性和其抗生血管的活性),其变化描述在,例如WO 93/23541中。此外,NK多肽的长度可以在数个氨基酸内变化,只要其生物学性质不受影响。
NK1由HGF/SFα-链的aa 32到206-210组成,NK2由aa32到288-305组成并且NK4由aa 32到447(resp.469-494)组成。此外,由按照本发明的核酸编码的并且按照本发明重组制备的NK多肽描述于WO 93/23541中并且例如是32-207,32-303,或32-384。NK多肽具有导致对肿瘤生长、血管发生和/或转移的抑制的体内生物学活性。
可以在原核生物中通过重组方式来制备NK多肽。对于在原核宿主细胞中的表达,按照本领域技术人员熟悉的方法来将核酸整合到适合的表达载体中。这样的表达载体优选地包含可调节的/可诱导的启动子。接着将重组载体引入以在适合的宿主细胞诸如,例如大肠杆菌中进行表达,并且将被转化的细胞在容许异源基因表达的条件下进行培养。在发酵后,分离包含变性的NK多肽的内含体。
例如,埃希氏菌属(Escherichia),沙门氏菌属(Salmonella),链霉菌属(Streptomyces)或芽孢杆菌属(Bacillus)适合作为原核宿主生物。对于NK多肽的制备,将包含按照本发明的并且编码NK多肽的DNA的载体以常规方式转化原核生物,并且随后以常规方式进行发酵。然而,使用NK多肽的最初的DNA序列(GenBank M73239)在大肠杆菌中的表达产量非常低。
在细胞质中发现内含体,因为待表达的基因不包含信号序列。这些内含体在细胞裂解后,例如通过离心分离自其它的细胞成分。
通过在pH 7-9的磷酸缓冲液中,加入变性剂如6M的盐酸胍或8M的尿素(优选地以0.1-1.0M的浓度,例如0.4M),优选地在DTT(二硫-1,4-苏糖醇)存在的情况下来溶解内含体。将溶解物(solubilisate)在存在GSH/GSSG(优选地2-20mM,谷胱甘肽)和以非变性浓度存在的变性剂(例如,2M的盐酸胍或4M的尿素),或优选地取代盐酸胍或尿素,以约0.3到1.0M浓度存在的精氨酸,优选地以约0.7M的浓度存在的精氨酸的情况下稀释于磷酸缓冲液pH 7-9中。复性优选地在约4℃的温度下进行,并且进行约48到160小时。
按照现有技术,在溶解和复性的过程中使用Tris缓冲液导致相当大量(约50%)的副产物,所述副产物由本发明人鉴定为主要由GSH-修饰的NK多肽组成。相反,令人惊奇地发现使用pH范围在7和9之间,优选地在pH 8和9之间的磷酸钾缓冲液导致NK多肽的产量和纯度的相当大量的提高。
在复性终止后,将所述溶液优选地针对磷酸缓冲液pH 7-9(优选地以0.1-1.0M的浓度,例如0.3M)进行透析达至少24小时,优选地达24-120小时。
可以在按照本发明的方法重组制备和复性水不溶性的变性多肽(内含体)后,优选地通过层析法方法,例如通过亲和层析法,疏水相互作用层析法,免疫沉淀法,凝胶过滤,离子交换层析法,层析聚焦,等电聚焦,选择性沉淀,电泳等来纯化NK多肽。优选通过疏水相互作用层析法,优选地在pH 7-9,在存在磷酸缓冲液的情况下和/或通过使用丁基或苯基琼脂糖来纯化NK多肽。
提供下面的实施例,参考文献,图和序列表来协助理解本发明,在后附的权利要求中提出的真正范围。要理解的是可以在不背离本发明的精神的前提下,在提出的方法中进行改进。
附图描述

图1 以生物量和分离的内含体(IB)存在的NK4蛋白质的SDS-凝胶(10%NuPAGE-SDS,5μl/泳道,从左到右编号)泳道1标准物泳道2生物量泳道3在离心后的上清液泳道4在进一步离心后的上清液泳道5IB制备物泳道6在洗涤后的IB制备物序列的描述SEQ ID NO1编码HGF的α-链的氨基酸序列和DNA序列,按照GenBankM73239的初始序列(没有信号序列)SEQ ID NO2HGF的α-链的蛋白质序列SEQ ID NO3按照本发明的编码NK4的氨基酸序列和DNA序列(氨基酸序列包括N-端甲硫氨酸,DNA序列包括两个终止密码子)SEQ ID NO4NK4的蛋白质序列实施例1NK多肽的重组表达将由HGF的氨基酸位点32到478组成的NK4多肽用于克隆并且在大肠杆菌中重组表达。描述用作DNA源的初始的DNA序列(数据库标识符“gbM73239”)。进行PCR从而扩增和同时修饰编码NK4(Seq ID No1)的DNA。所有的方法在标准条件下进行。
与NK4的初始的DNA序列相比,引入下列变化-去除真核信号肽序列并且融合邻近NK4的氨基酸位点32的ATG起始密码子-将氨基酸位点32(在Seq ID No2中的位点2)从Gln改变到Ser从而改变蛋白质产物的同质性(无Met)-修饰氨基酸的密码子的DNA序列,在位点33(AGG到CGT),35(AGA到CGT),和36(AGA到CGT)从而提高在大肠杆菌中的基因表达-修饰密码子的DNA序列,在位点477(ATA到ATC)和478(GTC到GTT)从而有利于PCR产物向载体插入-将两个翻译终止密码子引入位点479(TAA)和480(TAG)从而在等价于NK4蛋白质结构域的末端的位点来终止翻译。
用限制性内切核酸酶NdeI和BanII来处理PCR-扩增的DNA片段,并且连接于修饰的pQE载体(Qiagen)(消除His-标记以及DHFR编码区域),所述pQE载体用NdeI和BanII进行适当地处理。表达质粒pQE-NK4-Ser(质粒大小4447bp)的元件是T5启动子/lac操纵子元件,NK4编码区域,λ到转录终止区域,rrnB T1转录终止区域,复制的ColE1起点和β-内酰胺酶编码序列。
将连接反应用于转化大肠杆菌感受态细胞,例如具有表达辅助质粒pUBS520的大肠杆菌菌株C600(EP 0 373 365)。分离大肠杆菌菌落并且关于它们的质粒的限制性和序列分析进行特征鉴定。在存在适当的抗生素情况下,于LB培养基中培养重组细胞后,且在通过添加IPTG(1mM)诱导基因表达后,通过NK4蛋白质含量的分析来进行克隆的选择。通过PAGE来比较细胞裂解物的蛋白质图谱。选择显示最高比例的NK4蛋白质的重组大肠杆菌克隆来进行制备过程(production process)。在标准条件下进行发酵并且分离内含体。产量130g/l的细胞的净重,其中30%-40%总蛋白质的NK4NK1和NK2可以以类似方式进行重组制备。
实施例2溶解和复性将内含体在缓冲液中溶解过夜,所述缓冲液包含6M的盐酸胍,0.1M的磷酸钾pH 8.5(用10M KOH来滴定),1mM EDTA,0.01mM DTT。通过Biuret测定来确定溶解的蛋白质的浓度并且最终在室温调节到25mg总蛋白/ml的浓度。
将该NK4-溶解物在缓冲液中稀释到0.4mg/ml的浓度,所述缓冲液包含0.7M的精氨酸,0.1M的磷酸钾pH 8.5(用浓HCl滴定),10mM GSH,5mM GSSG和1mM EDTA。于4℃,将该复性测定温育介于2和8天之间。在获得最大复性有效性后,使用切向流(tangential flow)过滤装置(MW截留值10kDa,Sartorius)来将复性测定的15升体积浓缩到3升。随后,对着包含0.3M的磷酸钾的pH 8.0的50升缓冲液将其透析3次达至少3×24小时,最优共进行5天。
实施例3纯化纯化通过肝素-琼脂糖层析来进行。
缓冲液条件缓冲液A50mM Tris pH 8.0缓冲液B50mM Tris pH 8.0,2M NaCl梯度 5-25% 缓冲液B,2柱体积25-55% 缓冲液B,16柱体积55-100%缓冲液B,0.7柱体积100% 缓冲液B,2柱体积将在0.1M的磷酸钾pH 8.0中的1M硫酸铵加入洗脱物质中,并且于4℃温育过夜。将样品进行离心并且将上清液上载到苯基琼脂糖柱(150ml)上。用1柱体积的1M硫酸铵,50mM的磷酸钾pH 8.0来洗涤所述柱。
洗脱条件缓冲液A1M硫酸铵,50mM磷酸钾pH 8.0缓冲液B50mM磷酸钾pH 8.0,40%乙二醇0-100%缓冲液B,20柱体积实施例4活性的测定a)分散测定将MDCK细胞亚汇合地(subconfluently)培养在组织培养板中。用HGF(10ng/ml)或用HGF和NK4的组合处理细胞。在这些实验中,通过加入10到1000倍摩尔过量的NK4来抑制所述HGF-诱导的细胞分散至少达90%及更多,显示功能活性。
b)增殖测定如在Nakamura,T.,et al.,1989中所述,通过在原初培养物中测量成年大鼠肝细胞的DNA合成来确定NK4对HGF的促有丝分裂活性的抑制。在这些实验中,通过添加10-1000倍摩尔过量的NK4来抑制HGF-诱导的细胞增殖至少达90%及更多,显示功能活性。
c)侵入测定在该测定中,分析了肿瘤细胞的侵入潜能。使用HT115细胞,基本上如在Albini,A.,et al.,Cancer Res.47(1987)3239-3245中所述进行该测定。此外,HGF-诱导(10ng/ml)的细胞侵入可以被10-1000倍摩尔过量的NK4抑制至少达90%及更多,显示功能活性。
实施例5体内活性模型 Lewis肺癌裸鼠肿瘤模型将1×106Lewis肺癌细胞皮下(s.c.)植入雄性裸鼠中(BALB/cnu/nu)。
处理 4天后,在2-4周时期内,每日施用pegylated的NK4一次剂量 1000μg/小鼠/日300μg/小鼠/日100μg/小鼠/日安慰剂结果 用NK4进行的处理显示对原发肿瘤生长和转移的剂量依赖型的抑制,而在安慰剂处理组中没有观察到作用。
参考文献列表Albini,A.,et al.,Cancer Res.47(1987)3239-3245Chan,A.M.,et al.,Science 254(1991)1382-1385Date,K.,et al.,FEBS Lett.420(1997)1-6Date,K.,et al.,Oncogene 17(1989)3045-3054EP 0 373 365Kuba,K.,et al.,Cancer Res.60(2000)6737-6743Lokker,N.A.,and Godowski,P.J.,J.Biol.Chem.268(1993)17145-17150Lokker,N.A.,EMBO J.11(1992)2503-2510Miyazawa,K.et al.,Biochem.Biophys.Res.Comm.163(1989)967-973Nakamura,T.,et al.,Biochem.Biophys.Res.Commun.22(1984)1450-1459Nakamura,T.,et al.,Nature 342(1989)440-443Okajima,A.,et al.,Eur.J.Biochem.193(1990)375-381Parr,C.,et al.,Int.J.Cancer 85(2000)563-570Seki,T.,et al.,Biochem.and Biophys.Res.Comm.172(1990)321-327Stahl,S.J.,Biochem.J.326(1997)763-772Stuart,K.A.,et al.,Int.J.Exp.Pathol.81(2000)17-30Tashiro,K.,et al.,Proc.Natl.Acad.Sci.USA 87(1990)3200-3204Weidner,K.M.,et al.,Proc.Natl.Acad.Sci.USA 88(1991)7001-7005WO 93/23541
序列表<110>霍夫曼-拉罗奇有限公司<120>肝细胞生长因子的N-端片段的重组表达的方法<130>22388 WO<150>EP 04004951.2<151>2004-03-03<160>4<170>PatentIn version 3.2<210>1<211>1389<212>DNA<213>人<220>
<221>CDS<222>(1)..(1389)<223>编码肝细胞生长因子(HGF)的α-链的DNA序列<400>1caa agg aaa aga aga aat aca att cat gaa ttc aaa aaa tca gca aag48Gln Arg Lys Arg Arg Asn Thr Ile His Glu Phe Lys Lys Ser Ala Lys1 5 10 15act acc cta atc aaa ata gat cca gca ctg aag ata aaa acc aaa aaa96Thr Thr Leu Ile Lys Ile Asp Pro Ala Leu Lys Ile Lys Thr Lys Lys20 25 30gtg aat act gca gac caa tgt gct aat aga tgt act agg aat aaa gga 144Val Asn Thr Ala Asp Gln Cys Ala Asn Arg Cys Thr Arg Asn Lys Gly35 40 45ctt cca ttc act tgc aag gct ttt gtt ttt gat aaa gca aga aaa caa 192Leu Pro Phe Thr Cys Lys Ala Phe Val Phe Asp Lys Ala Arg Lys Gln50 55 60tgc ctc tgg ttc ccc ttc aat agc atg tca agt gga gtg aaa aaa gaa 240Cys Leu Trp Phe Pro Phe Asn Ser Met Ser Ser Gly Val Lys Lys Glu65 70 75 80ttt ggc cat gaa ttt gac ctc tat gaa aac aaa gac tac att aga aac 288Phe Gly His Glu Phe Asp Leu Tyr Glu Asn Lys Asp Tyr Ile Arg Asn85 90 95
tgc atc att ggt aaa gga cgc agc tac aag gga aca gta tct atc act 336Cys Ile Ile Gly Lys Gly Arg Ser Tyr Lys Gly Thr Val Ser Ile Thr100 105 110aag agt ggc atc aaa tgt cag ccc tgg agt tcc atg ata cca cac gaa 384Lys Ser Gly Ile Lys Cys Gln Pro Trp Ser Ser Met Ile Pro His Glu115 120 125cac agc ttt ttg cct tcg agc tat cgg ggt aaa gac cta cag gaa aac 432His Ser Phe Leu Pro Ser Ser Tyr Arg Gly Lys Asp Leu Gln Glu Asn130 135 140tac tgt cga aat cct cga ggg gaa gaa ggg gga ccc tgg tgt ttc aca 480Tyr Cys Arg Asn Pro Arg Gly Glu Glu Gly Gly Pro Trp Cys Phe Thr145 150 155 160agc aat cca gag gta cgc tac gaa gtc tgt gac att cct cag tgt tca 528Ser Asn Pro Glu Val Arg Tyr Glu Val Cys Asp Ile Pro Gln Cys Ser165 170 175gaa gtt gaa tgc atg acc tgc aat ggg gag agt tat cga ggt ctc atg 576Glu Val Glu Cys Met Thr Cys Asn Gly Glu Ser Tyr Arg Gly Leu Met180 185 190gat cat aca gaa tca ggc aag att tgt cag cgc tgg gat cat cag aca 624Asp His Thr Glu Ser Gly Lys Ile Cys Gln Arg Trp Asp His Gln Thr195 200 205cca cac cgg cac aaa ttc ttg cct gaa aga tat ccc gac aag ggc ttt 672Pro His Arg His Lys Phe Leu Pro Glu Arg Tyr Pro Asp Lys Gly Phe210 215 220gat gat aat tat tgc cgc aat ccc gat ggc cag ccg agg cca tgg tgc 720Asp Asp Asn Tyr Cys Arg Asn Pro Asp Gly Gln Pro Arg Pro Trp Cys225 230 235 240tat act ctt gac cct cac acc cgc tgg gag tac tgt gca att aaa aca 768Tyr Thr Leu Asp Pro His Thr Arg Trp Glu Tyr Cys Ala Ile Lys Thr245 250 255tgc gct gac aat act atg aat gac act gat gtt cct ttg gaa aca act 816Cys Ala Asp Asn Thr Met Asn Asp Thr Asp Val Pro Leu Glu Thr Thr260 265 270gaa tgc atc caa ggt caa gga gaa ggc tac agg ggc act gtc aat acc 864Glu Cys Ile Gln Gly Gln Gly Glu Gly Tyr Arg Gly Thr Val Asn Thr275 280 285att tgg aat gga att cca tgt cag cgt tgg gat tct cag tat cct cac 912Ile Trp Asn Gly Ile Pro Cys Gln Arg Trp Asp Ser Gln Tyr Pro His290 295 300gag cat gac atg act cct gaa aat ttc aag tgc aag gac cta cga gaa 960Glu His Asp Met Thr Pro Glu Asn Phe Lys Cys Lys Asp Leu Arg Glu305 310 315 320
aat tac tgc cga aat cca gat ggg tct gaa tca ccc tgg tgt ttt acc 1008Asn Tyr Cys Arg Asn Pro Asp Gly Ser Glu Ser Pro Trp Cys Phe Thr325 330 335act gat cca aac atc cga gtt ggc tac tgc tcc caa att cca aac tgt 1056Thr Asp Pro Asn Ile Arg Val Gly Tyr Cys Ser Gln Ile Pro Asn Cys340 345 350gat atg tca cat gga caa gat tgt tat cgt ggg aat ggc aaa aat tat 1104Asp Met Ser His Gly Gln Asp Cys Tyr Arg Gly Asn Gly Lys Asn Tyr355 360 365atg ggc aac tta tcc caa aca aga tct gga cta aca tgt tca atg tgg 1152Met Gly Asn Leu Ser Gln Thr Arg Ser Gly Leu Thr Cys Ser Met Trp370 375 380gac aag aac atg gaa gac tta cat cgt cat atc ttc tgg gaa cca gat 1200Asp Lys Asn Met Glu Asp Leu His Arg His Ile Phe Trp Glu Pro Asp385 390 395 400gca agt aag ctg aat gag aat tac tgc cga aat cca gat gat gat gct 1248Ala Ser Lys Leu Asn Glu Asn Tyr Cys Arg Asn Pro Asp Asp Asp Ala405 410 415cat gga ccc tgg tgc tac acg gga aat cca ctc att cct tgg gat tat 1296His Gly Pro Trp Cys Tyr Thr Gly Asn Pro Leu Ile Pro Trp Asp Tyr420 425 430tgc cct att tct cgt tgt gaa ggt gat acc aca cct aca ata gtc aat 1344Cys Pro Ile Ser Arg Cys Glu Gly Asp Thr Thr Pro Thr Ile Val Asn435 440 445tta gac cat ccc gta ata tct tgt gcc aaa acg aaa caa ttg cga 1389Leu Asp His Pro Val Ile Ser Cys Ala Lys Thr Lys Gln Leu Arg450 455 460<210>2<211>463<212>PRT<213>人<400>2Gln Arg Lys Arg Arg Asn Thr Ile His Glu Phe Lys Lys Ser Ala Lys1 5 10 15Thr Thr Leu Ile Lys Ile Asp Pro Ala Leu Lys Ile Lys Thr Lys Lys20 25 30Val Asn Thr Ala Asp Gln Cys Ala Asn Arg Cys Thr Arg Asn Lys Gly35 40 45Leu Pro Phe Thr Cys Lys Ala Phe Val Phe Asp Lys Ala Arg Lys Gln50 55 60
Cys Leu Trp Phe Pro Phe Asn Ser Met Ser Ser Gly Val Lys Lys Glu65 70 75 80Phe Gly His Glu Phe Asp Leu Tyr Glu Asn Lys Asp Tyr Ile Arg Asn85 90 95Cys Ile Ile Gly Lys Gly Arg Ser Tyr Lys Gly Thr Val Ser Ile Thr100 105 110Lys Ser Gly Ile Lys Cys Gln Pro Trp Ser Ser Met Ile Pro His Glu115 120 125His Ser Phe Leu Pro Ser Ser Tyr Arg Gly Lys Asp Leu Gln Glu Asn130 135 140Tyr Cys Arg Asn Pro Arg Gly Glu Glu Gly Gly Pro Trp Cys Phe Thr145 150 155 160Ser Asn Pro Glu Val Arg Tyr Glu Val Cys Asp Ile Pro Gln Cys Ser165 170 175Glu Val Glu Cys Met Thr Cys Asn Gly Glu Ser Tyr Arg Gly Lau Met180 185 190Asp His Thr Glu ser Gly Lys Ile Cys Gln Arg Trp Asp His Gln Thr195 200 205Pro His Arg His Lys Phe Leu Pro Glu Arg Tyr Pro Asp Lys Gly Phe210 215 220Asp Asp Asn Tyr Cys Arg Asn Pro Asp Gly Gln Pro Arg Pro Trp Cys225 230 235 240Tyr Thr Leu Asp Pro His Thr Arg Trp Glu Tyr Cys Ala Ile Lys Thr245 250 255Cys Ala Asp Asn Thr Met Asn Asp Thr Asp Val Pro Leu Glu Thr Thr260 265 270Glu Cys Ile Gln Gly Gln Gly Glu Gly Tyr Arg Gly Thr Val Asn Thr275 280 285
Ile Trp Asn Gly Ile Pro Cys Gln Arg Trp Asp Ser Gln Tyr Pro His290 295 300Glu His Asp Met Thr Pro Glu Asn Phe Lys Cys Lys Asp Leu Arg Glu305 310 315 320Asn Tyr Cys Arg Asn Pro Asp Gly Ser Glu Ser Pro Trp Cys Phe Thr325 330 335Thr Asp Pro Asn Ile Arg Val Gly Tyr Cys Ser Gln Ile Pro Asn Cys340 345 350Asp Met Ser His Gly Gln Asp Cys Tyr Arg Gly Asn Gly Lys Asn Tyr355 360 365Met Gly Asn Leu Ser Gln Thr Arg Ser Gly Leu Thr Cys Ser Met Trp370 375 380Asp Lys Asn Met Glu Asp Leu His Arg His Ile Phe Trp Glu Pro Asp385 390 395 400Ala Ser Lys Leu Asn Glu Asn Tyr Cys Arg Asn Pro Asp Asp Asp Ala405 410 415His Gly Pro Trp Cys Tyr Thr Gly Asn Pro Leu Ile Pro Trp Asp Tyr420 425 430Cys Pro Ile Ser Arg Cys Glu Gly Asp Thr Thr Pro Thr Ile Val Asn435 440 445Leu Asp His Pro Val Ile Ser Cys Ala Lys Thr Lys Gln Leu Arg450 455 460<210>3<211>1350<212>DNA<213>人工的<220>
<223>编码NK4的dna<220>
<221>CDS<222>(1)..(1350)<400>3
atg tct cgt aaa cgt cgt aat act att cat gaa ttc aaa aaa tca gca48Met Ser Arg Lys Arg Arg Asn Thr Ile His Glu Phe Lys Lys Ser Ala1 5 10 15aag act acc cta atc aaa ata gat cca gca ctg aag ata aaa acc aaa96Lys Thr Thr Leu Ile Lys Ile Asp Pro Ala Leu Lys Ile Lys Thr Lys20 25 30aaa gtg aat act gca gac caa tgt gct aat aga tgt act agg aat aaa 144Lys Val Asn Thr Ala Asp Gln Cys Ala Asn Arg Cys Thr Arg Asn Lys35 40 45gga ctt cca ttc act tgc aag gct ttt gtt ttt gat aaa gca aga aaa 192Gly Leu Pro Phe Thr Cys Lys Ala Phe Val Phe Asp Lys Ala Arg Lys50 55 60caa tgc ctc tgg ttc ccc ttc aat agc atg tca agt gga gtg aaa aaa 240Gln Cys Leu Trp Phe Pro Phe Asn Ser Met Ser Ser Gly Val Lys Lys65 70 75 80gaa ttt ggc cat gaa ttt gac ctc tat gaa aac aaa gac tac att aga 288Glu Phe Gly His Glu Phe Asp Leu Tyr Glu Asn Lys Asp Tyr Ile Arg85 90 95aac tgc atc att ggt aaa gga cgc agc tac aag gga aca gta tct atc 336Asn Cys Ile Ile Gly Lys Gly Arg Ser Tyr Lys Gly Thr Val Ser Ile100 105 110act aag agt ggc atc aaa tgt cag ccc tgg agt tcc atg ata cca cac 384Thr Lys Ser Gly Ile Lys Cys Gln Pro Trp Ser Ser Met Ile Pro His115 120 125gaa cac agc ttt ttg cct tcg agc tat cgg ggt aaa gac cta cag gaa 432Glu His Ser Phe Leu Pro Ser Ser Tyr Arg Gly Lys Asp Leu Gln Glu130 135 140aac tac tgt cga aat cct cga ggg gaa gaa ggg gga ccc tgg tgt ttc 480Asn Tyr Cys Arg Asn Pro Arg Gly Glu Glu Gly Gly Pro Trp Cys Phe145 150 155 160aca agc aat cca gag gta cgc tac gaa gtc tgt gac att cct cag tgt 528Thr Ser Asn Pro Glu Val Arg Tyr Glu Val Cys Asp Ile Pro Gln Cys165 170 175tca gaa gtt gaa tgc atg acc tgc aat ggg gag agt tat cga ggt ctc 576Ser Glu Val Glu Cys Met Thr Cys Asn Gly Glu Ser Tyr Arg Gly Leu180 185 190atg gat cat aca gaa tca ggc aag att tgt cag cgc tgg gat cat cag 624Met Asp His Thr Glu Ser Gly Lys Ile Cys Gln Arg Trp Asp His Gln195 200 205
aca cca cac cgg cac aaa ttc ttg cct gaa aga tat ccc gac aag ggc 672Thr Pro His Arg His Lys Phe Leu Pro Glu Arg Tyr Pro Asp Lys Gly210 215 220ttt gat gat aat tat tgc cgc aat ccc gat ggc cag ccg agg cca tgg 720Phe Asp Asp Asn Tyr Cys Arg Asn Pro Asp Gly Gln Pro Arg Pro Trp225 230 235 240tgc tat act ctt gac cct cac acc cgc tgg gag tac tgt gca att aaa 768Cys Tyr Thr Leu Asp Pro His Thr Arg Trp Glu Tyr Cys Ala Ile Lys245 250 255aca tgc gct gac aat act atg aat gac act gat gtt cct ttg gaa aca 816Thr Cys Ala Asp Asn Thr Met Asn Asp Thr Asp Val Pro Leu Glu Thr260 265 270act gaa tgc atc caa ggt caa gga gaa ggc tac agg ggc act gtc aat 864Thr Glu Cys Ile Gln Gly Gln Gly Glu Gly Tyr Arg Gly Thr Val Asn275 280 285acc att tgg aat gga att cca tgt cag cgt tgg gat tct cag tat cct 912Thr Ile Trp Asn Gly Ile Pro Cys Gln Arg Trp Asp Ser Gln Tyr Pro290 295 300cac gag cat gac atg act cct gaa aat ttc aag tgc aag gac cta cga 960His Glu His Asp Met Thr Pro Glu Asn Phe Lys Cys Lys Asp Leu Arg305 310 315 320gaa aat tac tgc cga aat cca gat ggg tct gaa tca ccc tgg tgt ttt 1008Glu Asn Tyr Cys Arg Asn Pro Asp Gly Ser Glu Ser Pro Trp Cys Phe325 330 335acc act gat cca aac atc cga gtt ggc tac tgc tcc caa att cca aac 1056Thr Thr Asp Pro Asn Ile Arg Val Gly Tyr Cys Ser Gln Ile Pro Asn340 345 350tgt gat atg tca cat gga caa gat tgt tat cgt ggg aat ggc aaa aat 1104Cys Asp Met Ser His Gly Gln Asp Cys Tyr Arg Gly Asn Gly Lys Asn355 360 365tat atg ggc aac tta tcc caa aca aga tct gga cta aca tgt tca atg 1152Tyr Met Gly Asn Leu Ser Gln Thr Arg Ser Gly Leu Thr Cys Ser Met370 375 380tgg gac aag aac atg gaa gac tta cat cgt cat atc ttc tgg gaa cca 1200Trp Asp Lys Asn Met Glu Asp Leu His Arg His Ile Phe Trp Glu Pro385 390 395 400gat gca agt aag ctg aat gag aat tac tgc cga aat coa gat gat gat 1248Asp Ala Ser Lys Leu Asn Glu Asn Tyr Cys Arg Asn Pro Asp Asp Asp405 410 415gct cat gga ccc tgg tgc tac acg gga aat cca ctc att cct tgg gat 1296Ala His Gly Pro Trp Cys Tyr Thr Gly Asn Pro Leu Ile Pro Trp Asp420 425 430
tat tgc cct att tct cgt tgt gaa ggt gat acc aca cct aca atc gtt 1344Tyr Cys Pro Ile Ser Arg Cys Glu Gly Asp Thr Thr Pro Thr Ile Val435 440 445taa tag 1350<210>4<211>448<212>PRT<213>人工的<220>
<223>NK的蛋白质序列<400>4Met Ser Arg Lys Arg Arg Asn Thr Ile His Glu Phe Lys Lys Ser Ala1 5 10 15Lys Thr Thr Leu Ile Lys Ile Asp Pro Ala Leu Lys Ile Lys Thr Lys20 25 30Lys Val Asn Thr Ala Asp Gln Cys Ala Asn Arg Cys Thr Arg Asn Lys35 40 45Gly Leu Pro Phe Thr Cys Lys Ala Phe Val Phe Asp Lys Ala Arg Lys50 55 60Gln Cys Leu Trp Phe Pro Phe Asn Ser Met Ser Ser Gly Val Lys Lys65 70 75 80Glu Phe Gly His Glu Phe Asp Leu Tyr Glu Asn Lyg Asp Tyr Ile Arg85 90 95Asn Cys Ile Ile Gly Lys Gly Arg Ser Tyr Lys Gly Thr Val Ser Ile100 105 110Thr Lys Ser Gly Ile Lys Cys Gln Pro Trp Ser Ser Met Ile Pro His115 120 125Glu His Ser Phe Leu Pro Ser Ser Tyr Arg Gly Lys Asp Leu Gln Glu130 135 140
Asn Tyr Cys Arg Asn Pro Arg Gly Glu Glu Gly Gly Pro Trp Cys Phe145 150 155 160Thr Ser Asn Pro Glu Val Arg Tyr Glu Val Cys Asp Ile Pro Gln Cys165 170 175Ser Glu Val Glu Cys Met Thr Cys Asn Gly Glu Ser Tyr Arg Gly Leu180 185 190Met Asp His Thr Glu Ser Gly Lys Ile Cys Gln Arg Trp Asp His Gln195 200 205Thr Pro His Arg His Lys Phe Leu Pro Glu Arg Tyr Pro Asp Lys Gly210 215 220Phe Asp Asp Asn Tyr Cys Arg Asn Pro Asp Gly Gln Pro Arg Pro Trp225 230 235 240Cys Tyr Thr Leu Asp Pro His Thr Arg Trp Glu Tyr Cys Ala Ile Lys245 250 255Thr Cys Ala Asp Asn Thr Met Asn Asp Thr Asp Val Pro Leu Glu Thr260 265 270Thr Glu Cys Ile Gln Gly Gln Gly Glu Gly Tyr Arg Gly Thr Val Asn275 280 285Thr Ile Trp Asn Gly Ile Pro Cys Gln Arg Trp Asp Ser Gln Tyr Pro290 295 300His Glu His Asp Met Thr Pro Glu Asn Phe Lys Cys Lys Asp Leu Arg305 310 315 320Glu Asn Tyr Cys Arg Asn Pro Asp Gly Ser Glu Ser Pro Trp Cys Phe325 330 335Thr Thr Asp Pro Asn Ile Arg Val Gly Tyr Cys Ser Gln Ile Pro Asn340 345 350Cys Asp Met Ser His Gly Gln Asp Cys Tyr Arg Gly Asn Gly Lys Asn355 360 365Tyr Met Gly Asn Leu Ser Gln Thr Arg Ser Gly Leu Thr Cys Ser Met370 375 380
Trp Asp Lys Asn Met Glu Asp Leu His Arg His Ile Phe Trp Glu Pro385 390 395 400Asp Ala Ser Lys Leu Asn Glu Asn Tyr Cys Arg Asn Pro Asp Asp Asp405 410 415Ala His Gly Pro Trp Cys Tyr Thr Gly Asn Pro Leu Ile Pro Trp Asp420 425 430Tyr Cys Pro Ile Ser Arg Cys Glu Gly Asp Thr Thr Pro Thr Ile Val435 440 44权利要求
1.一种编码肝细胞生长因子的α-链或其N-端片段的核酸,其特征在于在所述核酸中,选自由在位点33,35和36的密码子组成的组的氨基酸的密码子的至少其中之一是CGT。
2.按照权利要求1的核酸,其特征在于在位点33,35和36的氨基酸的密码子是CGT。
3.制备肝细胞生长因子的α-链或其N-端片段(NK多肽)的方法,其通过在微生物宿主细胞中表达编码所述NK多肽的核酸,分离包含以变性形式存在的所述NK多肽的内含体,溶解内含体并且使变性的NK多肽复性来进行,其特征在于在所述核酸中,选自由在位点33,35和36的密码子组成的组的氨基酸的密码子的至少其中之一是CGT。
4.按照权利要求3的方法,其特征在于在位点33,35和36的氨基酸的密码子是CGT。
全文摘要
一种制备肝细胞生长因子的α-链或其N-端片段(NK多肽)的方法,导致了提高的表达产量,所述方法通过在微生物宿主细胞中表达编码所述NK多肽的核酸,分离包含以变性形式存在的所述NK多肽的内含体,溶解内含体并且使变性的NK多肽复性来进行,其特征在于在所述核酸中,选自由在位点33,35和36的密码子组成的组的氨基酸的密码子的至少其中之一是CGT。
文档编号C12N15/70GK1926236SQ200580006678
公开日2007年3月7日 申请日期2005年3月2日 优先权日2004年3月3日
发明者J·奥尔, A·帕帕季米特里乌, C·尚茨, S·泽贝尔 申请人:霍夫曼-拉罗奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1