基因重组肿瘤血管凋亡因子pfk及其衍生融合蛋白的制作方法

文档序号:392027阅读:415来源:国知局
专利名称:基因重组肿瘤血管凋亡因子pfk及其衍生融合蛋白的制作方法
技术领域
本发明涉及基因工程领域,尤其涉及基因重组肿瘤血管凋亡因子PFK、其衍生融合蛋白以及它们的制备方法。
目前,已经在研究中的肿瘤血管抑制药物有百余种,其中有30多种进入临床试验,有数种通过二期临床试验进入三期临床研究阶段。抑制肿瘤血管生成是继手术、放疗、化疗以后实现肿瘤治疗的新的肿瘤治疗途径与传统方法有良好的协同作用。
这些肿瘤血管抑制药物大致可以分为两类一类是化学合成或半合成药物,这一类一般毒副反应较大,应用限制较多;另一类是人体内源性的血管生长抑制因子,如PF4(血小板因子4)(Gengrinovitch S.et alPF4 inhbits themitogenic activity of VEGF125and VEGF165 Using several concurrentmechanisms J.B.C.270.15059-15065 1995),Angiostatin(血管抑素)(O’Relly,M.S.,Holmgren L,Yuen Shing et.al.AntiangiogenicA novelangiogenesis inhibitor that mediates the suppression of metasis by a Lewis lungcarcinoma.Cell,1994,79315),Endostatin(内皮抑素)(O’Relly M.S.et alEndostatinan endogenous inhibitor for of angiogenesis and tumor growth Cell1997 88 277)等,可以通过基因工程方法大量制备,这一类内源性抑制因子毒副反应小,可成为临床应用效果良好的抗肿瘤药物。
人体内存在血管生长与血管生长抑制二个系统,正常成年人二个系统达到平衡。成年人血管内皮细胞寿命仅次于神经细胞,代谢速度很慢。妇女妊娠、月经周期、伤口愈合过程会发生血管新生,而在一般情况下以抑制为主。肿瘤细胞大量分泌血管生长因子,要实现血管抑制需要使用超过体内正常量大得多的抑制因子。如内源性血管生长抑制因子Angiostatin和Endostatin在动物试验中效果良好,副作用轻微,但用量则很大。从动物实验结果推算,人体用量每次注射需以克计。实际临床试验中,每次注射用量为100-350mg,是目前其他基因工程药物的1000倍以上。如果一个患者,每次用100mg,一个疗程30次,则总用量为3克;以100万人(一个疗程的用量)计算是300万克,即3000公斤,这是现有基因工程技术难以实现的。
为此解决上述困难,可以从下述三个方面进行突破一是提高基因工程菌株的表达产量,以适应量的要求;二是优化蛋白质纯化方法,以适应超大规模制药的需要;三是提高药物活性,减少用量。
1999年BOLANOWSKI申请了PCT(WO99/168889)Fusion ProteinsComprising Angiostain Moisty and Their Use in Ant-tunmor Treatmt 0.8.04.1999C12N-15/62 PCT/US98/20464.BOLANOWSKI专利将Angiostatin与EndostatinI型干扰素、Thromdospondin干扰素诱生蛋白10、PF4拼接,以实现融合蛋白的易于是纯化功能和提高活性能效果。
该专利主要运用了Angiostatin,Angiostatin是J FoIkman在1994年发现的血管生长抑制因子,是血浆蛋白Plasminogen(纤溶酶原)的N端的片段,分子量为37-43KD。除抑制血管内皮细胞增殖以外,该蛋白与Plasminogen一样可被lysines-Sepharose4B柱吸附并被6氨基已酸特异洗脱,有易于纯化的特性。利用Angiostatin与Endostatin、PF4等有血管抑制功能的蛋白拼接成融合蛋白,二种异基因具有同功能的蛋白协同作用,提高活性。同时,融合蛋白将保留Angiostatin易于纯化的特点,这是血管生长抑制因子研究方面极好的设计。
本发明是在BOLANOWSKI专利的基础上进行的,是对它的改进,BOLANOWSKI专利中的Anginstatin在酵母中难以表达,与其他基因拼接,更难实现商业化生产。本发明用Angiostatin的活性片段(K1片段)代替BOLANOWSKI专利的Angiostatin,这样分子量小三倍,易于分子改造。然后在K1片段前接上PF4的13个活性氨基酸片段,生成肿瘤血管凋亡因子PFK,肿瘤血管凋亡因子PFK可以干扰血管生内皮细胞生长因子(VEGF)、成纤维细胞生长因子(FGF),从而提高对血管内皮细胞的抑制作用。最后,还可以在血管凋亡因子PFK的基础上进一步与K1、K5、Endostatin等拼接构建融合蛋白,进一步提高抑制活性。
本发明的另一目的在于提供基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白,以及它们的核苷酸序列和氨基酸序列。
本发明的另一目的在于提供基因重组肿瘤血管凋亡因子PFK及其衍生融合蛋白的制备方法。
本发明的目的是这样实现的一种基因重组肿瘤血管凋亡因子PFK的cDNA,它的核苷酸序列为SEQID No.3。它的氨基酸序列为SEQ ID No.4。
一种制备基因重组肿瘤血管凋亡因子PFK的方法,其特征在于,包括从肝脏CDNA文库中用PCR方法扩增K1(Plasminogen Kringle 1),并在其上游引物合成时加入血小板因子4(PF4)的13个氨基酸,用表达质粒pPICZαA转化寄主细胞,培养转化体,获得基因重组肿瘤血管凋亡因子PFK;所述的K1片段的核苷酸序列为SEQ ID No.1,所述的13个氨基酸片段的核苷酸序列为SEQ ID No.2。
一种基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白,其特征在于,它具有以下结构通式PFK-L-Px或PFK-L-Px-L-Py,其中通式中的Px、Py是有血管抑制功能的蛋白或功能片段,如PlasminogenKringle1(k1),Plasminogen Kringle5(k5)、胶原十八C末端的有血管抑制活性片段Endostatin(En)、VEGFR、有血管抑制功能的催乳素片段等;通式的中L是连接两种蛋白的柔性连接臂,其核苷酸序列为SEQ ID No.5,所表达的蛋白质的氨基酸序列为SEQ ID No.6。
上述通式中的Px可为Kringle1(k1),构成的衍生融合蛋白PFK-L-K1的核苷酸序列为SEQ ID No.7,它的氨基酸序列为SEQ ID No.8。
上述通式中的Px可为Plasminogen Kringle 5(k5),所述的K5基因的核苷酸序列为SEQ ID No.9,构成的衍生融合蛋白PFK-L-K5的核苷酸序列为SEQ ID No.10,它的氨基酸序列为SEQ ID No.11。
上述通式中的Px可为Endostatin(En),所述的En基因的核苷酸序列为SEQ ID No.12,构成的衍生融合蛋白PFK-L-En的核苷酸序列为SEQ IDNo.13,它的氨基酸序列为SEQ ID No.14。
上述通式中的Px可为K1,Py为K5,构成的衍生融合蛋白PFK-L-K1-K5的核苷酸序列为SEQ ID No.15,它的氨基酸序列为SEQ ID No.16。
上述通式中的Px可为K1,Py也为K1,构成的衍生融合蛋白PFK-L-K1-K1的核苷酸序列为SEQ ID No.17,它的氨基酸序列为SEQ ID No.18。
一种制备基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白的方法,其特征在于,由PFK基因构建衍生融合蛋白基因,利用酵母表达质粒pPICZ区有12个多克隆基因插入位点,首先将PFK基因插入EcoRI/KpnI位点,测序确认正确后,再在KpnI/XhoI位点插入第二个基因。接着可以在XhoI/NotI位点插入第三个基因。用这种方法,在表达质粒上插入多个基因。通过PFK与K1、K5、Endostatin等基因拼接,制备了多种融合基因,所有基因拼接中,在二个基因之间插入连接基因L,其核苷酸序列为SEQ ID No.5,以表达柔性连接肽L,其氨基酸序列为SEQ ID No.4(丝氨酸、甘氨酸、甘氨酸、甘氨酸.丝氨酸、甘氨酸、甘氨酸、甘氨酸丝氨酸、甘氨酸、甘氨酸、甘氨酸)。利用PEK基因可以构建更多的融合基因。
具体为,首先将PFK基因插入EcoRI/KpnI位点,测序确认正确后,将PFK基因连上一个连接基因L,再在KpnI/XhoI位点插入K1基因。这样就可以得到衍生融合蛋白PFK-L-K1,它的核苷酸序列为SEQ ID No.7,其氨基酸序列为SEQ ID No.8。
具体为,首先将PFK基因插入EcoRI/KpnI位点,测序确认正确后,将PFK基因连上一个连接基因L,再在KpnI/XhoI位点插入K5基因。这样就可以得到衍生融合蛋白PFK-L-K5,它的核苷酸序列为SEQ ID No.10,其氨基酸序列为SEQ ID No.11。
具体为,首先将PFK基因插入EcoRI/KpnI位点,测序确认正确后,将PFK基因连上一个连接基因L,再在KpnI/XhoI位点插入Endostatin基因。这样就可以得到衍生融合蛋白PFK-L-Endostatin,它的核苷酸序列为SEQ IDNo.13,其氨基酸序列为SEQ ID No.14。
具体为,在衍生融合蛋白PFK-L-K1的基础上连上一个连接基因L,接着可以在XhoI/NotI位点插入K5基因。这样就可以得到衍生融合蛋白PFK-L-K1-L-K5,它的核苷酸序列为SEQ ID No.15,其氨基酸序列为SEQ IDNo.16。
具体为,在衍生融合蛋白PFK-L-K1的基础上连上一个连接基因L,接着可以在XhoI/NotI位点插入K1基因。这样就可以得到衍生融合蛋白PFK-L-K1-L-K1,它的核苷酸序列为SEQ ID No.17,其氨基酸序列为SEQ IDNo.18。
融合蛋白PFK及衍生融合蛋白的表达、纯化,含PFK及融合基因的质粒导入酵母,应用酵母表达系统表达融合蛋白,操作按Invitrogen公司提供的操作说明书操作,融合蛋白的用SDS电泳及western blot鉴定表达产物,PFK基因及通过拼接获得的衍生基因,可表达系列融合蛋白。这些融合蛋白均可以通过Lysine-Sepharose4B纯化,对血管内皮细胞有良好的抑制作用。
本发明的效果1.良好的纯化效果含有K1片段的融合蛋白可以用Lysine-sepharose吸附并被6氨基己酸特异洗脱,一次亲和纯化,蛋白质纯度可以提高一万以上。而且洗脱条件十分温和,不会影响蛋白质活性。是可以实现基因药物的超大规模,超高效率,低成本纯化。而且,可以通过K1片段自身拼接成2K、3K改变与Lysine-sepharose 4B的吸附特性,以适应实际纯化工艺的需要。
2.良好的协同作用及活性通过同功能不同基因拼接,基因重组的融合蛋白是实现功能蛋白的性能改善的常用方法,可以使二种蛋白实现协同作用。PF4活性片段干扰VEGF和FGF的作用。PFK的K1片段是Angiostatin的活性片段,诱导血管内皮细胞晚期凋亡,IC50为500nm。它的活性还受培养系统中血管生长因子浓度影响,当血管内皮细胞培养液中生长因子(FGF或VEGF)增加可以完全消除K1或Angistatin的抑制作用,PF4的作用是干扰生长因子FGF和VEGF的作用,因此,K1与PF4的拼接起推挽协同作用。作用于人脐静脉血管内皮细胞抑制IC50为50nm,较K1活性提高10倍,较PF4片段活性高50倍,PFK与其他蛋白融合产生新的融合蛋白的效果更好。
3.融合蛋白可以高效表达Angiostatin在酵母中是低产表达蛋白,由Angiostatin构建的融合蛋白,一般产量含更低。而且PFK的基因较Angiostatin小3倍,由PFK构建的融合蛋白较Angiostatin构建的融合蛋白表达产量高10倍左右,活性较Angiostatin高2倍。
4.融合基因在基因治疗应用中的意义外源基因通过适当载体实施基因治疗,融合蛋白由于协同作用,提高活性,在较低浓度即达到有效水平,为基因治疗提供可能性。
图2为PFK-L-K5的电泳图。A为Marker,B为PFK-L-K5。
图3为PFK-L-En的电泳图。A为Marker,B为PFK-L-En。
实施例1 PFK基因克隆首先按照《精编分子生物学指南》P123方法制备肝组织总mRNA并通过RT-PCR扩增Plasminogen的k1片段(SEQ ID No.1)。PCR上游引物合成时加入PF4基因的39个碱基(PF4基因58-70bp,SEQ ID No.2),具体上游引物和下游引物序列如下P1 5′-gaa ttc ccg ctg tac aag aaa ata att aag aaa ctt ttg gag agt ggc cgg ggc gtgtat ctc tca gag tgc-3′P2 5′-ggt acc tca tca ttc ctc ttc aca ctc aag-3′PCR扩增用Takara Biotech co.Ltd提供的Ex Tag DNA聚合酶,工作条件按该公司提供的操作说明书操作。在琼脂糖电泳凝胶板上可看到分子量约为350bp的基因。按《精编分子生物学实验指南》P91及Takara Biotech co.Ltd为T4连接酶提供的操作说明书,将PCR扩增的带有EcoRI/KpnI酶切位点及带有终止密码子的基因插入Invitrogen公司酵母表达质粒pPICZαA的EcoRI/KpnI位点。电转化方法将含目的基因的质粒导入大肠杆菌Top10F(参见《分子生物学实验指南》P24)。
经含有25mg/ml Zeocin的LB平板培养过夜。第二天取10个菌落分别接种5ml LB培养基培养,用华舜生物价补贴工程有限公司提供的小量质粒提取试剂盒,按其操作说明书提取质粒,送基康生物公司测定基因序列,其核苷酸序列为SEQ ID No.3,其氨基酸序列为SEQ ID No.4。
实施例2 PFK-L-K1基因克隆引物合成P1 5′-ggt acc tct ggc ggc ggc tct ggc ggc ggc tct ggc ggc ggc gtg tat ctc tcatgc-3′P2 5′-ctc gag tca tca ttc ctc ttc aca ctc aag-3′用上述引物以K1基因为模板,PCR扩增带有KpnI/XhoI酶切位点、有连接基因L以及tga tga终止密码的K1片段。用实例1方法在KpnI/XhoI位点插入带有PFK基因的pPICZαA质粒,导入大肠杆茵TOP10F,测序,其核苷酸序列为SEQ ID No.7,其氨基酸序列为SEQ ID No.8。
实施例3 PFK-L-K5基因克隆。
引物设计P1 5′-ggt acc tct ggc ggc ggc tct ggc ggc ggc tct ggc ggc ggc cct gtt gtc ctg cttcca-3′P2 5′-gcg gcc gc tca tca act aaa tga agg ggc cgc aca gc-3′用上述引物,以肝CDNA为模板,PCR扩增带有Kpn/Not1及终止密码子、带有连接臂L的K5片段(其核苷酸序列为SEQ ID No.9),用实施例1相同的方法,插入带有PFK基因的PPICZ A质粒,KpnI/NotI位点导入大肠杆菌TOP10F,测序确认DNA序列的正确性,其核苷酸序列为SEQ IDNo.10,其氨基酸序列为SEQ ID No.11,具体操见作按新编分子生物子操作指南p91实施。
实施例4 PFK-L-Endostatin基因克隆引物设计P1 5′-ggt acc tct cgg cgg cgg tct cgg cgg cgg tct cgg cgg cgg cac agc cac cgcgac ttc-3′P2 5′-gc ggc cgc tca tta ctt gga ggc agt cat gaa-3′用上述引物以肝CDNA为模板,PCR扩增带有KpnI/NotI、连接基因L及终止密码子的Endostatin基因(其核苷酸序列为SEQ ID No.12),用实施例2方法插入带有PFK基因的pPICZαA质粒,将质粒导入Top10F大肠杆菌,测序确认DNA序列与设计相符,其核苷酸序列为SEQ ID No.13,其氨基酸序列为SEQ ID No.14。
实施例5 PFK-L-K1-L-K5基因克隆引物设计P1 5′-ctc gag tct ggc ggc ggc tct ggc ggc ggc tct ggc ggc ggc cct gtt gtc ctg cttcaa-3′P2 5′-gc ggc cgc tca tca atg aaa tga agg ggc cgc-3′用上述引物,以肝CDNA为模板,PCR扩增带有XhoI/NotI及终止密码的Plasminogen K5片段,用实施例2的方法,插入实例带有PFK-K1基因的pPICZαA质粒XhoI/NotI位点,带有PFK-L-K1-L-K5基因的pPICZαA质粒导入Top10F大肠杆菌,测序确定DNA序列与设计相符合,其核苷酸序列为SEQ ID No.15,其氨基酸序列为SEQ ID No.16。
实施例6 PFK-L-K1-L-K1基因克隆引物设计P15′-ctc gag tct ggc ggc ggc tct ggc ggc ggc tct ggc ggc ggc gtgtat ctc tca tgc-3′P25′-gc ggc cgc tcatcattc ctc ttc aca ctc aag-3′用上述引物以K1基因为模板,PCR扩增带有XhoI/NotI酶切位点,有连接臂L基因,有tca tca终止密码子的K1基因片段。用实例2介绍的方法,将基因插入带有PFK-L-L1基因的XhoI/NotI位点。然后将含有PEK-L-K1-L-K1基因的PPICZαA质粒导入TOPlOF大肠杆茵,测序确认序列正确,其核苷酸序列为SEQ ID No.17,其氨基酸序列为SEQ ID No.18。
实施例7 PFK基因酵母表达结果1、PFK基因酵母表达酵母表达系统是从Invitrogen公司购买的PPICZ质粒及相应表达菌株GS115、KH71。将含有基因的质粒用新芝产2001-2B基因导入仪导入酵母,条件是1200V 25mF 200Ω.PFK质粒5-10mg用75%乙醇沉淀,溶解于20μl水中.酵母菌GS115培养到中晚期,80μl电击液中含有的108酵母菌。转化的酵母菌培养于含有25ug/ml zeocin的YPD平板,在4天以后,挑出克隆转移到50ug/ml的Zeocin YPD平板,随后二周内分步接种Zeocin浓度倍增的YPD平板,直到5mg/ml。挑取在5mg/ml Zeocin YPD平板上生长良好的酵母菌用于表达筛选。
用于表达筛选的酵母菌培养于BMMY培养液,加入0.5%甲醇诱导表达产物,72hr培养后,培养上清液用20%三氯醋酸沉淀,经丙酮洗三遍后用于SDS电泳分析。PFK基因酵母表达按照Invitrogen公司操作说明书实施(Amanual of methods for expression of recombinant proteins using pPIcz and pPIczain pichia patoris,catalog No K1 740-01)2.PFK表达产物纯化PFK基因表达产物分泌于酵母培养液中纯化表达产物用的Lysine-sepharose4B购于sigma公司,10ml Lysine-sepharose4B柱用PH7.7 0.1MTris·HCl洗涤,酵母培养上清液用1M tris调至PH7.7,缓慢流过层析柱,经0.1M 6氨基己酸洗脱,用核酸蛋白仪检测蛋白洗脱峰。洗脱蛋白用SDS电泳分析纯度。SOS电泳上显示纯化产物为一条电泳带(见

图1)。经密度扫描仪分折,纯度为92.3%。用紫外比色法测,定摇瓶发酵条件下,PFK产量的为95mg/ml。
3、表达产物活性测定用于活性测定的人脐静脉内皮细胞株自来中科院细胞株,人脐静脉血管内皮细胞培养于含有FGF生长因子的MDM细胞培养液。细胞经胰酶消化后用含有5%小牛血清的1640培养液悬浮,96孔板中每孔加入5000只细胞,酵母表达并纯化的融合蛋白用含5%小牛血清的1640培养液逐步对半稀释至不同浓度,每孔加0.1ml,37℃培养72小时,用常规MTT法测定对脐静脉血管内皮细胞的抑制的百分比。具体操作以下文献实施王树森等1H11内皮细胞株测定血管形成抑制剂的方法研究,徐医学学院报18、176、1998。PFK对人脐静肪血首内皮细胞的抑制作用见表I表I纯化融合蛋白PFK对人脐静肪血首内皮细胞的抑制作用。
浓度(nm) 05102550 100 200 400抑制(%) 0.0 5.2 15.4 30.5 53 61.5 70.0 85.3实施例8 PFK-L-K5基因酵母表达及结果1、PFK-L-K5基因酵母表达,产物纯化及活性测定方法与实施例7相同2、通过Lysine-Sepharose4B纯化,活性电泳分析,可是一条泳带密度扫描显示纯度约为90%(见图2)。约为65ng/ml摇瓶发酵培养条件下表达产量。
3、对人脐静肪血首内皮细胞的抑制作用见表II表II,PFK-L-K5融合蛋白对人脐静脉内皮细胞的抑制作用。
浓度(nm) 0 2.55 102550100 200 400抑制(%) 0 10.0 25.2 45.3 58.2 64.5 70.8 78.9 88.5实施例9 PFK-L-Endostatin基因酵母表达及结果1、PFK-L-Endostatin基因酵母表达,产物纯化及活力测定方法同实施例7。
2、通过Lysine-Sepharose4B纯化,SDS泳显示一条电泳带(见图3),密度扫描仪扫描结果显示纯度为91.5%,摇瓶培养条件表达产量几次平均分85.5mg/L。
3、对血管内皮细胞的抑制作用见表III表III,PFK-L-Endostatin对人脐静内皮细胞的抑制作用。浓度(nm) 01.0 2 4 8 204080200 400抑制率(%)0.0 3.0 10.5 30.2 48.0 55.3 62.1 70.0 78.5 83.2
序列表<110>谈立松陈宇光张尚权<120>基因重组肿瘤血管凋亡因子PFK及其衍生融合蛋白<160>18<170>PatentIn version 3.1<210>1<211>261<212>DNA<213>Human<400>1gtgtatctct cagagtgcaa gactgggaat ggaaagaact acagagggac gatgtccaaa60acaaaaaatg gcatcacctg tcaaaaatgg agttccactt ctccccacag acctagattc 120tcacctgcta cacacccctc agagggactg gaggagaact actgcaggaa tccagacaac 180gatccgcagg ggccctggtg ctatactact gatccagaaa agagatatga ctactgcgac 240attcttgagt gtgaagagga a 261<210>2<211>39<212>DNA<213>human<400>2ccgctgtaca agaaaataat taagaaactt ttggagagt 39<210>3<211>309<212>DNA<213>artificial sequence<220><221>CDS<222>(1)..(309)<223><400>3ccg ctg tac aag aaa ata att aag aaa ctt ttg gag agt ggc cgg gcc 48Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Ala1 5 10 15gtg tat ctc tca gag tgc aag act ggg aat gga aag aac tac aga ggg 96Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30acg atg tcc aaa aca aaa aat ggc atc acc tgt caa aaa tgg agt tcc 144Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser35 40 45act tct ccc cac aga cct aga ttc tca cct gct aca cac ccc tca gag 192Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60gga ctg gag gag aac tac tgc agg aat cca gac aac gat ccg cag ggg 240Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80ccc tgg tgc tat act act gat cca gaa aag aga tat gac tac tgc gac 288Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95att ctt gag tgt gaa gag gaa 309Ile Leu Glu Cys Glu Glu Glu100<210>4<211>103<212>PRT<213>artificial sequence<400>4Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Ala1 5 10 15Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser35 40 45Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95Ile Leu Glu Cys Glu Glu Glu100<210>5<211>36<212>DNA<213>human<220><221>CDS<222>(1)..(36)<223><400>5ctc ggc ggc ggc ctc ggc ggc ggc ctc ggc ggc ggc 36Leu Gly Gly Gly Leu Gly Gly Gly Leu Gly Gly Gly1 5 10<210>6<211>12<212>PRT<213>human<400>6Leu Gly Gly Gly Leu Gly Gly Gly Leu Gly Gly Gly1 5 10<210>7<211>558<212>DNA<213>artificial sequence<220><221>CDS<222>(1)..(558)<223><400>7ctc tca gag tgc aag act ggg aat gga aag aac tac aga ggg acg atg48Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly Thr Met1 5 10 15tcc aaa aca aaa aat ggc atc acc tgt caa aaa tgg agt tcc act tct96Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser Thr Ser20 25 30ccc cac aga cct aga ttc tca cct gct aca cac ccc tca gag gga ctg144Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu Gly Leu35 40 45gag gag aac tac tgc agg aat cca gac aac gat ccg cag ggg ccc tgg192Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly Pro Trp50 55 60tgc tat act act gat cca gaa aag aga tat gac tac tgc gac att ctt240Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp Ile Leu65 70 75 80gag tgt gaa gag gaa ggt acc tct ggc ggc ggc tcc ggc ggc ggc tct288Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly Gly Ser85 90 95ggc ggc ggc gtg tat ctc tca gag tgc aag act ggg aat gga aag aac336Gly Gly Gly Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn100 105 110tac aga ggg acg atg tcc aaa aca aaa aat ggc atc acc tgt caa aaa384Tyr Arg Gly Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys115 120 125tgg agt tcc act tct ccc cac aga cct aga ttc tca cct gct aca cac432Trp Ser Ser Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His130 135 140ccc tca gag gga ctg gag gag aac tac tgc agg aat cca gac aac gat480Pro Ser Glu Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp145 150 155 160ccg cag ggg ccc tgg tgc tat act act gat cca gaa aag aga tat gac528Pro Gln Gly Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp165 170 175tac tgc gac att ctt gag tgt gaa gag gaa 558Tyr Cys Asp Ile Leu Glu Cys Glu Glu Glu180 185<210>8<211>186<212>PRT<213>artificial sequence<400>8Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly Thr Met1 5 10 15Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser Thr Ser20 25 30Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu Gly Leu35 40 45Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly Pro Trp50 55 60Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp Ile Leu65 70 75 80Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly Gly Ser85 90 95Gly Gly Gly Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn100 105 110Tyr Arg Gly Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys115 120 125Trp Ser Ser Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His
130 135 140Pro Ser Glu Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp145 150 155 160Pro Gln Gly Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp165 170 175Tyr Cys Asp Ile Leu Glu Cys Glu Glu Glu180 185<210>9<211>303<212>DNA<213>human<400>9cctgttgtcc tgcttccaga tgtagagact ccttccgaag aagactgtat gtttgggaat 60gggaaaggat accgaggcaa gagggcgacc actgttactg ggacgccatg ccaggactgg120gctgcccagg agccccatag acacagcatt ttcactccag agacaaatcc acgggcgggt180ctggaaaaaa attactgccg taaccctgat ggtgatgtag gtggtccctg gtgctacacg240acaaatccaa gaaaacttta cgactactgt gatgtccctc agtgtgcggc cccttcattt300gat 303<210>10<211>654<212>DNA<213>artificial sequence<220><221>CDS<222>(1)..(654)<223><400>10ccg ctg tac aag aaa ata att aag aaa ctt ttg gag agt ggc cgg ggc48Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Gly1 5 10 15gtg tat ctc tca gag tgc aag act ggg aat gga aag aac tac aga ggg96Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30acg atg tcc aaa aca aaa aat ggc atc acc tgt caa aaa tgg agt tcc144Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser35 40 45act tct ccc cac aga cct aga ttc tca cct gct aca cac ccc tca gag192Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60gga ctg gag gag aac tac tgc agg aat cca gac aac gat ccg cag ggg240Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80ccc tgg tgc tat act act gat cca gaa aag aga tat gac tac tgc gac288Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95att ctt gag tgt gaa gag gaa ggt acc tct ggc ggc ggc tct ggc ggc336Ile Leu Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly100 105 110ggc tct ggc ggc ggc cct gtt gtc ctg ctt cca gat gta gag act cct384Gly Ser Gly Gly Gly Pro Val Val Leu Leu Pro Asp Val Glu Thr Pro115 120 125tcc gaa gaa gac tgt atg ttt ggg aat ggg aaa gga tac cga ggc aag432Ser Glu Glu Asp Cys Met Phe Gly Asn Gly Lys Gly Tyr Arg Gly Lys130 135 140agg gcg acc act gtt act ggg acg cca tgc cag gac tgg gct gcc cag480Arg Ala Thr Thr Val Thr Gly Thr Pro Cys Gln Asp Trp Ala Ala Gln145 150 155 160gag ccc cat aga cac agc att ttc act cca gag aca aat cca cgg gcg528Glu Pro His Arg His Ser Ile Phe Thr Pro Glu Thr Asn Pro Arg Ala165 170 175ggt ctg gaa aaa aat tac tgc cgt aac cct gat ggt gat gta ggt ggt576Gly Leu Glu Lys Asn Tyr Cys Arg Asn Pro Asp Gly Asp Val Gly Gly180 185 190ccc tgg tgc tac acg aca aat cca aga aaa ctt tac gac tac tgt gat624Pro Trp Cys Tyr Thr Thr Asn Pro Arg Lys Leu Tyr Asp Tyr Cys Asp195 200 205gtc cct cag tgt gcg gcc cct tca ttt gat 654Val Pro Gln Cys Ala Ala Pro Ser Phe Asp210 215<210>11<211>218<212>RT<213>artificial sequence<400>11Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Gly1 5 10 15Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser35 40 45Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95Ile Leu Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly100 105 110Gly Ser Gly Gly Gly Pro Val Val Leu Leu Pro Asp Val Glu Thr Pro115 120 125Ser Glu Glu Asp Cys Met Phe Gly Asn Gly Lys Gly Tyr Arg Gly Lys130 135 140Arg Ala Thr Thr Val Thr Gly Thr Pro Cys Gln Asp Trp Ala Ala Gln145 150 155 160Glu Pro His Arg His Ser Ile Phe Thr Pro Glu Thr Asn Pro Arg Ala165 170 175Gly Leu Glu Lys Asn Tyr Cys Arg Asn Pro Asp Gly Asp Val Gly Gly180 185 190Pro Trp Cys Tyr Thr Thr Asn Pro Arg Lys Leu Tyr Asp Tyr Cys Asp195 200 205Val Pro Gln Cys Ala Ala Pro Ser Phe Asp210 215<210>12<211>549<212>DNA<213>human<400>12cacagccacc gcgacttcca gccggtgctc cacctggttg cgctcaacag ccccctgtca 60ggcggcatgc ggggcatccg cggggccgac ttccagtgct tccagcaggc gcgggccgtg120gggctggcgg gcaccttccg cgccttcctg tcctcgcgcc tgcaggacct gtacagcatc180gtgcgccgtg ccgaccgcgc agccgtgccc atcgtcaacc tcaaggacga gctgctgttt240cccagctggg aggctctgtt ctcaggctct gagggtccgc tgaagcccgg ggcacgcatc300ttctcctttg acggcaagga cgtcctgagg caccccacct ggccccagaa gagcgtgtgg360catggctcgg accccaacgg gcgcaggctg accgagagct actgtgagac gtggcggacg420gaggctccct cggccacggg ccaggcctcc tcgctgctgg ggggcaggct cctggggcag480agtgccgcga gctgccatca cgcctacatc gtgctctgca ttgagaacag cttcatgact540gcctccaag549<210>13<211>900<212>DNA<213>artificial sequence<220><221>CDS<222>(1)..(900)<223><400>13ccg ctg tac aag aaa ata att aag aaa ctt ttg gag agt ggc cgg gcc48Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Ala1 5 10 15gtg tat ctc tca gag tgc aag act ggg aat gga aag aac tac aga ggg96Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30acg atg tcc aaa aca aaa aat ggc atc acc tgt caa aaa tgg agt tcc144Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser35 40 45act tct ccc cac aga cct aga ttc tca cct gct aca cac ccc tca gag192Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60gga ctg gag gag aac tac tgc agg aat cca gac aac gat ccg cag ggg240Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80ccc tgg tgc tat act act gat cca gaa aag aga tat gac tac tgc gac288Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95att ctt gag tgt gaa gag gaa ggt acc tct ggc ggc ggc tct ggc ggc336Ile Leu Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly100 105 110ggc tct ggc ggc ggc cac agc cac cgc gac ttc cag ccg gtg ctc cac384Gly Ser Gly Gly Gly His Ser His Arg Asp Phe Gln Pro Val Leu His115 120 125ctg gtt gcg ctc aac agc ccc ctg tca ggc ggc atg cgg ggc atc cgc432Leu Val Ala Leu Asn Ser Pro Leu Ser Gly Gly Met Arg Gly Ile Arg130 135 140ggg gcc gac ttc cag tgc ttc cag cag gcg cgg gcc gtg ggg ctg gcg480Gly Ala Asp Phe Gln Cys Phe Gln Gln Ala Arg Ala Val Gly Leu Ala145 150 155 160ggc acc ttc cgc gcc ttc ctg tcc tcg cgc ctg cag gac ctg tac agc528Gly Thr Phe Arg Ala Phe Leu Ser Ser Arg Leu Gln Asp Leu Tyr Ser165 170 175atc gtg cgc cgt gcc gac cgc gca gcc gtg ccc atc gtc aac ctc aag576Ile Val Arg Arg Ala Asp Arg Ala Ala Val Pro Ile Val Asn Leu Lys180 185 190gac gag ctg ctg ttt ccc agc tgg gag gct ctg ttc tca ggc tct gag624Asp Glu Leu Leu Phe Pro Ser Trp Glu Ala Leu Phe Ser Gly Ser Glu195 200 205ggt ccg ctg aag ccc ggg gca cgc atc ttc tcc ttt gac ggc aag gac672Gly Pro Leu Lys Pro Gly Ala Arg Ile Phe Ser Phe Asp Gly Lys Asp210 215 220gtc ctg agg cac ccc acc tgg ccc cag aag agc gtg tgg cat ggc tcg720Val Leu Arg His Pro Thr Trp Pro Gln Lys Ser Val Trp His Gly Ser225 230 235 240gac ccc aac ggg cgc agg ctg acc gag agc tac tgt gag acg tgg cgg768Asp Pro Asn Gly Arg Arg Leu Thr Glu Ser Tyr Cys Glu Thr Trp Arg245 250 255acg gag gct ccc tcg gcc acg ggc cag gcc tcc tcg ctg ctg ggg ggc816Thr Glu Ala Pro Ser Ala Thr Gly Gln Ala Ser Ser Leu Leu Gly Gly260 265 270agg ctc ctg ggg cag agt gcc gcg agc tgc cat cac gcc tac atc gtg864Arg Leu Leu Gly Gln Ser Ala Ala Ser Cys His His Ala Tyr Ile Val275 280 285ctc tgc att gag aac agc ttc atg act gcc tcc aag900Leu Cys Ile Glu Asn Ser Phe Met Thr Ala Ser Lys290 295 300<210>14<211>300<212>PRT<213>artificial sequence<400>14Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Ala1 5 10 15Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser35 40 45Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95Ile Leu Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly100 105 110Gly Ser Gly Gly Gly His Ser His Arg Asp Phe Gln Pro Val Leu His115 120 125Leu Val Ala Leu Asn Ser Pro Leu Ser Gly Gly Met Arg Gly Ile Arg130 135 140Gly Ala Asp Phe Gln Cys Phe Gln Gln Ala Arg Ala Val Gly Leu Ala145 150 155 160Gly Thr Phe Arg Ala Phe Leu Ser Ser Arg Leu Gln Asp Leu Tyr Ser165 170 175Ile Val Arg Arg Ala Asp Arg Ala Ala Val Pro Ile Val Asn Leu Lys180 185 190Asp Glu Leu Leu Phe Pro Ser Trp Glu Ala Leu Phe Ser Gly Ser Glu
195 200 205Gly Pro Leu Lys Pro Gly Ala Arg Ile Phe Ser Phe Asp Gly Lys Asp210 215 220Val Leu Arg His Pro Thr Trp Pro Gln Lys Ser Val Trp His Gly Ser225 230 235 240Asp Pro Asn Gly Arg Arg Leu Thr Glu Ser Tyr Cys Glu Thr Trp Arg245 250 255Thr Glu Ala Pro Ser Ala Thr Gly Gln Ala Ser Ser Leu Leu Gly Gly260 265 270Arg Leu Leu Gly Gln Ser Ala Ala Ser Cys His His Ala Tyr Ile Val275 280 285Leu Cys Ile Glu Asn Ser Phe Met Thr Ala Ser Lys290 295 300<210>15<211>957<212>DNA<213>artificial sequence<220><221>CDS<222>(1)..(957)<223><400>15ccg ctg tac aag aaa ata att aag aaa ctt ttg gag agt ggc cgg ggc48Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Gly1 5 10 15gtg tat ctc tca gag tgc aag act ggg aat gga aag aac tac aga ggg96Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30acg atg tcc aaa aca aaa aat ggc atc acc tgt caa aaa tgg agt tcc144Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser
35 40 45act tct ccc cac aga cct aga ttc tca cct gct aca cac ccc tca gag192Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60gga ctg gag gag aac tac tgc agg aat cca gac aac gat ccg cag ggg240Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80ccc tgg tgc tat act act gat cca gaa aag aga tat gac tac tgc gac288Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95att ctt gag tgt gaa gag gaa ggt acc tct ggc ggc ggc tct ggc ggc336Ile Leu Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly100 105 110ggc tct ggc ggc ggc gtg tat ctc tca gag tgc aag act ggg aat gga384Gly Ser Gly Gly Gly Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly115 120 125aag aac tac aga ggg acg atg tcc aaa aca aaa aat ggc atc acc tgt432Lys Asn Tyr Arg Gly Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys130 135 140caa aaa tgg agt tcc act tct ccc cac aga cct aga ttc tca cct gct480Gln Lys Trp Ser Ser Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala145 150 155 160aca cac ccc tca gag gga ctg gag gag aac tac tgc agg aat cca gac528Thr His Pro Ser Glu Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp165 170 175aac gat ccg cag ggg ccc tgg tgc tat act act gat cca gaa aag aga576Asn Asp Pro Gln Gly Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg180 185 190tat gac tac tgc gac att ctt gag tgt gaa gag gaa ctc gag tct ggc624Tyr Asp Tyr Cys Asp Ile Leu Glu Cys Glu Glu Glu Leu Glu Ser Gly195 200 205ggc ggc ctc ggc ggc ggc ctc ggc ggc ggc cct gtt gtc ctg ctt cca672Gly Gly Leu Gly Gly Gly Leu Gly Gly Gly Pro Val Val Leu Leu Pro210 215 220gat gta gag act cct tcc gaa gaa gac tgt atg ttt ggg aat ggg aaa720Asp Val Glu Thr Pro Ser Glu Glu Asp Cys Met Phe Gly Asn Gly Lys225 230 235 240gga tac cga ggc aag agg gcg acc act gtt act ggg acg cca tgc cag768Gly Tyr Arg Gly Lys Arg Ala Thr Thr Val Thr Gly Thr Pro Cys Gln245 250 255gac tgg gct gcc cag gag ccc cat aga cac agc att ttc act cca gag816Asp Trp Ala Ala Gln Glu Pro His Arg His Ser Ile Phe Thr Pro Glu260 265 270aca aat cca cgg gcg ggt ctg gaa aaa aat tac tgc cgt aac cct gat864Thr Asn Pro Arg Ala Gly Leu Glu Lys Asn Tyr Cys Arg Asn Pro Asp275 280 285ggt gat gta ggt ggt ccc tgg tgc tac acg aca aat cca aga aaa ctt912Gly Asp Val Gly Gly Pro Trp Cys Tyr Thr Thr Asn Pro Arg Lys Leu290 295 300tac gac tac tgt gat gtc cct cag tgt gcg gcc cct tca ttt gat957Tyr Asp Tyr Cys Asp Val Pro Gln Cys Ala Ala Pro Ser Phe Asp305 310 315<210>16<211>319<212>PRT<213>artificial sequence<400>16Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Gly1 5 10 15Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser35 40 45Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95Ile Leu Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly100 105 110Gly Ser Gly Gly Gly Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly115 120 125Lys Asn Tyr Arg Gly Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys130 135 140Gln Lys Trp Ser Ser Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala145 150 155 160Thr His Pro Ser Glu Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp165 170 175Asn Asp Pro Gln Gly Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg180 185 190Tyr Asp Tyr Cys Asp Ile Leu Glu Cys Glu Glu Glu Leu Glu Ser Gly195 200 205Gly Gly Leu Gly Gly Gly Leu Gly Gly Gly Pro Val Val Leu Leu Pro210 215 220Asp Val Glu Thr Pro Ser Glu Glu Asp Cys Met Phe Gly Asn Gly Lys225 230 235 240Gly Tyr Arg Gly Lys Arg Ala Thr Thr Val Thr Gly Thr Pro Cys Gln245 250 255Asp Trp Ala Ala Gln Glu Pro His Arg His Ser Ile Phe Thr Pro Glu260 265 270Thr Asn Pro Arg Ala Gly Leu Glu Lys Asn Tyr Cys Arg Asn Pro Asp275 280 285Gly Asp Val Gly Gly Pro Trp Cys Tyr Thr Thr Asn Pro Arg Lys Leu290 295 300Tyr Asp Tyr Cys Asp Val Pro Gln Cys Ala Ala Pro Ser Phe Asp305 310 315<210>17<211>915<212>DNA<213>artificial sequence<220><221>CDS<222>(1)..(915)<223><400>17ccg ctg tac aag aaa ata att aag aaa ctt ttg gag agt ggc cgg ggc48Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Gly1 5 10 15gtg tat ctc tca gag tgc aag act ggg aat gga aag aac tac aga ggg96Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30acg atg tcc aaa aca aaa aat ggc atc acc tgt caa aaa tgg agt tcc144Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser35 40 45act tct ccc cac aga cct aga ttc tca cct gct aca cac ccc tca gag192Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60gga ctg gag gag aac tac tgc agg aat cca gac aac gat ccg cag ggg240Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80ccc tgg tgc tat act act gat cca gaa aag aga tat gac tac tgc gac288Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95att ctt gag tgt gaa gag gaa ggt acc tct ggc ggc ggc tct ggc ggc336Ile Leu Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly100 105 110ggc tct ggc ggc ggc gtg tat ctc tca gag tgc aag act ggg aat gga384Gly Ser Gly Gly Gly Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly115 120 125aag aac tac aga ggg acg atg tcc aaa aca aaa aat ggc atc acc tgt432Lys Asn Tyr Arg Gly Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys130 135 140caa aaa tgg agt tcc act tct ccc cac aga cct aga ttc tca cct gct480Gln Lys Trp Ser Ser Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala145 150 155 160aca cac ccc tca gag gga ctg gag gag aac tac tgc agg aat cca gac528Thr His Pro Ser Glu Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp165 170 175aac gat ccg cag ggg ccc tgg tgc tat act act gat cca gaa aag aga576Asn Asp Pro Gln Gly Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg180 185 190tat gac tac tgc gac att ctt gag tgt gaa gag gaa ctc gag tct ggc624Tyr Asp Tyr Cys Asp Ile Leu Glu Cys Glu Glu Glu Leu Glu Ser Gly195 200 205ggc ggc tct ggc ggc ggc tct ggc ggc ggc gtg tat ctc tca gag tgc672Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Val Tyr Leu Ser Glu Cys210 215 220aag act ggg aat gga aag aac tac aga ggg acg atg tcc aaa aca aaa720Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly Thr Met Ser Lys Thr Lys225 230 235 240aat ggc atc acc tgt caa aaa tgg agt tcc act tct ccc cac aga cct768Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser Thr Ser Pro His Arg Pro245 250 255aga ttc tca cct gct aca cac ccc tca gag gga ctg gag gag aac tac816Arg Phe Ser Pro Ala Thr His Pro Ser Glu Gly Leu Glu Glu Asn Tyr260 265 270tgc agg aat cca gac aac gat ccg cag ggg ccc tgg tgc tat act act864Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly Pro Trp Cys Tyr Thr Thr275 280 285gat cca gaa aag aga tat gac tac tgc gac att ctt gag tgt gaa gag912Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp Ile Leu Glu Cys Glu Glu290 295 300gaa915Glu305<210>18<211>305<212>PRT<213>artificial sequence<400>18Pro Leu Tyr Lys Lys Ile Ile Lys Lys Leu Leu Glu Ser Gly Arg Gly1 5 10 15Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly20 25 30Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser35 40 45Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala Thr His Pro Ser Glu50 55 60Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly65 70 75 80Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp85 90 95Ile Leu Glu Cys Glu Glu Glu Gly Thr Ser Gly Gly Gly Ser Gly Gly100 105 110Gly Ser Gly Gly Gly Val Tyr Leu Ser Glu Cys Lys Thr Gly Asn Gly115 120 125Lys Asn Tyr Arg Gly Thr Met Ser Lys Thr Lys Asn Gly Ile Thr Cys130 135 140Gln Lys Trp Ser Ser Thr Ser Pro His Arg Pro Arg Phe Ser Pro Ala145 150 155 160Thr His Pro Ser Glu Gly Leu Glu Glu Asn Tyr Cys Arg Asn Pro Asp165 170 175Asn Asp Pro Gln Gly Pro Trp Cys Tyr Thr Thr Asp Pro Glu Lys Arg180 185 190Tyr Asp Tyr Cys Asp Ile Leu Glu Cys Glu Glu Glu Leu Glu Ser Gly195 200 205Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Val Tyr Leu Ser Glu Cys210 215 220Lys Thr Gly Asn Gly Lys Asn Tyr Arg Gly Thr Met Ser Lys Thr Lys225 230 235 240Asn Gly Ile Thr Cys Gln Lys Trp Ser Ser Thr Ser Pro His Arg Pro245 250 255Arg Phe Ser Pro Ala Thr His Pro Ser Glu Gly Leu Glu Glu Asn Tyr260 265 270Cys Arg Asn Pro Asp Asn Asp Pro Gln Gly Pro Trp Cys Tyr Thr Thr275 280 285Asp Pro Glu Lys Arg Tyr Asp Tyr Cys Asp Ile Leu Glu Cys Glu Glu290 295 300Glu30权利要求
1.一种基因重组肿瘤血管凋亡因子PFK的cDNA,其特征在于,它的核苷酸序列为SEQ ID No.3。
2.一种基因重组肿瘤血管凋亡因子PFK,其特征在于,它的氨基酸序列为SEQ ID No.4。
3.一种制备基因重组肿瘤血管凋亡因子PFK的方法,其特征在于,包括从肝脏CDNA文库中用PCR方法扩增K1(Plasminogen Kringle 1),并在其上游引物合成时加入血小板因子4(PF4)的13个氨基酸,用表达质粒pPICZαA转化寄主细胞,培养转化体,获得基因重组肿瘤血管凋亡因子PFK;所述的K1片段的核苷酸序列为SEQ ID No.1,所述的13个氨基酸片段的核苷酸序列为SEQ ID No.2。
4.一种基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白,其特征在于,它具有以下结构通式PFK-L-Px或PFK-L-Px-L-Py,其中通式中的Px、Py是有血管抑制功能的蛋白或功能片段,如PlasminogenKringle1(k1),Plasminogen Kringle5(k5)、胶原十八C末端的有血管抑制活性片段Endostatin(En)、VEGFR、有血管抑制功能的催乳素片段等;通式的中L是连接两种蛋白的柔性连接臂,其核苷酸序列为SEQ IDNo.5,所表达的蛋白质的氨基酸序列为SEQ ID No.6。
5.如权利要求4所述的基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白,其特征在于,其中Px为Kringle1(k1),构成的衍生融合蛋白PFK-L-K1的核苷酸序列为SEQ ID No.7,它的氨基酸序列为SEQ ID No.8。
6.如权利要求4所述的基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白,其特征在于,其中Px为Plasminogen Kringle 5(k5),所述的K5基因的核苷酸序列为SEQ ID No.9,构成的衍生融合蛋白PFK-L-K5的核苷酸序列为SEQ ID No.10,它的氨基酸序列为SEQ ID No.11。
7.如权利要求4所述的基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白,其特征在于,其中Px为Endostatin(En),所述的En基因的核苷酸序列为SEQ ID No.12,构成的衍生融合蛋白PFK-L-En的核苷酸序列为SEQ IDNo.13,它的氨基酸序列为SEQ ID No.14。
8.如权利要求4所述的基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白,其特征在于,其中Px为K1,Py为K5,构成的衍生融合蛋白PFK-L-K1-K5的核苷酸序列为SEQ ID No.15,它的氨基酸序列为SEQ ID No.16。
9.如权利要求4所述的基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白,其特征在于,其中Px为K1,Py也为K1,构成的衍生融合蛋白PFK-L-K1-K1的核苷酸序列为SEQ ID No.13,它的氨基酸序列为SEQ ID No.14。
10.一种制备基因重组肿瘤血管凋亡因子PFK的衍生融合蛋白的方法,其特征在于,首先将首先将PFK基因插入质粒pPICZαA的EcoRI/KpnI位点,测序确认正确后,再在KpnI/XhoI位点插入第二个基因,接着可以在XhoI/NotI位点插入第三个基因,基因拼接中,在二个基因之间插入连接基因L以表达柔性连接肽L。
全文摘要
本发明涉及基因重组肿瘤血管凋亡因子PFK及其衍生融合蛋白,以及它们的制备方法。首先从肝脏CDNA文库中用PCR方法扩增K1基因,上游引物设计时增加PF4的活性片段,成为PFK基因。然后利用酵母表达质粒pPICZ区有12个多克隆基因插入位点,首先将PFK基因插入EcoRI/KpnI位点,测序确认正确后,再在KpnI/XhoI位点插入第二个基因。接着可以在XhoI/NotI位点插入第三个基因。通过PFK与K1、K5、Endostatin等基因拼接,制备了多个融合基因。本发明的PFK及其衍生融合蛋白易于在酵母中表达,易于纯化,具有良好活性,能够抑制肿瘤血管新生、阻断肿瘤发展的营养供给和新陈代谢。
文档编号C12N15/11GK1458160SQ0211168
公开日2003年11月26日 申请日期2002年5月15日 优先权日2002年5月15日
发明者谈立松, 陈宇光, 张尚权 申请人:谈立松, 陈宇光, 张尚权
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1