受体配体vegf-c的制作方法

文档序号:3549565阅读:626来源:国知局
专利名称:受体配体vegf-c的制作方法
本申请是1996年6月28日提交的序号为08/671,573的美国专利申请的部分继续申请,而后者又是1996年2月14日的提交的序号为08/601,132的美国专利申请的部分继续申请,而后者又是1996年1月12日提交的序号为08/585,895的美国专利申请的部分继续申请,而后者又是1995年8月1日提交的序号为08/510,133的美国专利申请的部分继续申请。本申请也是1994年11月14日提交的序号为08/340,011的美国专利申请的部分继续申请。
本发明一般涉及基因工程领域且特别涉及内皮细胞生长因子及生长因子基因。
成熟组织的发育生长,重建和再生以及实体瘤的生长只有伴随着血管形成才能进行。成血管细胞和造血前体细胞分化于中胚层并形成卵黄囊的血岛和胚胎的初级血管系统。来源于这些早期(原位)分化的内皮细胞的血管的发育称为血管发生。已确信大部分胚胎血管通过血管发生而产生,而其余血管树的形成被认为是源于先存在的管的血管生长(一种称为血管生成的过程)的结果,Risau等,“发育生物学”(Devel.Biol.),125441-450(1988)。
内皮细胞形成几种功能和形态不同的管。当组织分化并开始执行其特定功能时,内皮细胞的表型多相性增加。基于生成血管刺激,内皮细胞可以重新进入细胞周期,迁移,从细胞周期中退出并随后又分化形成功能适应其组织环境的新管。经历血管生成的内皮细胞降解原来的基膜并迁移,形成进入血管周基质的毛细管生长。Ausprunk等人,“微血管综述”(Microvasc.Rev.),1451-65(1977)。在组织发育和再生过程中的血管形成依赖于内皮细胞增殖,迁移,分化,及存活的紧密控制的过程。内皮细胞调节系统功能失调是许多疾病的主要特征。最重要的是,已发现肿瘤生长和转移是血管生成依赖性的。Folkman等人,“生物化学杂志”(J.Biol.Chem.),26710931-10934(1992)。
调节细胞生前和分化的主要信号是通过多肽生长因子及其许多为酪氨酸激酯酶的跨膜受体来介导的。酪氨酸激酶插入片段的自身磷酸化肽和活化的受体的羧基末端序列通常能为相关于效应细胞内的基因表达重调的信号传导的激酶底物所识别。已描述了几族受体酪氨酸激酶。Van der Geer等人,“细胞生物学年鉴”(Ann.Rev.Cell Biol.)10251-337(1994)。主要的生长因子和传导血管生成刺激的受体图示于

图1。
已知成纤维细胞生长因子也和血管生成的调节相关。已发现其能对培养的内皮细胞促有丝分裂和趋化。成纤维细胞生长因子也能刺激诸如胶原蛋白酶和纤溶酶原激活剂的蛋白酶的生成,并通过内皮细胞诱导管的形成。Saksela等人,“细胞生物学年度综述”(Ann.Rev.Cell Biol.),493-126(1988)。有两类常见的成纤维细胞生长因子,FGF-1和FGF-2,两者都缺少常规的信号肽。两类都对肝素具有亲和力而且FGF-2能结合于内皮下细胞外基质中的硫酸肝素粘蛋白,该硫酸肝素粘蛋白能从位基质中于创伤后释放。肝素能通过生成血管的FGFs而强化内皮细胞增殖刺激,两者都通过预防该FGFs变性和降解及二聚化。培养的内皮细胞表面FGF-1受体但不表达显著水平的其它高亲和力成纤维细胞生长因子受体。
在受体酪氨酸激酶的其它配体中,已发现血小板衍生的生长因子,PDGF-BB,在鸡绒毛尿囊膜有弱的血管生成作用。Risau等人,生长因子,7261-266(1992)。转化生长因子α(FGFα)是由几种肿瘤细胞型和巨噬细胞分泌的血管生成因子。肝细胞生长因子(HGF),C-met原癌基因编码的受体的配体,也有强烈的血管生成作用。
最近的证据表明存在有内皮细胞特异的生长因子和受体,其可能主要引起刺激内皮细胞生长,分化及某些分化的功能。研究得最清楚的是血管内皮生长因子(VEGF),PDGF族的一员。VEGF是二硫键连接的糖蛋白二聚体的23KD亚单位。报道的VEGF的其它效应包括胞内钙转移,诱导纤溶酶原激活剂和纤溶酶原激活剂抑制剂-1的合成,刺激己糖在内皮细胞内运输,及在体外试验中促进单核细胞迁移。由不同的mRNA剪接变体编码的四种VEGF同工型表现出相同的刺激内皮细胞分裂的能力。然而,每个同工型对细胞表面的粘蛋白具有不同的亲和力,而该粘蛋白作为VEGF的低亲和力受体。121个和165个氨基酸的VEGF同工型(VEGF121)和(VEGF165)是以可溶形式分泌的,而189个和206氨基酸残基的同工型保留了细胞表面连接并对肝素具有强烈的亲和力。VEGF最初是基于对内皮细胞的促分裂活性,同时也可以根据通过其诱导微血管通透性能力而从几种来源中提取的,因此,其也称作血管渗透因子(VPF)。
VEGF表达模式提示其相关于正常血管系统的发育和维持以及肿瘤的血管生成。在鼠发育过程中,在整个交配后(P.C.)的7.5天内,内胚层表达VEGF,而心室神经外胚层在毛细管向内生长阶段产生VEGF。见Breier等人,“发育”(Development),114521-523(1992)。发育两天时的鹌鹑,卵黄囊及整个胚胎的血管化区域有VEGF表达。此外,成年小鼠的跟有孔内皮相邻的上皮细胞有持续的VEGF表达,提示其在维持此特定的内皮表型和功能中的作用。
已描述了VEGF的两种高亲和力受体。它们是VEGFR-1/Flt-1(fms样酪氨酸激酶-1)和VEGFR-2/Kdr/Flk-1(含有受体的激酶插入片段在/胎儿肝激酶-1)。这些受体归入PDGF-受体族,但它们有七个而不是五个免疫球蛋白样环位于其胞外区域(如图1)并且它们比此族中通常看到的有更长的激酶插入片段。VEGF受体的表达主要出现在血管内皮细胞,虽然也有一些出现于造血母细胞,单核细胞和黑素瘤细胞。据报道,只有内皮细胞随VEGF而增殖,而不同来源的内皮细胞表现出不同的反应。因此,通过VEGFR-1和VEGFR-2介导的信号表现出细胞型的特异性。最近发现VEGF相关的胎盘生长因子(PLGF)以高度的亲和力结合于VEGFR-1。PLGF能增强VEGF的生长因子活性,但其本身不刺激内皮细胞。天然产生的VEGF/PLGF异源二聚体几乎和VEGF同源二聚体对内皮细胞是同样强度的促细胞分裂剂。Cao等人,生物化学杂志,2713154-62(1996)。
Flt4受体酪氨酸激酶(VEGFR-3)在结构上和VEGFR-1和VEGFR-2基因的产物密切相关。尽管有这种相似性,Flt4的突变型不同于VEGF受体,其中在胞外区被蛋白酶解剪切成两个二硫键连接的多肽。Pajusola等人,“肿瘤研究”(Cancer Res.),525738-5743(1992)。4.5和5.8kb Flt4mRNAs编码多肽,而因为使用了变更的3′外显子,所以它们在其C-末端不同。VEGF或者PLGF同工型并不表现出对Flt4的特异结合或者诱发其自身磷酸化。
Flt4的表达显示出比VEGFR-1或者VEGFR-2的表达更具有限制性。Flt4表达首先在P.C.8.5天鼠胚胎的头间质的成血管细胞,主要静脉,以及胚胎外,尿囊可通过原位杂文而检测到。在P.C.12.5天的胚胎中,Flt4信号可在正发育的静脉以及推测的淋巴管内皮处观察到,但动脉内皮却呈阴性。在发育的后期,Flt4 mRNA变得局限于发育着的淋巴管。淋巴管内皮和一些成熟的高级内皮小静脉在成人组织内表达Flt4 mRNA并在转移的淋巴结的淋巴窦和淋巴管瘤中有增强表达。这些结果支持了静脉起源于淋巴管的理论。
至此,已描述了五种内皮细胞特异的受体酪氨酸激酶Flt-1(VEGFR-1),KDR/Flk-1(VEGFR-2),Flt4(VEGFR-3),Tie,以及Tek/Tie-2,它们具有信号转导必需的固有酪氨酸激酶活性。已发现在鼠胚胎中定向突变灭活Flt-1,Flk-1,Tie,及Tek在分子水平上对血管发生和血管生成起着必要的和特殊的作用。VEGFR-1和VEGFR-2以高亲和力(kd分别为16pM和760pM)结合VEGF而VEGFR-1也结合相关的胎盘生长因子(PLGF;kd约为200pM)。于PCT申请公开WO96/11269中报导了Tek的一个配体。
本发明提供了一个称为VEGF-C的酪氨酸激酶Flt4受体(VEGF-3)的配体。因此,本发明提供了一个提纯和分离的能结合于Flt4受体酪氨酸激酶的多肽。优选地,本发明的Flt4配体能在宿主细胞内刺激Flt4受体酪氨酸激酶的酪氨酸磷酸化并表达Flt4受体酪氨酸激酶。本发明优选的配体是哺乳动物多肽。高度优选的配基是人多肽。如下文所详述,将含有彼此相联的或者和其它多肽相联的本发明的多肽的二聚体和多聚体特别地考虑作为本发明的配体。
在一实施方案中,FlT4配体多肽是有通过在还原SDS-PAGE测定的大约为23KD的分子量。例如,本发明包括由大约为23KD的一种或多种多肽所组成的配体,而该多肽可于条件培养基中从PC-3前列腺癌细胞系中纯化,该细胞系具有ATCC保藏号No.CRL 1435。该PC-3细胞衍生配体多肽的氨基酸测序表明该配体多肽包括序列13所示的氨基末端氨基酸序列。含Flt4配体的条件培养基本身是本发明的一个方面。本发明也提供了PC-3前列腺癌细胞系的新的用途,即产生Flt4配体。在一个优选的实施方案中,该配体可以直接从PC-3细胞培养基中提纯和分离。
在一个高度优选的实施方案中,配体多肽包含序列33所示的氨基酸序列片段,其可特异地和人Flt4受体酪氨酸激酶结合。典型的片段包括含有序列33的从大约112位残基到大约213位残基的氨基酸序列的多肽;含有序列33的从大约104位到大约227位残基的氨基酸序列的多肽;及含有序列33的从大约112到227位残基的氨基酸序列的多肽。其它典型片段包括序列33的横跨序列33的大约以下残基的氨基酸序列的多肽31-213,31-227,32-227,103-217,103-225,104-213,113-213,103-227,113-227,131-211,161-211,103-225,227-419,228-419,31-419,及1-419位,如下文所详述。
本发明也提供Flt4配体的一种或多种多肽前体,其中的一个这样的前体(称为“前-VEGF-C”)包括序列33所示的全部氨基酸序列(氨基酸残基1-419)。因此,本发明包括具有如序列33所示的氨基酸序列1-419位残基的纯化的和分离的多肽。当在合适的宿主细胞中表达时,根据本发明的配体前体通过裂解产生特异结合于Flt4受体酪氨酸激酶的多肽。一个推定的102个氨基酸前导(前)肽和序列33所示的氨基酸序列相同。因此,在一个相关的方面,本发明包括一个纯化并分离的具有如序列33所示的103-419位残基的氨基酸序列的多肽。
在一个实施方案中,一个表达的Flt4配体多肽前体在表达时被蛋白酶切成大约23KD Flt4配体多肽。因此,提供了一个Flt4配体多肽,其为如序列33所示的前体多肽的裂解产物并具有在还原态下的大约23KD的分子量。
一个由分子量约29和32KD多肽组成的推定VEGF-C前体或者剪接变体也作为本发明的一个方面。
在另一个实施方案中,一个表达的Flt4配体在表达时被蛋白酶切成大约21KD VEGF-C多肽。序列分析表明所测的21KD型具有23KD型的氨基末端下游大约9个氨基酸的氨基末端,提示可变的切割位点的存在。
从前文可知本发明的一方面包括具有如序列33所示的1-419位残基的氨基酸序列的提纯的和分离的多肽片段,该片段能特异结合于Flt4受体酪氨酸激酶。优选的实施方案包括在还原态下通过SDS-PAGE测定的表观分子量约为21/23 KD和29/32 KD的片段。
数据提示保留Flt4配体活性所必需的氨基酸包括于序列33的大约103/112-226/227位的氨基酸序列,并且C-末端蛋白酶切以产生成熟的天然的Flt4配体发生于序列33的大约226-227位氨基酸位点。相应地,一个优选的Flt4配体包括序列33的大约103-227位氨基酸。
本文所述的VEGF-C突变分析表明通过限定C-末端的天然加工剪切而产生的天然的横跨序列33的103-227位氨基酸的VEGF-C多肽存在并有如Flt4配体的活性。已发现由序列33的104-213位残基所组成的多肽片段保留了VEGF-C的生物活性。此外,突变分析表明只有横跨序列33的113-213位氨基酸的多肽才保留Flt4配体活性。相应地,优选的多肽包括大约横跨序列33的103-227,104-213,或者113-213位残基的序列。
此外,VEGF族的成员的多肽序列对比表明更小的片段还会保留生物学活性,而这些更小的片段也要作为本发明的方面。尤其是,多肽VEGF族的八个高度保守的半胱氨酸残基定义了序列33的131-211位残基区域(见图10和31);因此,预测横跨大约131-211位残基的多肽可以保留VEGF-C生物学活性。事实上,含有大约161-211位残基并保留了进化上保守的RCXXCC基序的多肽被假定为保留了VEGF-C活性,因此也作为本发明的一个方面。VEGF-C的一些保守的半胱氨酸残基参于了链间二硫键以生成各种天然的VEGF-C多肽的同源和异源二聚体。除开先前的考虑,还有缺乏链间二硫键的VEGF-C多肽保留了VEGF-C生物学活性的证据。相应地,本发明的材料和方法包括所有的至少保留了VEGF-C的一种生物学活性VEGF-C片段,无论其存在或不存在链间二硫键。本发明也包括含有彼此连接或者连接于其它多肽的这种片段的多聚体(包括二聚体)。片段连接可以通过多肽链的共价连接(如二硫键)或者非共价连接(如氢键,通过稳定的或者诱导的偶极间相互作用的键,通过疏水的或者亲水的相互作用的键,这些键的机理的组合,及类似作用)。
在另一个相关的方面,本发明包括前述多肽的变体和类似物,包括VEGF-C,VEGF-C前体,及VEGF-C片段。本发明所考虑的变体包括具有不同于VEGF-C,VEGF-C前体及VEGF-C片段的氨基酸序列的纯化的和分离的多肽,其是通过本领域熟练的技术人员所知的保守取代,或者通过与至少保留VEGF-C的一种生物学活性的氨基酸残基相一致的加入或删除而形成。
本发明考虑的类似物包括具有不同于VEGF-C,VEGF-C前体,或者VEGF-C片段中所见的对一种或多种氨基酸残基进行修饰但与保留VEGF-C,VEGF-C前体,或者VEGF-C片段的至少一种生物学活性相一致的多肽。例如,本发明范围内的类似物包括糖基化变体和缀合物(前述多肽结合到如标记物,毒素等化合物上)。
本发明也提供了用于编码本发明的多肽的纯化的和分离的多核苷酸(即核酸),例如cDNA或相应的编码VEGF-C前体,VEGF-C,或者生物活性片段或其变体的基因组DNA。本发明优选的核酸包括编码序列33的1-419位氨基酸残基或者一种前述片段的DNA。由于遗传密码的简并性,可能有许多这样的编码序列,每个均有共同的编码序列33或其他片段所示的氨基醇序列的结构。本发明也包括这些多核苷酸的类似物,或者任何一种编码至少保留了VEGF-C的一种生物学活性的这些多核苷酸的衍生物。根据本发明DNA多核苷酸包括基因组DNAs,cDNAs,以及含有VEGF-C片段的编码序列的寡聚核苷酸,或者至少保留了VEGF-C的一种生物活性VEGF-C片段的类似物。基于遗传密码的简并性,编码本发明的多及的不同多核苷酸均在本发明的范围内。在一个实施方案中,本发明设计了具有在某种意义上不同于编码VEGF-C片段的多核苷酸的序列的多核苷酸,从而如本领域的熟练技术人员所理解的那样,导致了所编码的多肽间保守氨基酸的差异。
根据本发明的一个优选的多肽包括序列32所述的352-1611位核苷酸的人VEGF-C cDNA序列。其它按本发明的多核苷酸编码来源于,如除人类外的哺乳动物,鸟类(如鹌鹑鸟),及其它的VEGF-C多肽。本发明的其它多肽还包括VEGF-C片段的编码序列,以及DNAs的那些编码部分或全部VEGF-C的等位变体。
本发明还包括那些能和前述的多核苷酸在标准的严格条件下杂交的多核苷酸。典型的严格杂交条件如下在50%甲酰胺,5×SSC,20mMNa.PO4,pH6.8于42℃下杂交并在0.2×SSC于55℃下洗涤。本领域熟练技术人员能理解的是这些条件的改变可以基于待杂交序列长度和GC核苷酸含量。本领域的标准公式适于检测合适的杂交条件。见Sambrook等人,分子克隆实验手册(第二版,冷泉港实验室出版社1989)§§9.47-9.51。这些能和编码VEGF-C,VEGF-C片段,或者VEGF-C类似物杂交的多核苷酸用作核苷酸探针以鉴定,提纯和分离编码其它(非人类)哺乳动物VEGF-C型的多核苷酸。此外,这些多核苷酸用于本发明如下文所述的筛选方法。
本发明优选的核酸探针包括序列32的至少大约16个连续核苷酸的核酸序列。更优选地,这些核酸探针至少具有序列32的子序列的大约20个核苷酸。在使用这些核酸探针时,优选地,该探针特异地杂交到序列32所示序列的一部分。这里的特异杂交定义为在标准的严格杂交条件下的杂交。为了特异地鉴定和分离其它哺乳动物VEGF-C基因,核酸探针优选地为那些不能和VEGF-C相关基因杂交的(如不饱和人VEGF或者人VEGF-B基因杂交的)。
因此,本发明包括至少含有大约16个核苷酸的多核苷酸,其中的多核苷酸能和编码VEGF-C的基因(如人基因)特异杂交。该杂交的特异性确保了本发明的多核苷酸能在一定杂交条件下杂交于编码VEGF-C的核酸,而该条件不支持该多核苷酸杂交于编码诸如VEGF或者VEGF-B的核酸。在一个实施方案中,至少大约16个核苷酸和优选的至少大约20个核苷核苷酸的多核苷酸选作序列32的连续核苷酸序列或者序列32所述的核苷酸序列的互补序列。
本发明的另外的方面包括含有本发明的核酸的载体;以及用本发明的核酸或者载体转化或转染的宿主细胞。本发明优选的载体是这样的表达载体,其中本发明的核酸操作地连接于合适的启动子和其它控制序列,从而用该载体转化或转染的合适的宿主细胞能表达Flt4配体。优选的本发明载体是质粒pFlT4-L,其具有ATCC登记号第97231。这种载体和宿主细胞用于重组生产VEGF-C多肽。
本发明还包括制备本发明的多肽的方法。在一优选的方法中,本发明的核酸或载体在宿主细胞中表达,而本发明的多肽从宿主细胞或宿主细胞生长培养基中提纯。
在一个相关的实施方案中,本发明包括制备能特异性地结合于Flt4受体酪氨酸激酶的多肽,包括步骤(a)用本发明的核酸转化或转染宿主细胞;(b)培养该宿主细胞以表达该核酸;以及(c)从宿主细胞或该宿主细胞生长培养基中提纯能特异性地结合于Flt4受体酪氨酸激酶的多肽。
本发明也包括用本发明的方法生产的纯化的和分离的Flt4的多肽配体。在一个优选的实施方案中,本发明包括事实上没有其它人源多肽的人VEGF-C多肽或其生物活性片段。
在另一方面,本发明包括能特异地和本发明的多肽,或者和本发明的多肽共聚体特异反应的抗体。单克隆和多克隆的抗体均可以根据本领域的常规技术制备以抗本发明的多肽。该抗体可用于诊断的用途以监测血管生成,血管化,淋巴管及其疾病状态,伤口愈合,或者某些肿瘤细胞,造血的,或白血病细胞。该抗体可用于封闭活化的Flt4受体的配体。
根据本发明配体可用可检测的标记物标记并用于在原位鉴定其相应的受体。标记的Flt4配体和抗-Flt4配体抗体可用作造影剂用于检测淋巴管,高级的内皮微静脉及其疾病状态,以及在组织化学组织切片中表达的Flt4受体。该配基或者抗体可共价地或非共价地偶联到合适的超磁性,顺磁性,电子稠密,产生回声,或放射性的试剂上以造影。其它诸如生物素和亲和素的非放射性标记物也可以使用。
本发明的一个相关的方面是检测特定细胞如内皮细胞的方法。这些细胞可见于体内或者来自体内的生物组织标本中。该检测方法包括以下步骤将含诸如内皮细胞的生物组织在本发明的多肽能结合于细胞上的条件下接触该能结合于Flt4受体酪氨酸激酶的多肽,任选洗涤该生物组织,并在检测结合至该生物组织的细胞的多肽,从而检测该细胞。
本发明也提供了所要求的配体的诊断和临床用途。在一优选的实施方案中,Flt4配体或前体用于加速血管形成(如在创伤愈合中)或者促进淋巴管的内皮功能。也建议利用VEGF-C作为血管生成诱发剂而用于组织移植,眼病,梗塞后的动脉狭窄周围并进入创伤组织的旁系管的形成。根据本发明的多肽可以用任何使用合适的药学可接受的赋形剂如药学可接受的稀释剂,辅剂,赋形剂或者载体的合适的方式给药。VEGF-C多肽也可用。在结合检测或使用可检测的标记的VEGF-C的试剂盒中检测活检材料中活性受体或配体的存在而测定未来的转移危险性。根据本发明的Flt4配体也可用于促进诸如组织移植病人的淋巴管的重建或渗透性。此外,Flt4配体也可用于癌症(如乳腺癌)治疗中的外科手术后后减轻辅助淋巴管的损失。根据本发明的配体也可用于治疗或预防炎症,浮肿,淋巴管发育不全,淋巴阻塞,象皮病和Milroy′s病。最后Flt4配体可用于刺激淋巴细胞产生和成熟,并促进或抑制组织和淋巴管间的白细胞运输或者影响胸腺内外的迁移。
本发明包括一种筛选受治疗哺乳动物体的内皮细胞病的方法。该方法包括从该受治疗体者内取内皮细胞样,将内皮细胞样和根据权利要求4的多肽接触,测定该细胞的生长率,并建立起生长率和疾病的关系。在一个优选的实施方案中,该受治疗哺乳动物是人类而内皮细胞是人细胞。在另一个优选的实施方案中,该疾病是脉管病,如淋巴管病,诸如由于外科手术的淋巴管损失或者由于阻塞而致的现有淋巴管的功能减弱。在另一实施例中,该内皮细胞在体外和该多肽接触。在该方法中测定的生长速率是每一单位每时间的细胞分裂速率,其是通过本领域周知的许多技术之任一种测定的。生长速率和疾病的关系可以是正或负相关,例如,如下文所述的该多肽是否有Flt4配体活性或是该活性的抑制剂。
Flt4配体的抑制剂可用于控制内皮细胞增殖,淋巴管瘤和癌症转移。例如,该抑制剂可用于阻止转移癌生长或扩散,或者控制内皮细胞表达和生长的其它方面。抑制剂包括抗体,反意寡核苷酸,以及阻断该Flt4受体的多肽,以上都将要为本发明的一个方面。
在另一个实施方案中,本发明提供了调节受治疗哺乳动物体内皮细胞生长的方法,包括以下步骤将哺乳动物内皮细胞暴露于按本发明的有效量的多肽以调节该哺乳动物内皮细胞的生长。在一个实施方案中,该生长的调节可通过使用能在宿主细胞中刺激Flt4受体酪氨酸激酶的酪氨酸磷酸化并表达Flt4受体酪氨酸激酶而实现。在调节内皮细胞的生长中,本发明考虑了对与内皮细胞有关的疾病的调节。本发明考虑的内皮细胞疾病包括,但不局限于,淋巴管(如腋部淋巴组织的外科手术去除)的机械损失,淋巴管阻塞(如象皮病),和淋巴管瘤。在一个优选的实施方案中,受治疗者和内皮细胞是人类。该内皮细胞可在体外或体内试验中提供,并且可包含于组织移植中。这里将有效量多肽定义为通过经验确定的要达到细胞生长速率的可重现的改变所必需的多肽量(通过显微或肉眼观察显示以及测定细胞增倍时间,或者核酸合成检测),正如任何一个本领域的普通技术人员所理解的那样。
本发明也提供了用所要求的核酸(如多核苷酸)筛选内皮细胞疾病的方法。在一个优选的实施方案中,本发明提供了一个筛选受试验哺乳动物体中内皮细胞病的方法,包括步骤从受试者中取内皮细胞核酸样,将该样品和本发明的能杂交于编码VEGF-C(及优选地能杂交于VEGF-C mRNA)的基因的多核苷酸接触,测定该内皮细胞核酸和该多核苷酸间的杂交水平,以及确定该杂交水平和疾病的关系。优选的哺乳动物受试者及内皮细胞核酸来源是人类。本方法考虑的用多核苷酸筛选的疾病包括,但不局限于,诸如前述的淋巴管病,及缺氧的脉管疾病。
纯化的和分离的编码其它(非人类)VEGF-C型的多核苷酸也是本发明的方面,由其编码的多肽以及和该非人类VEGF-C变体特异地免疫反应的抗体也是本发明的方面。优选的非人类VEGF-C型是衍生于其它脊椎动物种类(包括鸟类和哺乳动物种类)的类型。高度优选的是哺乳动物型。因此,本发明包括纯化和分离的哺乳动物VEGF-C多肽,也包括纯化和分离的编码这些多肽的多核苷酸。
在一个实施方案中,本发明包括纯化的和分离的具有序列41的第1-415个残基的氨基酸序列的多肽,而该氨基酸序列与推断的小鼠VEGF-C前体相一致。据认为该推断的小鼠VEGF-C前体被以与加工人前多及相类似的方式来加工成成熟的小鼠VEGF-C。因此,在一个相关的方面,本发明包括纯化的和分离的能特异结合于Flt4受体酪氨酸激酶(如人或小鼠Flt-4受体酪氨酸激酶)的多肽,该多肽包括具有序列41的第1-415位残基的氨基酸序列的纯化和分离多肽片段,而该片段能特异结合于Flt4受体酪氨酸激酶。本发明还包括前述多肽和编码前述多肽的纯化和分离的核酸(如包括序列40所示的序列的全部或部分的核酸)的多聚体。
在另一个实施方案中,本发明包括纯化和分离的鹌鹑VEGF-C多肽,生物活性片段及其多聚体,以及编码前述多肽的多核苷酸。
在另一个实施方案中,本发明包括含VEGF-C启动子的DNA,其能在天然宿主细胞中于VEGF-C能在这些细胞中表达的条件下促进VEGF-C基因或另一个操作地连接的编码蛋白质的基因的表达。
附图的简要说明图1示相关于血管发生和血管生成的主要内皮细胞受体酪氨酸激酶和生长因子。图示的主要结构域包括免疫球蛋白样区域(IGH),表皮生长因子同源区域(EGFH),纤维结合蛋白III型区域(FNIII),跨膜(TM)和近膜(JM)区域,酪氨酸激酶(TK1,TK2)区域,激酶插入片段区域(KI),以及C-末端区域(CT)。
图2示PLTRFLt4L表达载体的构建。
图3示编码分泌的可溶性的Flt4胞外区域(Flt4Ec)的杆状病毒载体的构建。
图4示通过条件培养基从PC-3细胞培养物中刺激Flt4自身磷酸化的结果。
图5A,5B和5C示用PC-3条件培养基刺激的Flt4转染的细胞的主要酪氨酰磷酸化多肽是125KD Flt4多肽(VEGFR-3),并且该Flt4刺激活性不被吸附于肝素-琼脂糖凝胶。
图6示分离自PC-3条件培养基的Flt4配体活性的Western免疫印迹检测。
图7示源自分离于浓缩的PC-3条件培养基的Flt4配体(VEGF-C)亲和纯化的色谱组分的凝胶电泳结果。
图8示对齐排列以示其相似性的人,鼠,和鹌鹑VEGF-C多肽的氨基酸序列。全部三个物种中的保守残基以黑体排出。
图9示Flt4配体,VEGF-C的克隆和结构。该VEGF同源区(阴影盒)和氨基及羧基末端前肽(分别为浅阴影盒和无阴影盒)以及推定的信号序列(SS)图示于5′和3′非翻译(μt)核酸区之间。信号序列和氨基及羧基末端前肽的切割位点用三角表示。
图10示推定的PDGF-A,-B,PLGF-1,VEGF-B167,VEGF165,及Flt4配体(VEGF-C)的氨基酸序列的对照。
图11示人VEGF-C基因的外显子-内含子结构。七个外显子图示为开放盒,外显子大小用碱基对表示。内含子图示为线,内含子大小(碱基对)示于线上。推定的2.4kb成熟mRNA的5′和3′非翻译序列表示为阴影盒。用于描述VEGF-C基因的基因组克隆的定位图示于基因图谱下。
图12示在两个人肿瘤细胞系和脑组织中编码VEGF,VEGF-B和VEGF-C(称为“FLT4-L”)的基因的Northern印迹检测。
图13A示脉冲追踪实验后分离的并通过在还原态下SDS-PAGE电泳的重组VEGF-C的放射自显影。
图13B是示重组VEGF-C型是在非还原态下二硫键连接的聚丙烯酰胺凝胶照片。
图14A和14B示证明VEGF-C刺激VEGFR-2(KDR)的自身磷酸化但并不影响PDGFR-β磷酸化的Western印迹。
图15A示VEGF-C在三维胶原凝胶检测中刺激内皮细胞迁移。
图16A示人成熟组织中VEGF-C mRNA的表达。
图16B示所选择的人胎儿组织中VEGF,VEGF-B,和VEGF-C的表达。
图17示人类和鼠VEGF-C基因的基因组结构。外显子-内含子连接序列用外显子和内含子长度共同表示。内含子序列用下行字母表示。VEGF-C cDNAs中所测定的开放阅续框的核苷酸如上行三联体字母所示(相当于在接头处编码的密码子)。
图18示VEGF-C加工,包括主要的VEGF-C型。
图19示脉冲追踪免疫沉淀试验的放射自显影,其中用VEGF-C表达载体(VEGF-C)转染的细胞和模拟转染细胞(M)是以放射性氨基酸脉冲标记并在不同的时间长度时追踪。
图20示K14-VEGF-C载体构建的图。
图21A-C示转染的293 EBNA细胞产生的各种类型重组VEGF-C的电泳分离。图21B示在非还原态下的电泳分离模拟(M)轨染细胞,用野生型(wt)VEGF-A cDNA转染的细胞,以及用编码VEGF-C-R102S的cDNA变体转染的细胞。将图21B鉴定的每一条带切除并在还原态下于一分离的泳道中电泳分离。相当于VEGF-C重量的带的分级分离图示于图21A;相当于R102S变体的带分级分离图示于图21C。
图22A-B示通过非还原态凝胶电泳检测的野生型和突变型重组VEGF-Cs的类型和大小。图22A示分泌入培养基的VEGF-C类型;图22B示由细胞保留的VEGF-C类型。模拟(M)转染的细胞作为对照。
图23A-B代表使用抗血清882和抗血清905免疫沉淀,标记的VEGF-C类型的模式对比。相邻的泳道含有经过(标记+泳道)或未经过(标记为一的泳道)还原和烷基化的免疫沉淀物。
图24A-B代表分离自生长于有或无白细胞介素(IL-1)和/或地塞米松(DEX)中指定时间的总RNA的Northern印迹。图24B的Northern印迹是以来源于含碱基对57-638(Gene bank登记号X15997)的VEGF 581 bp cDNA,和人VEGF-B167 cDNA片段(核苷酸1/382,Gene bank,登记号U 48800)的放射标记DNA探测的。图24A的Northern印迹是用来源于人全长VEGF-C cDNA(Genebank登记号X94216)的放射标记DNA探测的。18S和28S-rRNA作为标准参照物。
图25示用VEGF-C cDNA转染,单独用载体转染的巴斯德毕赤氏酵母(P.Pastoris)培养物,或者模拟(M)转染在用甲醇于诱发所示的各段时间后的VEGF-C表达。取大约10μl培养基凝胶电泳检测,随后通过Western印迹并用抗VEGF-C抗血清检测。
图26示-Western印迹结果,其中表达VEGFR-3(Flt4)的NIH 3T3细胞,以及表达VEGFR-2(KDR)的PAE细胞是用5×浓缩的源于用含VEGF-C cDNA载体(+)转染的毕赤氏酵母的培养基,用缺插入片段(-)的载体刺激的,或者用阳性对照矾酸盐刺激的。将该刺激的细胞裂解并用VEGFR特异性的抗体免疫沉淀,并将该免疫沉淀物印迹并用抗磷酸酪氨酸抗体探测。
图27A-B示人VEGF-C(wt)和宿主293EBNA细胞分泌(图27A)或保留(图27B)的VEGF-C变体。模拟(M)转染的细胞作为对照。分子量标记物如左边用千道尔顿(KD)所示。
图28A-B示以野生型(wt)VEGF-C,以及三种VEGF-C多肽变体刺激成自身磷酸化的VEGFRs的Western印迹。细胞裂解物(VEGFR-3的NIH 3T3及VEGFR-2的PAG)经过受体-特异性的抗血清而该受体被免疫沉淀。然后,凝胶分离该免疫沉淀物并印迹以进行Western检测。用抗磷酸化酪氨酸抗体探测该Western印迹。
图29A-D苏木精-伊红染色的K14-VEGF-C转基因的和对照鼠同窝幼畜组织的显微照片。显示是从背部皮肤和吻部的区域,如图示。白色箭头表示无红细胞的腔隙的内皮排成的界限。
图30代表来源于所示组织的聚腺苷酸化RNA,用VEGF,VEGF-B167,以及VEGF-C探针的集合库杂交的Northern印迹。预计的转录物大小以千碱基(kb)标于右侧。
图31代表人和鼠VEGF-C氨基酸序列的对照。鼠VEGF-C的氨基酸序列列于上线而人序列中的差异标于下线。标记该序列以描述图9中所示的区域。箭头示信号肽酶的推定切割位点;BR3P基序以及CR/SC基序装于盒中;而保守的半胱氨酸残基以黑体标示序列上。精氨酸残基158也以黑体标记。数字指鼠VEGF-C残基。
图32示SDS-PAGE分离的免疫沉淀于或亲和纯化于各种35S-标记的培养基的样品。在左侧的泳道中,来源于只含载体的Bosc 23的细胞的对照培养基,来源于表达人VEGF-C细胞的培养基,以及源于表达鼠VEGF-C细胞的培养基分别用偶联到琼脂糖的人VEGFR-3胞外域沉淀。在右侧泳道,类似的条件培养基用抗-VEGF-C抗体沉淀。mwm分子量标记物;m-鼠;h-人;α-抗。
图33示凝胶分离的源于来自表达VEGFR-3或者VEGFR-2的NIH3T3细胞的裂解物的免疫沉淀物的Western印迹,如图示,而该细胞已通过和含裂解物(或者载体对照)接触而刺激,作为VEGF-C-诱发的受体自身磷酸化的测定。用抗磷酸化酪氨酸(α-PTyr)或抗-受体抗血清(抗VEGFR-3和抗VEGFR-2)探测该Western印迹。作为对照,用矾酸盐处理(VO4)诱发受体自身磷酸化。箭头和数字代表酪氨酰磷酸化受体多肽带的表观分子量。bVEGF人杆状病毒VEGF-C蛋白;C-FGEVm源于带有以反义方向克隆入载体的鼠VEGF-C cDNA的细胞的裂解物。
图43A-D示在12.5天鼠胚胎的旁矢状面切片上的原位杂交检测VEGF-C和VEGF-B mRNAs的表达的显微照片。图34AVEGF-C探针;i-颈静脉,mn-后肾,m-小肠系膜(箭头),VC-椎间管,lu-肺(箭头)。图34BVEGF-B探针;h-心脏,鼻咽区(箭头)。图34CVEGF-C有义链探针作为对照。图34D34C所示的同样区域的亮视野显微照片。
图35A-H示提供VEGF-C和VEGFR-3在颈静脉和肠系膜区域表达的对比的鼠胚胎切片。图35A和35C示VEGF-C转录体在大囊一样结构周围的后肾在颈静脉区域(箭头)的表达。图35B和35D示VEGFR-3转录体在颈静脉囊的表达。图35E和35G示P.C.15天的胚胎的后肾区以及肠周围的VEGFR-3 mRNA分布。图35F和35H示14.5天胚胎的肠系膜区,以及肠区,发育着的淋巴管,以及静脉的VEGFR-3 mRNA。
图36A-D示P.C.16天的鼠胚胎头部的FLT4和VEGF-C的原位杂交的显微照片。用Flt4探针(图36A)杂交的头部切片示发育着的口鼻部,鼻结构和眼睛。较后位置的切片示和VEGF-C探针(图36B)的杂交。上部两侧的圆形结构代表发育着的磨牙。中线两侧上(背)部,可见发育着的甲的后部。这些结构也显示于高倍放大的暗视野(图36C)以及亮视野(图36D)显微镜。
本发明的详述本文描述的是新的血管内皮生长因子的分离以及从制备于人前列腺癌细胞系PC-3的cDNA文库进行的编码该新的生长因子的DNA的克隆。该分离的cDNA编码一种能蛋白酶解加工并分泌入细胞培养培养基的蛋白质。称为VEGF-C的该分泌蛋白结合于Flt4的胞外域并诱发Flt4和VEGFR-2的酪氨酸自身磷酸化。VEGF-C也刺激内皮细胞在胶原凝胶中的迁移。
这里报道的资料显示VEGF-C是以一较大的前体表达的,然后再切割成该配体。某些情况下的共表达区源于该配体基因的RNA的其它剪切。该共表达区可随着用于获得该配体的特定表达系统而变化。熟练的技术人员明白在蛋白质的重组生产中,附加序列可以伴随着依赖于用于表达该蛋白的特定重组构建体的功能多肽而表达,并随后除去以获得所需的配体。某些情况下,可制得缺少内源/天然配体的某些残基的重组配体。此外,周知的是在蛋白质中可进行保守取代而不改变该蛋白的功能。相应地,可想像该变化在本发明的范围内。此外,可预料的是一种或更多种VEGF-C前体(最大推定的天然分泌型VEGF-C前体具有序列33的从32到419位残基的全部氨基酸序列)能在无任何进一步加工的条件下刺激该Flt4配体,其是以类似于VEGF在信号序列分泌和伴随的释放后以未加工形式刺激其受体的方式而进行。
本文报道的结果显示Llt4(VEGFR-3)递送VEGF-C信号。该结论是基于VEGF-C对重组Flt4 EC(Flt4胞外域)蛋白的特异结合以及源于VEGF-C转染细胞的培养基对VEGF-3自身磷酸化的诱导而得出的。相反,VEGF和PLGF均不显示特异结合于VEGFR-3或诱发其自身磷酸化。
如下文中更详的所述,推定的前-VEGF-C具有推定分子量46,883;一种推定的前-VEGF-C加工中间体是具有约32KD的测定分子量;而由条件培养基分离的成熟的VEGF-C是有通过还原态下的SDS-PAGE测定的约23KD的分子量。纯化的和重组的VEGF-C的测定分子量和由VEGF-C开放阅读框(ORF)编码的前VEGF-C的推定分子量的主要不同处是由于蛋白酶切去该前-VEGF-C多肽的氨基末端和羧基末端区域的序列。然而,由于由序列33的103-419位氨基酸组成的多肽的推定分子量为35,881KD,所以认为该推定的102个氨基酸的前导序列的蛋白酶切并不导致该推定的分子量46,883和测定的分子量约23KD的整个差异。证据表明分子量的测定差异的一部分是由于该VEGF-C前体的氨基和羧基末端的氨基酸残基的蛋白酶切。从PDGF结构研究(Heldin等人,“生长因子”(GrowthFactors),8245-52(1993))外推提示受体结合和由VEGF-C激活的关键区域包括于104-213的氨基酸残基,其发现于分泌型的VEGF-C蛋白(如缺乏推定的前导序列和某些羧基末端序列的类型)。该结合VEGFR-3的23 KD的多肽可能代表VEGF同源区域。生物合成后,该新生的VEGF-C多肽可在于推定的VEGF-C氨基酸序列中鉴定的三个推定的N-连接的糖基化位点被糖基化。含修饰的(诸如N-连接的糖基化)多肽,是本发明的一个方面。
和本族的其它配体相比增加该VEGF-C多肽长度的羧基末端氨基酸序列表现使人想起巴尔比亚尼环3蛋白(BR3P)序列(Dignam等人,“基因”(Gene),88133-40(1990);Paulsson等人,“分子生物学杂志”(J.Mol.Biol.),211133-40(1990))的半胱氨酸残基间隔模型。VEGF-C的这种新的C-末端丝蛋白样结构基序可折叠成独立区域,基于上述考虑,其是在生物合成后至少被部分切除的。有趣的是,至少也有一个BR3P型的半胱氨酸基序发现于该VEGF的羧基末端。在我们的实验中,推定前体和切割配体在该细胞培养基中均有检出,提示通过细胞蛋白酶的切割。VEGF-C分离物的氨基末端和羧基末端的序列测定使得可以鉴定蛋白酶解加工位点。抗该前-VEGF-C分子的不同部分的抗体的产生使得可以精确测定前体产物关系和比例,其细胞分布,以及加工和分泌动力学。
VEGF-C具有八个半胱氨酸残基的保守模式,其可以参与链间和链内二硫键的形成,从而产生出类似于PDGF的反平行二聚的生物活性分子。有关于该链间二硫键桥的半胱氨酸残基的突变分析表明VEGF二聚体不同于PDGF,其需要通过这些共价相互作用结合在一起以维持生物活性。该VEGF-C多肽链的二硫键在于非还原态下的VEGF-C分析中是显示易见的,虽然重组体蛋白也含有配体活性的无多肽间二硫键的VEGF-C型。
把VEGF和VEGF-C区分开的VEGFR-3在结构上紧密地相关于VEGFR-1和VEGFR-2。Finerty等人,“癌基因”(Oncogene),82293-98(1993);Galland等人,癌基因,81233-40(1993);Pajusola等人,“癌症研究”(Cancer Res.),525738-43(1992)。除VEGFR-3外,VEGFR-2酪氨酸激酶也随VEGF-C而被激活。VEGFR-2介导的信号引起过量表达该受体的猪动脉内皮细胞的形态学的显著变化,即,肌动蛋白重组以及膜边缘波动。在这些细胞中,VEGFR-2也介导配体诱发的趋化性和促分裂性。Waltenberge等人,“生物化学杂志”(J.Biol.Chem.),26926988-95(1994)。类似地,当该受体嵌合体CSF-1R/VEGFR-3在NIH 3T3成纤维细胞中异位表达时,其是促分裂的,但在猪动脉内皮细胞中却不是(Pajusola等人,1994)。和该结果相同,表达VEGFR-2mRNA但不表达或很少表达VEGFR-1或VEGFR-3mRNA的牛毛细管内皮(BCE)细胞在用VEGF-C刺激时表现出增强的迁移。在胶原凝胶中BCE细胞的光学显微镜观察地提示VEGF-C刺激这些细胞的增殖。因此,资料表明该VEGF配体和受体在其信号中表现出可能是细胞型依赖性的大的特异性。
VEGFR-3的表达模式(Kaipainen等人,“美国国家科学院院刊”(Proc.Natl.Acad.Sci.)(USA),923566-70(1995))提示VEGF-C可能在胚胎发生中的静脉和淋巴管系统形成中起作用。本文所示的VEGF-C在成熟组织中的组成型表达进一步提示了这种基因产物也与其中表达VEGFR-3的淋巴管和某些静脉内皮的分化功能的维持相关。淋巴毛细管没有成熟的基层并保持了一个令人感兴趣的可能性,即该丝样BR3P基序与能调节组织中的VEGF-C的有效性的超分子结构的产生相关。然而,如本文所示,VEGF-C也激活VEGFR-2,其富含于胚胎组织的血管芽和分支的管的正增殖着的内皮细胞中,但并不同样富含于成人组织中。Millauer等人,“自然”(Nature,367576-78(1993)。这些资料提示VEGF-2是血管发生和血管生成的一种主要调节因子。因此,VEGF-C可能对淋巴内皮具有独特的效应并和VEGF一起在血管生长中以及可能在调节几种类型的内皮的渗透性中具有更多的功能。由于VEGF-C刺激VEGFR-2并促进内皮迁移,VEGF-C可在创伤愈合,组织移植,眼病,以及梗塞后动脉狭窄周围并进入受伤组织的旁系管的形成中用作血管和淋巴管的发生诱发剂。
总之,这些结果显示出血管内皮信号的增强的复杂性。其强化了这一概念,即当组织分化并开始执行它们的特定功能时,该内皮细胞的表型不均一性在几类功能和形态不同的管中增加。然而,基于合适的血管生成刺激的刺激,内皮细胞可以重入细胞循环,迁移,撤出细胞循环并随后又分化成新的功能性适应于其组织环境的脉管。这种和组织发育和再生同时发生的血管发生过程依赖于对内皮细胞增殖,迁移,分化和生存的正负信号间严格控制的平衡。
先前鉴定的促进血管形成的生长因子包括成纤维细胞生长因子,肝细胞生长因子/散射因子,PDGF和TGF-α。(见如Folkman,“自然医学”(NatureMed.)127-31(1995);Friesel等人,FASEB杂志,9919-25(1995);Mustonen等人,细胞生物学杂志,129895-98(1995)。然而,VEGF是唯一的对内皮细胞相对特异性的生长因子。因而,新鉴定的因子VEGF-B[Olofsson等人,美国国家科学院院刊,932578-81(1996)]和VEGF-C增加了我们对内皮细胞的有关血管发生,血管生成,通透性,以及也许还有其它内皮功能的特异性和丰富的阳性信号的复杂性的理解。使用Northern印迹的表达研究表明在心脏和骨骼肌中丰富的VEGF-C表达;其它组织,如胎盘,卵巢,小肠,甲状腺,肾,前列腺,脾,睾丸和大肠中也表达该基因。而PLGF主要在胎用盘中表达,VEGF,VEGF-B和VEGF-C的表达模式在许多组织中重叠,提示VEGF族的成员可以形成异源二聚体并互相作用以完成其生理功能。
引起鼠基因组中VEGF受体基因座的失活的定点诱变表明VEGFR-1是形成血管内皮的内皮细胞的固有结构所必需的,而VEGF-2是内皮和造血细胞的产生所必需的。这提示VEGF族的四个基因可以是导致血管畸形和心血管疾病的突变的靶。
下列实施例阐明本发明的优选实施方案,其中描述了根据本发明的Flt4配体以及编码配体的核酸的分离,鉴定,及功能。
实施例1pLTRFlt4l表达载体的制备编码长型Flt4受体酪氨酸激酶的LTR-Flt4l载体的构建如图2所示。全长的Flt4s(Flt4短型)cDNA(Genbank登记号X68203,序列36)是通过首先将含有Flt4s的56-2534碱基对的S2.5片段(见于以参考文献形式并入本发明的Pajusola等人,癌症研究,525738-5743(1992))亚克隆入pSP73载体(Promega,Madison,WI)的EcoRI位点而装配。
由于用于筛选Flt4 cDNA的cDNA文库并不含编码蛋白序列的极端5′,所以反义PCR用于扩增相当于头12个氨基酸残基(MQRGAALCLRLW)的Flt4 5′端。分离自人HEL红白血病细胞和双链cDNA的Poly(A)+RNA是使用Amersham cDNA合成系统Plus试剂盒(Amersham公司,Buckinghamshire,U.K.)和基因-特异性引物5′-TGTCCTCGCTGTCCTTGTCT-3′(序列1)(其定位于克隆S2.5的5′端的下游195bp处)合成的。用T4DNA聚合酶处理双链cDNA使末端平端化并用Centricon100滤器(Amicon公司,Beverly,MA)过滤纯化cDNA。通过在为150μl的总体积中连接进行平端cDNA的环化。该反应混和物含有一种标准连接缓冲液。5%PEG-8000,1mM DTT和8UT4 DNA连接酶(New England Biolabs,Beverly,MA)。该连接反应在16℃下进行16小时。取15μl反应液用于含100ng Flt4-特异性的引入Sac I和Pst I限制性位点的引物,和1u Taq DNA聚合酶(Perkin Elmer Cetus)的常规PCR反应。用每次33个循环(95℃变性1分钟,55℃退火2分钟,72℃延长4分钟)进行PCR两次。先后用Sac I和Pst I限制性酶处理该PCR混合物,并在用Magic PCR Preps(Promega)纯化后,将DNA片段亚克隆入用于测序(Promega)的pGEM 3zf(t)载体。对应于Flt4s cDNA克隆的5′端序列贮藏于登记号为X68203的基因文库数据库。
将编码头12个氨基酸残基的序列通过连接Sph I-消化的用反转录PCR扩增分离于HEL细胞的poly(A)+RNA产生的PCR片段而加入表达构建体。正向引物用具有如下序列5′-ACATGCATGC CACCATGCAGCGGGGCGCCG CGCTGTGCCT GCGACTGTGG CTCTGCCTGGGACTCCTGGA-3′(序列2)(SphI位点下划线,翻译起始密码子用黑体表示)。该翻译起始密码子正好是最优的Kozak共有序列的下游。(Kozak,核酸研究,158125-8148((1987))。反向引物5′-ACATGCATGCCCCGCCGGT CATCC-3′(序列3)(Sph I位点下划线),该S2.5片段5′端,因而取代了S2.5质粒的唯一Sph I片段。用EcoRI和Cla I消化该所得的载体并连接到138bp的PCR片段上,而该PCR片段扩增于编码如Pajnsola等人,癌症研究,525738-5743(1992)图1所示的Flt4 3′端的0.6kb EcoRI片段(基因文库X68263序列中3789-4416位碱基对),其用寡核苷酸5′-CGGAATTCCC CATGACCCCA AC-3′(序列4)(正向引物,EcoR位点下划线)和5′-CCATCGATGG ATCCTACCTG AAGCCGCTTT CTT-3′(序列5)(反向引物,Cla I位点下划线)。该编码区域通过将1.2kb EcoRI片段(见于基因文库登记号为X68203序列的2535-3789bps)连接到上述构建体而完成。该完整的cDNA作为Hind III-Cla I(平端化)片段(该Cla I位点还包括于用于构建该编码序列的3′端的3′引物)通过其Hind TII-Acc I(平端化)限制性位点亚克隆λPLTR poly表达载体,该载体报道于Makela等人,基因,118293-294(1992)(基因文库登记号X60280,序列37),其以参考文献形式并入本发明。
长型的Flt4(Flt4l)是通过如下置换短型的3′端而制备该Flt4l cDNA 3′区域是分别使用基因特异性寡核苷酸(序列7,如下)和pGEM 3Z载体-特异性(SP6启动子)寡核苷酸5′-ATTTAGGTGACACTATA-3′(序列6)作为反向和正向引物而进行PCR扩增的。PCR的模板是含有从基因文库X68203序列(该EcoRI位点的下游序列以Flt4长型3′序列并以基因文库登记号S66407)(序列38)保藏)的3789位核苷酸的EcoRI位点向下游延伸的495bp EcoRI片段的Flt4l cDNA克隆。该基因-特异的寡核苷酸含有刚好定位于编码区末端的Bam HI限制性位点并具有以下序列5′-CCATCGATGGATCCCGATGCTGCTTAGTAGCTGT-3′(序列7)(BamHI位点下划线)。用EcoRI和BamHI消化该PCR产物并以框转化到其EcoRI位点2535bp(见序列X68203)下游的编码序列已用EcoRI-BamHI消化切除的LTRFlt4s载体片段中。所得的克隆称为pLTRTlt4l。该编码区又通过连接1.2kb的EcoRI片段(序列X68203的2535-3789碱基对)到所得载体中。
实施例2Flt4l转染细胞的制备和检测NIH 3T3细胞(60%融合)使用基于DOTAP脂质体的转染试剂(Boehringer-Mannheim,Mannheim,德国)用5μg pLTRFlt4l构建体和0.25μg的含新霉素磷酸转移酶基因(Southern等,“应用分子遗传学杂志”(J.Mol.Appl.Genet),1327(1982)一起共转染。转染一天后,将该细胞转入含0.5mg/ml遗传霉素(GIBCO,Grand Island,N.Y.)的选择的培养基。分离遗传霉素抗性的细胞集落并检测该Flt4蛋白的表达。在煮沸的含3.3%SDS 125mM Tris,pH6.8的裂解缓冲液中裂解细胞。用BCA方法(Pierce,Rockford,IL)测定该样品的蛋白质浓度。每个裂解物的大约50μg蛋白质通过SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)和使用抗Flt4羧基末端的抗血清的免疫印迹检测Flt4的存在。Western印迹的信号通过ECL法(Amersham)检测。
为生产抗-Flt4抗血清,将编码短型的羧基端40个氨基酸残基的Flt4cDNA片段NH2-PMTPTTYKG SVDNQTDSGM VLASEEFEQIESRHRQESGFR-COOH(序列8)以657bp EcoRI-片段克隆入读框内带有谷胱甘肽-S-转移酶编码区的pGEX-1λT细菌表达载体(Pharmacia-LKB,公司,Uppsala,Sweden)。所得的GST-Flt4s融合蛋白在E.coli中生产并通过谷胱甘肽-除脂糖凝胶4B柱的亲和层析纯化。将纯化的蛋白质冻干,溶于磷酸缓冲盐液(PBS),和Freund′s佐剂混合并用于以双周间隔通过本领域的常规方法免疫兔(Harlow等,“抗体实验手册”(AntibodiesA laboratoryManual)(冷泉港实验室出版社,1988))。在四次强化免疫后,抗血清用于从转染细胞中免疫沉淀Flt4。表达Flt4的细胞集落也用于配体刺激检测。
实施例3Flt4 EC杆状病毒载体的构建及其产物的表达和纯化Flt4胞外域(EC)杆状病毒载体的构建图示于图3。该编码Flt4的cDNA以长型和短型制备,每个类型均在Moloney鼠白血病病毒LTR启动子的控制下掺入载体。短型Flt4受体的核苷酸序列获自登记号为X68203的基因文库数据库而特异性的长型cDNA的3′区段获取基因文库登记号S66407。
编码Flt4 EC的cDNA区段的末端如下进行修饰用引物1116(5′-CTGGAGTCGACTTGGCGGACT-3′,序列9,SalI位点下划线)和引物1315(5′-CGCGGATCCCTAGTGATGGTGATGGTGATGTCTACCTTCGATCATGCTGCCCTTATCCTC-3′;(序列10,BamHI位点下划线)扩增该Flt4cDNA(基因文库登记号X68203)EC序列3′端的胞外区的序列。引物1315的5′端序列并非互补于Flt4编码区。检查互补于引物1315的此区的序列发现从5′到3′方向有一个终止密码子,六个邻接的His密码子(随后的用Ni-NTA柱;Qiagen,Hilden,德国,色谱纯化该编码的多肽),以及附加的BamHI位点。用SalI和BamHI消化该扩增的片段并用于代替图3所示LTRFlt4载体中独特的SalI-BamHI片段。该被取代的SalI-BamHI片段编码Flt4跨膜和胞质区。所得的是一种修饰的LTRFlt4载体。
该无Flt4信号序列的5′端编码区通过使用引物1335(5′-CCCAAGCTTGGATCCAAGTGGCTACTCCATGACC-3′(序列11),该引物含附加的HindIII(AAGCTT)和BamHI(GGATCC)限制性位点,其有下划线)的PCR扩增。用于扩增编码Flt4信号序列区的第2个引物是引物1332 5′-GTTGCCTGTGATGTGCACCA-3′(序列12),该扩增的片段用HindIII和SphI消化(在引物1335中该HindIII位点(AAGCTT)以下划线表示而该SphI位点在Flt4cDNA的扩增区内)。所得的HindIII-SphI片段用于置换以上刚刚描述的修饰的LTRFlt4载体的HindIII-SphI片段(该HindIII位点位于该Flt4插入片段和该载体的pLTR poly区段的5′连接头处,该SphI位点位于Flt4 cDNA)。然后,该所得的Flt4 EC插入片段作为BamHI片段连接入pVTBac质粒的BamHI位点,如Tessier等人,基因,98177-183(1991)所述,其以参考文献形式并入本发明。通过部分测序证实该插入片段的相对方向以便使该载体的信号序列-编码区段的开放阅读框在框内相邻于Flt4编码区序列。该Flt4EC构建体和杆状病毒基因组DNA一起通过脂转染而转染入SF-9细胞。纯化,扩增该重组体病毒并用于通过本领域常规方法感染High-Five细胞(Invitrogen,San Diego,CA)。根据制造商说明书(Qiagen)用Ni-NTA亲和层析来结合并洗脱重组体Flt4EC的羧基端编码的6×His标记而被感染的Hign-Five细胞的培养基中纯化该Flt4EC。
实施例4从条件培养基中分离Flt4配体根据本发明的人Flt4配体分离于条件培养基,该培养基是PC-3前列腺癌细胞系(ATCC CRL 1435)培养于含7%胎牛血清(FCS)的Ham′s F-12营养混和物(GIBCO)中。该细胞按产品说明书培养。为制备该条件培养基,融合PC-3细胞在Ham′3 F-12营养混合物(GIBCO)中于无胎牛血清(FCS)存在下培养七天。然后,于1000g离心该培养基20分钟使之澄清。然后,筛选该培养基以检测其暴露于已用编码Flt4的cDNA通过pLTRFlt4l载体转染的NIH 3T3细胞而诱发Flt4酪氨酸磷酸化的能力。对于受体刺激实验,将亚融合的NIH 3T3细胞在含0.2%BSA而无血清的DMEM培养基(GIBCo)中饥饿过夜。用条件培养基刺激该细胞5分钟,用含100μmol矾酸盐的冷PBS洗涤两次,并在用于受体免疫沉淀检测的RIPA缓冲液(10mM Tris pH7.5,50mM NaCl,0.5%脱氧胆酸钠,0.5%Nonidet P40(BDH,Poole,英国),0.1%十二烷基硫酸钠(SDS),0.1 u/ml抑蛋白酶肽(Aprotinin)(BoehringerMannheim),1mM矾酸盐)中裂解。1,5000×g下离心该裂解物20分钟。上清液用3μl的如实施例2所述的抗Flt4(末端的抗血清于冰上培育2小时。也见于Pajusola等人,癌基因,8293-2937(1993),其以参考文献形式并入本发明。
在有抗-Flt4抗血清存在下培育2小时后,加入蛋白A-琼脂糖凝胶(Pharmacia)并旋转下继续培养45分钟。在SDS-PAGE检测前,分别用免疫沉淀缓冲液和10mM Tris,pH 7.5洗涤三次和二次。将多肽转到硝酸纤维素膜上并用Flt4-或者磷酸酪氨酸-特异性抗血清和ECL法(Amersham公司)Western印迹检测。抗磷酸酪氨酸单克隆抗体(抗-PTyr;PY20)购自Transduction实验室(Lexington,Kentucky)。在某些情况下,剥离后的滤器又染有了第二抗体。该滤器的剥离是在100mM 2-巯基乙醇,2%SDS,62.5mMTris-HCl,pH 6.7中于50℃下偶尔搅动并持续30分钟进行。
如图4所示,该PC-3条件培养基(PC-3CM),在表达Flt4的NIH 3T3细胞用所述培养基制剂处理时,刺激125KD多肽的酪氨酸磷酸化,裂解,而该裂解物在SDS-PAGE后用抗Flt4抗血清免疫沉淀,Western印迹,并用抗-PTyr抗体染色。该所得带在用未浓缩的PC-3条件培养基刺激的基础上而被轻微磷酸化(泳道2)。该125KD带和源于过矾酸盐处理的细胞的成熟Flt4的酪氨酸磷酸化的,加工型的(比较图4的泳道2和7,也见于图5A)一起共迁移。共迁移也被如图5A(右图)所示的再沾染抗-Flt4抗体所证实。为显示该125KD多肽并非能与抗-磷酸酪氨酸抗体反应的条件培养基的非特异性组分,将15μl的条件培养基通过SDS-PAGE分离,印迹于硝酸纤维素膜,并用抗-PTyr抗体染色该印迹。无信号得出(图5B)。非条件培养基也不能刺激Flt4磷酸化,如图4,泳道1所示。
图5C示PC-3CM刺激(+)未转染(泳道4和5),FGFR-4-转染(泳道8和9)和Flt4转染NIH 3T3细胞(泳道1-3,6和7)的效果对比。这些结果表明未转染NIH 3T3细胞和用FGFR-4转染的NIH 3T3细胞均不显示基于该源于PC-3细胞的条件培养基刺激的约125KD蛋白的酪氨酸磷酸化。通过已用肝素-琼脂糖凝胶CL-6B(Pharmacia)于室温下预处理2小时(泳道2)的PC-3CM刺激分析显示Flt4配体并不结合于肝素。
如图4,泳道3所示,当该PC-3条件培养基用Centricon-10浓缩器(Amicon)浓缩4倍时,其刺激活性并不显著增加。图4,泳道4显示用50μl的偶联到CNBr-活化的琼脂糖凝胶CL-4B(Pharmcia;大约1mg Flt4EC区/ml琼脂凝胶树脂)的Flt4EC预处理浓缩的PC-3条件培养基彻底消除了Flt4酪氨酸磷酸化。类似的用来取代的琼脂糖凝胶CL-4B预处理该条件培养基并不影响刺激活性,如图4,泳道5所示。浓缩后所得的流通(其包括分子量低于10,000的蛋白质)并不刺激Flt4磷酸化,如图4,泳道6所示。
在另一个实验中,分别用非条件培养基,源自表达Flt4配体的PC-3细胞的培养基,或者含50ng/ml VEGF165或50ng/ml PLGF-1的非条件培养基进行转化的表达LTRFlt4l的NIH 3T3细胞的FLt4自身磷酸化对比。将该细胞裂解,用抗FLt4抗血清免疫沉淀并通过Western印迹用抗磷酸酪氨酸抗体检测。唯有表达Flt4配体(泳道Flt-4L)的PC-3条件培养基刺激Flt4自身磷酸化。
前述资料显示该PC-3细胞产生结合于Flt4 EC的配体并活化该受体。
实施例5Flt4配体的纯化由如实施例4所述的人PC-3细胞表达的配体通过在亲和层析中使用重组生产的Flt4 EC纯化和分离。
两次共8升的无血清条件培养基收获物收集于含PC-3细胞铺满层的500铺满直径15cm培养器。以10,000×g离心澄清该条件培养基并以Ultrasette Tangential流量仪(Filtron,Northborough,MA)用10KD截留Omega超滤膜根据说明书的方法浓缩80倍。重组Flt4 EC在重组杆状病毒细胞系统中表达并通过Ni-琼脂糖(Ni-NTA亲和柱,购自Qiagen)亲和层析纯化。该纯化的胞外区以5mg/ml的浓度偶联到CNBr-活化的Sepharose CL-4B上并用作配体亲和层析的亲和基质。
将浓缩的条件培养基用2ml重组的Flt4 EC Sepharose亲和基质在滚管中于室温下培养3小时。随后所有的纯化步骤都在+4℃下进行。然后,将该亲和基质转入内径15mm的柱中并用100ml PBS和50ml 10mM的磷酸钠缓冲液(pH 6.8)连续洗涤。用100mM甘氨酸-HCl分步洗涤脱该结合材料,连续的6ml洗脱pH分别为4.0,2.4和1.9。在含0.5ml 1M磷酸钠(pH8.0)的管中收集几份2ml洗出液组分。立即混合合组份并在1mM Tris-HCl(pH 7.5)中透析。检测每75μl的各等份的刺激Flt4酪氨酸磷酸化的能力。还检测了超滤液,配体亲和层析前后的100μl的各等份浓缩的条件培养基,以及15倍浓缩的在洗涤过程中从Flt4 EC-Sepharose基质中释放的物质组分的刺激Flt4酪氨酸磷酸化。
如图6,泳道3所示,浓缩的条件培养基诱发了过量表达Flt4的转染的NIH 3T3细胞中Flt4显著的酪氨酸磷酸化。此活性没有发现于取自暴露于上述(图6,泳道4)Flt4 Sepharose亲和基质后的培养基的条件培养基。该特异性-结合Flt4-刺激材料在用PBS,10mM磷酸钠缓冲液(pH 6.8),及pH 4.0(图6,分别为泳道5-7洗涤后仍保留于亲和基质上,并且其在pH2.4时洗脱在头2ml等份中,(泳道8和9)中段洗脱。洗脱缓冲液pH的进一步降低并不导致另外的Flt4-刺激物质(图6,泳道11)的释放。图6,泳道1示其中的表达Flt4细胞用非条件培养基处理的对照;泳道2示用含分子量小于10KD的多肽的条件培养基的超滤组分处理表达Flt4的细胞后的结果。
将色谱组分的小的等分在SpeedVac浓缩仪(Savant,Farmingdale,N.Y.)中浓缩并进行还原态下的SDS-PAGE,随后用本领域的常规技术即银染该凝胶。如图7示,分子量约为23KD(还原态)的主要多肽检测于含刺激Flt4活性(相当于图6中的泳道8和9)组分中。该多肽并不发现于其它色谱组分中。另一方面,除了这些带和一个具有32KD迁移率的很弱带外,检测于两活性组分的全部其它成分也分布于起始材料以及以少量分布于浓缩后的洗涤和洗脱步骤中。类似的结果也在三个独立的亲和纯化中得到,表明该23KD多肽特异性地结合于Flt4并诱发Flt4的酪氨酸磷酸化。
将含23KD多肽的组分混和,在Speed Vac浓缩仪中干燥并于12.5%凝胶中进行SDS-PAGE。然后,将凝胶中的蛋白质电印迹到Immobilon-P(PVDF)转移膜(Millipore,Marlborough,MA)并通过用考马斯蓝R-250染色观察。由印迹将只含染色的23KD带的区域切下并在Prosite蛋白测序系统(Applied Biosystems,Foster City,CA)中进行N末端氨基酸序列分析。用610A数据分析系统(Applied Biosystems)分析数据。分析表明有一单个N-末端序列NH2-XEETIKFAAAHYNTEILK-COOH(序列13)。
实施例6在真核表达载体中构建PC-3细胞cDNA文库。
用寡脱氧胸苷(oligo(dT))(III型,Collaborative Biomedical Products,Becton-Dickinson Labwane,Bedford,MA)纤维素亲和层析(Sambrook等,1989)通过一步法从5个铺满PC-3细胞的直径15cm的皿中分离人poly(A)+RNA。收量为70μg。取6μg poly(A)+RNA用于在哺乳动物表达载体pcDNA I和Invitrogen Librarian试剂盒中按试剂盒说明书的方法制备oligo(dT)-引物cDNA文库。估计该文库含大约106个独立的且平均插入片段大小约为1.8kb的重组体。
实施例7编码Flt4配体氨基末端的特有核苷酸序列的扩增。
基于分离的人Flt4配体的N-末端氨基酸序列设计简并的寡核苷酸并用于聚合酶链反应(PCR)中作为引物以扩增编码Flt配体且源自该PC-3 cDNA文库的cDNA。实施例7和8中所述的总策略图示于图9,其中以箭头示不同的引物。
用1μg源于扩增的PC-3cDNA文库的DNA及以下引物的混合物进行PCR,这两种引物是同样比例存在的48有义链引物(该引物序列总共含有序列5′-GCAGARGARACNATHAA-3′(序列14)(其中的R是A或G,N是A,G,C或T而H是A,C或T),编码氨基酸残基2-6(EETIK,序列15))的序列和以同样比例存在的384反义链引物(该反义链引物总共有序列5′-GCAYTTNARDATYTCNGT-3′(序列16)(其中的Y是C或T而D是A,G,或T),且对应于氨基酸残基14-18(TEILK,序列17))。在每个引物的5′端加入三个额外的核苷酸(GCA)以增加退火稳定性。每反应用1U的DynaZyme(F-500L,Finnzymes,Espoo,Finland)(一种热稳定的DNA聚合酶)溶于由制造商提供的缓冲液(10mM Tris-HCl,pH 8.8,25℃,1.5mM MgCl2,50mM KCl,.01%Triton-X100)中且于72℃的延伸温度下进行两个连续的PCR反应。第一个PCR进行43个循环。首先的三个循环的退火温度为33℃,时间为2分钟,而其余的循环在42℃下进行1分钟。
从凝胶上切下含预计大小(57bp)的弱带的凝胶区并洗脱。再用上述同样的引物对于42℃,1分钟下重扩增该洗脱物30个循环。用TA克隆试剂盒(Invitrogen)将扩增的片段克隆入PCRII载体中(Invitrogen)并用Sanger放射性双脱氧核苷酸测序法测序。检测了六个克隆且全部六个克隆株都含有编码目的肽(Flt4配体前体的104-120位氨基酸残基)的序列。横跨密码子6的第三个核苷酸到密码子13的第三个核苷酸(延伸区)的核苷酸序列在全部六个克隆株中是相同的5′-ATTCGCTGCAGCACACTACAAC-3′(序列18)并因此代表源于编码Flt4配体的氨基末端部分的特有序列的扩增产物。
实施例8编码Flt4配体的cDNA的5′-末端的扩增基于特有的编码分离的人Flt4配体N-末端的核苷酸序列,设计了两对嵌套引物以便在两个嵌套式PCR反应中扩增源于1μg上述PC-3 cDNA文库的DNA的相应cDNAs的完整5′端。首先,用4个共同定义序列5′-TCNGTGTTGTAGTGTGCTG-3′(序列19)的引物(其是对应于氨基酸残基9-15(AAHYNTE,序列20)的反义链引物),以及对应于用于构建文库的pcDNA I 载体的 T7 RNA 启动子的有义链引物5′-TAATACGACTCACTATAGGG-3′(序列21)的同样混和物进行扩增。所用的着陆(“Touchdown”)PCR如Don等人,核酸研究,194008(1991)所公开,其以参考文献形式并入本发明。头两个循环中的退火温度是62℃而随后的退火温度在每个循环中渐减1℃直至达到终温度53℃,在此温度进行另外16个循环。退火时间为1分钟而每个循环的延伸在72℃下进行1分钟。在第一个反应中得到多次扩增的DNA片段。第一次扩增产物(1ul的以水进行1∶100的稀释液)用于第二次扩增反应,而后者使用含有编码Flt4配体的氨基酸残基6-13(KFAAAHYN,序列23)反义链引物(5′-GTTGTAGTGTGCTGCAGCGAATTT-3′;序列22),以及对应于pcDNAI载体的2179-2199位核苷酸的有义链引物(5′-TCACTATAGGGAGACCCAAGC-3′,序列24)的一对嵌套引物。该有义和反义引物序列重叠于第一次PCR所用的相应引物的3′端。“着陆”(“Touchdown”)PCR通过将退火温度从72℃降至66℃并在66℃下连续进行另外18个循环而进行。退火时间为1分钟而每个循环的延伸在72℃进行2分钟。得到了约为220bp的一个主要产物以及约为270bp,150bp,以及100bp的三个次要产物。
将约220bp的扩增片段从琼脂糖凝胶上切下,用TA克隆试剂盒(Invitrogen)将其克隆到PCR II载体并测序。检测了三个重组克隆株并且含有序列5′-TCACTATAGGGAGACCCAAGCTTGGTACCGAGCT CGGATCCACTAGTAACGGCCGCCAGTGTGGTGGAATTCGACGAACTCATGACTGTACTCTACCCAGAATATTGGAAAATGTACAAGTGTCAGCTAAGGCAAGGAGGCTGGCAACATAACAGAGAACAGGCCAACCTCAACTCAAGGACAGAAGAGACTATAAAATTCGCTGCAGCACACTACAAC-3′(序列25)。序列的起始代表pc DNAI载体而划线序列代表cDNA插入片段5′端的扩增产物。
实施例9编码Flt4配体的cDNA 3端的扩增基于扩增的编码23KD人Flt4配体的氨基末端的克隆的5′序列,设计了两对非重叠嵌套引物以扩增Flt-4-配体-编码cDNA克隆的3′部分。对应于所扩增的Flt4配体的5′序列(序列25)的152-169位核苷酸的有义链引物5′-ACAGAGAACAGGCCAACC-3′(序列26),以及对应于pc DNAI载体的2311-2329位核苷酸的反义链引物5′-TCTAGCATTTAGGTGACAC-3′(序列27)用于第一个“着陆”PCR。每两个循环该反应的退火温度降低1℃,从72℃到52℃,在52℃下再进行15个循环。退火时间为1分钟而每循环的延伸是在72℃下进行3分钟。在第一个扩增中得到了几种大小的DNA片段。用水以1∶200稀释所得产物并在使用第二对引物5′-AAGAGACTATAAAATTCGCTGCAGC-3′(序列28)和5′-CCCTCTAGATGCATGCTCGA-3′(序列29)(对应于pc DNAl载体的2279-2298位核苷酸的反义链引物)的PCR再扩增。得到了1350bp和570bp大小的两个DNA片段。将这些片段克隆入PCR II载体并测序该克隆插入片段。发现这两个片段都编码同源于VEGF序列的氨基酸序列的序列。
实施例10用Flt4配体cDNA的5′PCR片段筛选PC-3细胞cDNA文库通过使用上述的5′PCR片段以及引物5′-GTTGTAGTGTGCTGCAGCGAATTT-3′(反义链引物,序列30)和5′TCACTATAGGGAGACCCAAGC-3′(序列31)(对应于pc DNAI载体的2179-2199位核苷酸的有义链)的PCR扩增人Flt4配体cDNA 219bp 5′末片段。用EcoRI(Boehringer Mannheim)消化该扩增产物以除去扩增于pc DNAI载体的DNA序列部分并用Ecoli DNA聚合酶I(Boehringer Mannheim)以[32P]-dCTP标记所得的编码Flt4配体5′端的153bp片段。该片段用作探针以杂交筛选扩增的PC-3细胞cDNA文库。
将该文库的滤膜影印在含50%甲酰胺,5×氯化钠磷酸钠缓冲液(SSPE),5×Denhardt’s溶液,0.1%SDS和0.1mg/ml变性鲑精DNA的溶液中用放射性标记的探针在42℃杂交20小时。在1×氯化钠柠檬酸缓冲液(SSC),0.1%SDS中于室温下,30分钟内洗涤该滤膜两次,然后,在65℃下30分钟内洗涤两次并曝光过夜。
基于放射自显影,从该文库中用探针杂交筛选出二个阳性的重组细菌克隆株。从这些克隆株中纯化质粒DNA并用EcoRI和NotI消化和琼脂糖电泳随后用溴化乙锭染色分析。基于分别存在约1.7,1.9和2.1kb大小的插入片段将该十个质粒克隆株分成三组。用T7寡核苷酸作为引物以及随后测序反应的步骤引物测序每组质粒的插入片段。
序列分析表明全部克隆株均含有编码该23KD人Flt4配体的NH2-末端序列的开放阅读框。用步移引物在下游方向继续双脱氧测序。完整的人cDNA序列和源于2kb克隆的推定的氨基酸序列分别如序列32和33所示。“前”导序列的一个推定切割位点位于序列33的102和103残基之间。当和基因文库的数据库中序列对比时,发现该阅读框的预定蛋白质产物与图10所示的PDGF/VEGF族生长因子的预测氨基酸序列同源。
含pc DNAI载体的2.1kb人cDNA克隆的质粒pFLT4-L已保藏于ATCC,12301 Parklawn Drive,Rockville,MD 20852,登记号97231。
实施例11
通过Flt4配体载体的蛋白产物刺激Flt4自身磷酸化将含有编码如序列32和33所示的序列的开放阅读框的2.1kb的质粒pFlt4-1L的人cDNA插入片段(人VEGF-C,如下文)用Hind III和NotI限制性酶从pcDNAI载体上切出,分离于制备型琼脂糖凝胶,并连接到pREP7表达载体(Invitrogen)的相应位点。将该含pFlt4-L插入片段的pREP7载体用磷酸钙转染法转染到293-EBNA细胞(Invitrogen)(Samnbrook等人,1989)。转染后约48小时,将所转染细胞的培养基转到无胎牛血清的DMEM培养基中并培育36小时。然后,5000×g离心20分钟以收集该条件培养基,用Centriprep10(Amicon)将上清液浓缩5倍并用于刺激表达LTRFlt4l(Flt4受体的NIH3T3细胞,如实施例4所示。将该细胞裂解,用抗Flt4抗血清免疫沉淀并用抗磷酸酪氨酸抗体通过Western印迹检测。
与仅给出背景水平的Flt4受体磷酸化的源于模拟转染细胞的培养基相比,源于转染细胞的两个不同的平皿的条件培养基刺激Flt4自身磷酸化。当该浓缩的条件培养基用20μl的偶联到Sepharose的Flt4EC区悬浮液预吸收时(见于实施例4),未达到磷酸化,从而表明引起Flt4自身磷酸化的活性的确是Flt4配体。因此,这些结果证明具有约2.1kb的插入片段并含有如序列32所示的开放阅读框的表达载体能在所转染细胞中表达为一种生物活性的Flt4配体(VEGF-C)。由该开放阅读。框编码的序列如序列33所示。
由序列33的全部氨基酸序列(残基1-419)所组成的多肽的推定分子量是46,883。由序列33的103-419位氨基酸残基组成的多肽的推定分子量为35,881。用还原态的SDS-PAGE测定的纯化于PC-3培养物的Flt4配体的分子量约为23KD。因此,显然是该Flt4配体mRNA翻译成了多肽前体,而通过蛋白酶切可从该前体衍生出成熟的配体。该Flt4配体也可以在三个推定的N-连接糖基化位点糖基化,该位点与可在推定的Flt4配体氨基酸序列(图10中划线的N-残基)的共有序列相同。
和该族的其它配体相比,能增加Flt4配体亚单位的预定分子量的羧基末端氨基酸序列表现出使人想起Balbiani环3蛋白(BR3P)序列的半胱氨酸残基的间隔模式(Dignam等人,基因,88133-140(1990)),如图9所示。该序列可以编码存在于Flt4配体前体的一个独立的折叠区并可以和诸如调节Flt4配体的分泌,溶解性,稳定性,细胞表面定位或活性相关。有趣的是,在VEGF羧基末端氨基酸序列中也发现了该BR3P型的至少一个半胱氨酸基序。
因此,该Flt4配体mRNA似乎首先翻译成源于和质粒Flt4-1的cDNA插入片段对应的mRNA的前体,从中通过蛋白酶切可以衍生出该成熟的配体。为定义该成熟的Flt4配体多肽,有人首先在诸如COS细胞的细胞中表达该cDNA克隆(沉积于pc DNAI表达载体)。有人用抗编码的多肽,及其片段,或者细菌Flt4融合蛋白,如GST-融合蛋白的抗体产生抗VEGF-同源区和Flt4配体的氨基-和羧基-末端多肽的抗体。然后,有人在所转染细胞中的Flt4配体生物合成和加工后,用放射性半胱氨酸标记该细胞,免疫沉淀和凝胶电泳进行脉冲追踪分析。用抗由质粒FLT4-L的cDNA插入片段编码的产物的三个区的抗体,分离出用于放射性或非放射线的氨基末端序列分析的物质。该成熟的VEGF-C多肽的氨基末端序列的测定可以用于鉴定该氨基末端蛋白酶加工位点。该羧基末端前肽的氨基末端的测定将给出羧基末端加工位点。这可通过可阻止酶切的在切割位点的相邻氨基酸残基处定点诱变而证实。
该Flt4配体还可通过该Flt4配体前体克隆的3′编码序列中的渐进性3′缺失来描述,其引入了一个引起其蛋白产物羧基末端截断的终止子。该载断型的活性如下测定例如,当应用于诸如表达LTRFlt4的NIH3T3细胞的细胞培养物时研究该截断型蛋白诱导的Flt4自身磷酸化。通过相关的血小板衍生生长因子的结构研究外推,有人认为由Flt4配体的受体激活的关键区包含于缺少推定的102个氨基酸前导序列的分泌型VEGF-C蛋白的大约头180个氨基酸残基(序列33,103-282残基,并显然包含于大约头120个氨基酸残基(序列33,103-223残基)。
另一方面,该纯化的配体测定分子量和从该Flt4配体克隆的开放阅读框推导的分子量间的不同量由于该可溶配体产生于能在衍生该分离配体的PC-3细胞中呈递的可变剪接的mRNA。为分离该可变的cDNA克隆,有人用已保藏的克隆的cDNA片段和根据提供的序列制备的PCR引物以及本领域的常规技术从PC-3细胞cDNA文库中分离或扩增可变的cDNAs。还可以用(RT)-PCR直接从该PC-3mRNA中用质粒FLT4-L的cDNA插入片段的序列中提供的引物扩增。从所得的cDNA克隆中测定可变cDNA序列。还可以用本领域的常规方法从人基因组DNA文库中分离对应于Flt4配体mRNA转录体的基因组克隆并测序该克隆或其亚克隆片段以检测相应的外显子。然后,可变的外显子可用许多本领域常规方法(如随后描述的cDNA和基因组DNA的异源双链分析)而鉴定。
实施例12编码VEGF-C基因在人肿瘤细胞系中的表达对应于Flt4配体(VEGF-C)的转录体的表达可通过含源于HT-1080和PC-3人肿瘤细胞系的分离poly(A)+的Northern印迹杂交而检测。探针为放射性标记的2.1kb cDNA克隆的插入片段(pFlt4-L/VEGF-C,比活性108-109cpm/mg DNA)。用50%甲酰胺,5×SSPE缓冲液,2%SDS,10×Denhardt′s液,100ng/ml鲑精DNA以及1×106cpm标记探针/ml在42℃下杂交该印迹过夜。先后分别用含0.05%SDS的2×SSC和含0.1%SDS的0.1×SSC在室温和52℃下洗涤该印迹2×30分钟和2×20分钟。然后,用增感屏和Kodak XAR胶片在-70℃下曝光该印迹三天。二个细胞系都表达Flt4配体mRNA(约2.4kb)以及VEGF和VEGF-B mRNAs(图12)。
实施例13VEGF-C链在生物合成后被蛋白酶切加工和二硫键合如同从VEGF-C开放阅读框推定的那样,分泌型人VEGF-C多肽的预测分子量为46,883KD,提示该VEGF-C mRNA可首先翻译成一个前体,而从该前体中通过蛋白酶切可生成21/23KD和29/32KD的配体。
此可能性可以通过代谢标记的表达VEGF-C的293EBNA细胞而研究。最初,用VEGF-C构建体转染293EBNA细胞。通过加入100μCi/mlPro-mixTML-[35S]体外细胞标记混和物((含35S-Met和35S-Cys)Amersham,Backinghamslior,England)到无Cys和Met的培养基中而标记该表达产物。两小时后,用PBS洗涤该细胞层两次,然后用DMEM-0.2%BSA代替该培养基。随后培育1,3,6,12和24小时后,收集该培养基,离心澄清并浓缩,而人VEGF-C在+4°下结合到30μl的Flt4EC-Sepharose悬浮液并过夜,随后在PBS中洗三次,在20mM Tris-HCl(pH7.5)洗涤二次,烷化,SDS-PAGE并放射自显影。烷化是通过用10mM 1,4-二硫苏糖醇(Boehringer-Mannheim,Mannheim,Germany)在25℃下处理1小时,并随后用30mM碘乙酰胺(Fluka,Buchs,Switzerland)处理而进行。
这些实验证实推定的32KD表观分子量的前体多肽结合于来自用人VEGF-C表达载体(图13A)转染的代射标记细胞的条件培养基的Flt4 EC亲和基质上,而不结合于那些来自模拟(M)转染的细胞。一个23KD受体结合多肽的增加量在随后的三小时追踪期在VEGF-C转染细胞的培养基中累积,但此后则没有(泳道2-4,未出示数据),提示该23KD型是通过蛋白酶切加工而产生的,而这种加工至少在瞬时转染细胞中是不完全的。图13A的箭头指示该32KD和23KD的分泌型VEGF-C多肽。随后的实验表明该32KDVEGF-C型含有如29和32KD多肽的在无烷基化下迁移的两个成分(图21-23)。
在一个相关的实验中,将在4小时的连续代谢标记后的Flt4 EC-Sepharose分离的人VEGF-C通过在非还原态下的PAGE检测(图13B)。在非还原态下测定出较大的分子量,提示该VEGF-C多肽能形成二硫键合二聚体和/或者多聚体(图13B箭头)。
实施例14VEGF-C刺激VEGFR-2自身磷酸化用人VEGF-C载体转染的源于293EBNA细胞的条件培养基(CM)也用于刺激表达VEGFR-2(Kdr)猪动脉内皮(PAE)细胞。Pajusola等人,生物化学杂志,26926988-26995(1994)。将该细胞裂解并用VEGFR-2特异性抗血清免疫沉淀(Waltenberger等人,1994)。
将PAE-KDR细胞(Waltenberger等人,1994)在Ham′s F12培养基-10%胎牛血清(FCS)中生长。将铺满的NIH 3T3-Flt4细胞或者PAE-KDR细胞分别在补充有0.2%BSA的DMEM或Hams F12培养基中饥饿培养过夜,然后,用检测培养基培养5分钟。作为刺激剂的重组人VEGF(P&D系统)和PDGF-BB用作对照。用含100mM正矾酸钠的冰冷Tris缓冲盐(TBS)洗涤该细胞两次并在含1mM苯甲基磺酰氟,0.1U/ml抑蛋白酶肽和1mM正矾酸钠的RIPA缓冲液中裂解。将该裂解物声处理,16,000×g离心20分钟澄清并用3-5μl Flt4(Pajusola等,1993),VEGFR-2或PDGFR-β(Claesson-Welsh等人,生物化学杂志,264 1742-1747(1989);Waltenberger等人,1994)的特异性抗血清在冰上培养3-6小时。将该免疫沉淀物结合于蛋白A-Sepharose,用含1mM PMSF,1mM正矾酸钠的RIPA缓冲液洗涤三次,用10mM Tris-HCl(pH 7.4)洗涤两次,并用7%凝胶进行SDS-PAGE。通过Western印迹将多肽转到硝酸纤维素膜上并用PY20磷酸酪氨酸-特异性单克隆抗体(Tranduction Laboratories)或受体-特异性抗血清和ECL检测法(Amersham公司)检测。
该实验结果如图14A和14B所示。如图14A所示,表达VEGFR-2的PAE细胞用10-或2倍浓缩的源于模拟-转染的293-EBNA细胞(泳道1和2)的培养基,或用2,5-或10倍浓缩的源于表达重组VEGF-C泳道3-6)的293-EBNA细胞刺激。用特异性抗体免疫沉淀该VEGFR-2并通过SDS-PAGE和Western印迹(使用磷酸酪氨酸抗体)检测。为对比起见,用非还原态的含50ng/ml纯化的重组VEGF(泳道7和8)培养基进行刺激。泳道6和7示用VEGF-C或含VEGF的用Flt4EC预处理的培养基的刺激。如图14B所示,用非还原培养基(泳道1),5倍浓缩的源自模拟转染(泳道2)或VEGF-C转染(泳道3和4)的细胞的CM,或用含50ng/ml重组人PDGF-BB(泳道5)的非条件态培养基刺激表达PDGFR-β的NIH 3T3细胞。也用重组Flt4 EC(泳道4)预处理含VEGF-C的培养基。用特异性抗体免疫沉淀PDGFR-β并通过SDS-PAGE和抗体的Western印迹用磷酸酪氨酸以及随后剥离并用PDGFR-β特异性抗体重探测检测。
再参考到图14A,在由源于模拟转染的细胞的CM刺激的细胞中检测出基础水平的VEGFR-2的酪氨酸磷酸化。进一步浓缩该培养基只引起VEGFR-2磷酸化(泳道1和2)的轻微增加。含重组VEGF-C的CM刺激VEGF-2的酪氨酸磷酸化而自身磷酸化多肽带的强度也随着VEGF-CCM浓缩而增加(泳道3-5)。此外,在用Flt4 EC亲和基质(比较泳道1,5和6)预处理该培养基后,其失去了刺激效果。在本试验中的VEGF-C最大效应可相当于以50ng/ml的浓度加入到非条件培养基的重组VEGF效应(泳道8)。用Flt4 EC预处理含VEGF的培养基并没有除去其刺激VEGFR-2的效应(比较泳道7和8)。这些结果提示该VEGF-C表达载体不但编码Flt4(VEGFR-3)配体也编码VEGFR-2(Kdr)配体。
为进一步证实VEGF-C对VEGFR-3和VEGFR-2的酪氨酸磷酸化的刺激效应是受体-特异性的,我们检则了VEGF-C对大量表达于成纤维细胞的PDGF受体β(PDGFR-β)的酪氨酸磷酸化的效应。由图14B可见,检测出基于用源于模拟转染细胞的CM对表达Flt4的NIH 3T3细胞的刺激的PDGFR-β的弱的酪氨酸磷酸化(比较泳道1和2)。当用源自经过或不经过Flt4 EC预处理的VEGF-C转染的细胞的CM培养该细胞时,可观测到类似低水平的PDGFR-β磷酸化(泳道3和4)。相反,50ng/ml PDGF-BB的加入诱发了PDGFR-β显著的酪氨酸磷酸化(泳道5)。
实施例15VEGF-C刺激内皮细胞在胶原凝胶中迁移将源自用表达VEGF-C的载体转染的细胞培养物的条件培养基(CM)置于在胶原凝胶中所制的孔中并用于如下文所述刺激中毛细管内皮(BCE)细胞在三维胶原细胞中的迁移。
BCE细胞(Folkman等人,美国国家科学院院刊,765217-5221(1979))如Pertovaara等人,生物化学杂志,2696271-74(1994)中所述培养。该胶原凝胶是通过将I型胶原贮备液(5mg/ml于1mMHCl中)和同样体积2×MEM和2倍体积含10%新生牛血清的MEM混合以达到胶原终浓度1.25mg/ml而制备。用约1mm厚层使在37℃下聚合的该溶液覆履盖该组织培养平板。在此层的上部接种BCE细胞。关于迁移检测,可以让该细胞附着于置于该第一个胶原层的上部的塑料环(直径1cm)的内壁。30分钟后,除去环并漂洗去未附着的细胞。加入第二层胶原和一层通过0.75%低熔点琼脂(FMC生物产品,Rockland,ME)固化的生长培养基(5%新生牛血清(NCS))。在该细胞斑点的两侧以4mm的距离穿过所有层打一个孔(直径3mm),每天移入样品或对照培养基到该孔中。六天后,用装有相差光镜片的Olympus CK 2倒置显微镜拍下移出斑点边缘的细胞的显微照片。用荧光染料二苯并酰亚胺(1mg/ml,Hoechst 33258,Sigma)染色核酸后,计数该迁移细胞。
图15示在加入培养基六天后,在从附着的最初区域到含由非转染(对照)或转染的(模拟;VEGF-C;VEGF)细胞调节的培养基的孔的不同距离迁移的细胞的数量对比。用显微镜光学透镜栅和10×放大的荧光显微镜在5个相邻的0.5mm×0.5mm正方形中计数从最初附着环中迁出的细胞数目。通过以0.5mm的每步移动该栅以类似方式计数迁移超过0.5mm的细胞。两次进行该实验得到类似的结果,而一个实验的中值用标准差直方图表示。从该直方图可见,含VEGF-C的CM对细胞迁移刺激作用超过由非转染或模拟转染细胞调节的培养基但不如源于用VEGF表达载体转染的细胞的培养基。与源于VEGF转染的细胞的CM刺激相比,每天加入1ng FGF2到该孔中引起了约两部数量的细胞的迁移。
实施例16在多个组织中表达VEGF-C含有2μg分离于多个人类组织的poly(A)+RNA的Northern印迹(克隆技术实验室公司的印迹,Palo Alto,CA)用放射性标记的2.1kb VEGF-CcDNA插入片段探测。Northern印迹和杂交分析表明该2.4kb RNA和少量2.0kb mRNA在多个人类组织中,尤其显著地在心脏,胎盘,肌肉,卵巢和小肠(图16A)中表达。VEGF-C RNA极少见于脑,肝脏或胸腺中,并且在外周血白细胞(PBL)中是阴性的。类似地分析人胎儿组织(图16B)RNA表明VEGF-C在肾和肺中高度表达而在肝脏则是较低水平的,并且检测出在脑中基本上没有表达。有趣地是,VEGF表达在这些组织中和VEGF-C表达相关,而VEGF-B在所有检测的组织中高度表达。
实施例17VEGF-C基因定位于染色体4q34保留了一个或两个人染色体的24个种间体细胞杂交体的DNA系列用于该VEGF-C基因(Bios Laboratories,Inc.,New Haven,CT)的染色体定位。设计引物以扩增源于体细胞杂交体DNA的大约250bp VEGF-C基因片段。对于VEGF-C,PCR引物和条件5′-TGAGTGATTTGTAGCTGCTGTG-3′(正向)[序列34]和5′-TATTGCAGCAACCCCCACATCT-3′(反向)[序列35](94℃,60s/62℃,45s/72℃,60s)。PCR产物通过1%琼脂糖凝胶电泳以及溴化乙锭染色并在紫外灯下观察。[α-32P]-dCTP标记的代表完整的VEGF-C编码区的质粒的cDNA插入片段用作如说明书所示的Sonthern印迹和体细胞杂交体DNAs的杂交分析中的探针(Bios Laboratories)。
用于荧光原位杂交(FISH)的细胞系获自ATCC(Rockville,MD)通过EcoRI消化DNA的Southern印迹随后用VEGF-C cDNA杂交证实纯化P1克隆株7660和7661(VEGF-C)(Genome Systems,Inc.,St.Louis,MO)是阳性的。然后,根据常规方法用生物素-11-dUTP,生物素-14-ATP(Sigma ChemicalCo.,St.Louis,MO)或地高率配基11-dUTP(Boehringer Mannheim GmbH,Mannheim,Germany)通过缺口翻译标记该P1克隆。用5-溴脱氧尿苷(BrdU)在早期复制阶段处理PHA-刺激的外周血淋巴细胞培养物以诱导G带。见于Takahashi等人,“人类遗传学”(Human Genet),8614-16(1995);Lemieux等人,Cytogenet.Cell genet.,59311-12(1992)。在溶于2×SSC的50%甲酰胺,10%葡聚糖硫酸酯中用周知的方法进行该FISH步骤。见如Rytknnen等人,Cytogenet Cell Genet.,6861-63(1995);Lichter等人,美国国家科学院院刊,859664-68(1988)。用与标记的探针相比起过50倍的Cet-1DNA(BRL,Gaithersburg,MD)抑制该重复序列。通过在标记的抗地高率配基抗体中培育该杂交的载玻片,随后用0.1mmol/L 4,6-二氨基-2-苯基吲哚复染检测特异和杂交信号。双色实验的探针检测是通过在异硫氰酸荧光素(FITC)-抗-地高率配基抗体(Sigma Chemical Co.)和德克萨斯红-亲和素(Vector Laboratories,BurlingaMe,CA)或者罗丹明-抗-地高率配基和FITC-亲和素中培育该载玻片而进行。
多色数字成像分析用于获取,显示和定量中期染色体的杂交信号。该系统包括连接于PowerMac 7100/AV工作站的PXL摄相机(Photometrics Inc.,Tucson,AZ)。IPLab软件控制该摄相机操作,影像获取和Ludl滤轮。计数了至少50个核。忽略了重叠核和细胞群。在每个实验中包括一个含有正常淋巴细胞中期扩散和分裂间期核的载玻片以作为该杂交的有效性和特异性的对照。
为了测定人VEGF-C基因在染色体上的定位,用Southern印迹和VEGF-C cDNA探针杂交测定含有一定套数的人染色体的人和啮齿类的体细胞杂交体的DNAs。在该杂交体系列上的代表不同的人类染色体的24个DNA样中,只在含人类染色体4的杂交体中观测到了人特异性信号。用以VEGF-C特异性引物的体细胞杂交体DNAs的PCR证实了该结果,其中扩增带仅来自含人类染色体4的DNAs。
VEGF-C的基因组P1质粒通过特异性引物和PCR分离并通过Southern印迹和用VEGF-C特异性cDNA探针的杂交证实。用中期FISH进一步研究VEGF-C的染色体定位。在FISH中用VEGF-C的P1探针,可以在44个中期细胞的40中检测出对4q34染色体带的特异性杂交。用天冬氨酰氨基葡糖酶(AGA)基因的特异性粘粒核探针的双荧光染料杂交表明VEGF-C刚好定位于以前标于4q34-35染色体带的AGA基因的邻位。
将生物素标记的VEGF-C P1和地高辛配基标记的AGA粘粒探针同时和中期染色体杂交。该实验证实该AGA基因比VEGF-C基因更端粒地定位。前述实施例证实本发明的多肽的作为染色体标记物的应用以及在正常或疾病细胞中有或无VEGF-C基因区的应用。该VEGF-C于4q34上的位点也是能致血管畸形或心血管病的突变的候选靶。
实施例18葡萄糖浓度和低氧对C6恶性胶质瘤细胞中VEGF,VEGF-B和VEGF-C mRNA水平的影响。
在含2.5ml DMEM和5%FCS加抗生素的直径10cm的组织培养板中培养铺满的C6细胞(ATCC CCL 107)培养物。将该培养物暴露于含5%CO2的正常细胞培养箱的正常氧含量中或者通过用密封的玻璃管中封闭培养基并在其中燃烧一块木头直至其由于缺氧而熄灭的低氧含量中16小时。分离聚腺苷酸化RNA(如其它实施例),并将8μg RNA电泳并用VEGF,VEGF-B和VEGF-C探针混和物(见图12)印迹杂交。结果表明低氧是在低和高葡萄糖中都能强烈地诱发VEGF-mRNA表达,但对VEGF-B mRNA水平无明显影响。分离于低氧细胞的VEGF-C mRNA在凝胶电泳中泳动稍快并且一个稍快迁移的额外常见于上端mRNA带下。此结果显示低氧影响VEGF-C RNA加工。有人对该观察结果的解释是VEGF-C mRNA剪接被改变从而影响VEGF-C开放阅读框并导致低氧细胞产生可变的VEGF-C蛋白。这些VEGF-C的可变型和编码VEGF-C多核苷酸也作为本发明的一个方面。此结果表明了本发明的多核苷酸和多肽的筛选和诊断应用,如作为从一生物样品中筛选VEGF-C和/或者VEGF-C mRNA的低氧-诱发型方法。结果还提示VEGF-C的低氧诱发型或正常型的抗体和/或其它抑制剂的治疗指标。
实施例19源自用VEGF-C表达载体转染的293 EBNA细胞的VEGF-C多肽的脉冲-追踪标记和免疫沉淀合成下列称为PAM 126的VEGF-C分枝氨基末端肽用以制备抗VEGF-C抗血清NH2-E-E-T-I-K-F-A-A-A-H-Y-N-T-E-I-L-K-COOH(序列39)。
特别地,合成PAM 126作为具有连接到两个有效赖氨酸(K)残基的四个肽酸(PA)链的分枝多赖氨酸结构K3PA4。用Fmoc-化学和TentaGel S MAPRAM 10树脂混合物(RAPP Polymere GmbH,Tubingen,Germany)在433A肽合成仪(Applied Biosystems)上进行该合成,得到可切割和树脂-结合肽。通过反相HPLC纯化该可切割肽并和树脂-结合肽一起用于免疫。该合成产物的正确性用质谱(Lasermatt)证实。
将该PAM 126肽溶于磷酸盐缓冲液(PBS),并和Freund′s肽剂混合用于通过本领域的常规方法以双周间隔免疫兔(Harlow和Lane,抗体,实验手册,冷泉港实验室出版社(1988)。四次加强免疫后所得的抗血清在下述脉冲追踪实验中用于免疫沉淀VEGF-C。
对于脉冲追踪检测,用VEGF-C表达载体(即FLT4-L cDNA插入到上述的pREP 7表达载体中)所转染的293EBNA细胞在无Met,无Cys,无血清DMEM培养基中于37℃下培养30分钟。然后,改变该培养基,并加入200μCi的Pro-mixTM(Amersham)。将该细胞层在此标记培养基中培养两小时,用PBS洗涤,并在无血清DMEM(追踪)中培养0,15,30,60,90,120,或180分钟。在各个追踪时间后,收集培养基,再在PBS中洗涤该细胞两次,并在免疫沉淀缓冲液中裂解。用引起抗23KD VEGF-C型的NH2-端肽(PAM 126)的VEGF-C特异性抗血清在培养基和细胞裂解物中检测VEGF-C多肽。通过SDS-PAGE接着放射自显影检测免疫沉淀的多肽。
参照图19,所得的放射自显影表明在刚好2小时标记(追踪时间0)后,该VEGF-C载体转化的细胞含一个放射活性的55KD多肽带,而其不见于模拟转染细胞(M)中。随着追踪时间的增加,该55KD多肽带的强度渐渐减弱,并且在180分钟追踪的细胞中没有检出。在VEGF-C转染的细胞中也观察到了一个32KD多肽带(而不见于模拟转染细胞)。该32KD带以和55KD带相似的动力学消失。同时,增加量的32KD(箭头)和随后的23KD(箭头)及14KD多肽出现于该培养基中。
总之,脉冲追踪实验的结果表明该55KD胞内多肽代表非细胞分泌的前-VEGF-C多肽,其首先被蛋白酶切成32KD型。该32KD型被分泌并同时进一步蛋白酶加工成23KD和14KD型。并不是意欲局限于某一特定的理论,据认为该VEGF-C前体的加工是以除去信号序列,除去该COOH-末端区(BR3P),以及除去氨基末端多肽的形式出现,从而产生具有TEE以氨基末端的VEGF-C多肽。
在高分辨的情况下,该23KD多肽带以小间距的多肽双联体形式存在,提示切割或糖基化中的异质性。
实施例20编码VEGF-C的鼠和鹌鹑cDNA克隆的分离为了克隆VEGF-C鼠变体,用放射性标记的含序列32的495-1661位核苷酸的人VEGF-C cDNA片段筛选可购买到的12天鼠胚胎cDNA文库(λEXlox文库,Novagen,分类号69632-1)的约1×106λ噬菌体λ克隆株。分离出一个阳性克隆株。
将分离的鼠cDNA克隆的插入片段的一个1323bp EcoRI/HindIII片段亚克隆到pBluescript SK+载体(Stratagene)的相应位点并测序。该克隆的cDNA序列除了在鼠克隆中没有人克隆中存在的约710bp的5′端序列外,其它与人VEGF-C序列同源。
为进一步筛选鼠cDNA文库,将源于鼠cDNA克隆的编码区的881bp的Hind III-BstXI(源自pBluescript SK+多接头的Hind III位点)片段放射标记并用作探针筛选另外两个鼠cDNA文库。鉴定源于成年鼠心脏ZAP II cDNA文库(Stratagene,分类号936306)的另外两个cDNA克隆。还从鼠心脏5′-延伸-+cDNA文库在λgt11(Clontech实验室公司,编码936306)中分离三个另外的克隆株。在后来的三个克隆中,发现有一个含有约1.9kb的插入片段。将该cDNA克隆的插入片段亚克隆到pBluescript SK+载体的CcoRI位点而该克隆的两条链均被完全测序,得到的核苷酸和推动的氨基酸序列示于序列40和41中。
可考虑将对应于序列41的多肽以类似于人VEGF-C前体肽的加工方式装配到成年鼠VEGF-C蛋白中。用上述鉴定人VEGF-C多肽的切割位点的方法鉴定该鼠蛋白的推断割位点。
前述结果证明本发明的多核苷酸用于鉴定和分离编码其它非人哺乳动物VEGF-C变体的用途。鉴定的和分离的多核苷酸本身又可被表达(用类似于前面实施例所述的方法)以生产对应于非人哺乳动物VEGF-C变体的重组多肽。
鼠和人VEGF-C序列用于设计从鹌鹑cDNA文库中分离鹌鹑VEGF-C cDNA的探针。将PCR扩增所得的含序列32的495-1670位核苷酸的人VEGF-C cDNA片段按说明书方法克隆到pCRII载体(Invitrogen),并扩增。用EcoRI消化和制备型凝胶电泳分离该插入片段并再用放射性dCTP和随机引发标记。然后,用此探针筛选pcDNA-1载体中的源于E-4阶段鹌鹑胚胎的cDNA文库。将约200,000个克隆铺板并用放射性探针杂交影印滤膜。将九个阳性克隆鉴定并第二次铺板。九个克隆中有两个在第二次筛选中杂交。该纯化的克隆(克隆1和14)具有约2.7kb EcoRI插入片段。将两个克隆都扩增并随后用T7和SP6引物(对该载体退火)测序。此外,鉴定出一个内部的SphI限制性内切位点距该载体的T7引物侧约1.9kb,将其用于亚克隆5′-和3′-Sph I片段,随后从该亚克隆的Sph I端测序。得到的序列在两个克隆中是相同的并且表现出和人VEGF-C编码区具高度的相似性。随后,在两个方面制备步移引物并完成双链序列为含有开放阅读框长全的1743bp。
所得的cDNA序列含有一个长开放阅读框和5′非翻译区。该DNA和推定鹌鹑cDNA的氨基酸序列分别如序列52和53所示。如图8所示,人,鼠,和鸟类(鹌鹑)VEGF-C前体氨基酸序列表现出明显的保守度。这种高度的同源性允许用本发明的多核苷酸作为探针和本文所述的常规分子生物学技术从其它物种,特别是脊椎动物种,以及更特别的哺乳动物和鸟类物种中分离编码VEGF-C的序列。
实施例21重组VEGF-C的N-末端肽序列分析用VEGF-C cDNA(见于实施例13)转染的细胞(293 EBNA)分泌几种类型的重组VEGF-C(图21A,泳道IP)。在无烷基化时,三种主要的VEGF-C蛋白酶加工型在SDS-PAGE中作为表现分子量为32/29KD(二联体),21KD和15KD的蛋白而迁移。两种次要的多肽分别表现约63和52DK的分子量。这些多肽的一个被假定为糖基化的和非加工型;而其它多肽被假定为糖基化的和部分加工的。
为测定该VEGF-C前体的蛋白酶切位点,用一个免疫亲和柱从用VEGF-C cDNA转染的293EBNA细胞的条件培养基中纯化VEGF-C多肽。为制备该免疫亲和柱,用对应于序列33的104-120位氨基酸H2N-EETIKFAAAHYNTEILK(见实施例19中的PAM 126)合成肽免疫兔。用蛋白A Sepharose (Pharnacia)从该免疫兔的血清中分离IgG片段。用常规技术将该分离的IgG片段以5mg IgG/ml Sepharose的浓度结合到CNBr-活化的Sepharose CL-4B(Pharmacia)。该免疫亲和基质用于从1.2升条件培养基(CM)中分离加工的VEGF-C。
用凝胶电泳和Western印迹分析该由柱洗脱的纯化物。混合物VEGF-C多肽的组分,对10mM Tris HCl透析,真空干燥,电转移到Immobilon-p(聚偏氟乙烯或PVDF)转移膜(Millipore,Marlborough,MA)并进行N-末端氨基酸序列分析。
32KD的多肽带产生两个不同的序列NH2-FESGLDLSDA…和NH2-AVVMTQTPAS…(序列51),前者对应切除该信号肽后的VEGF-CN末端部分,起始于32位氨基酸(序列33),而后者对应于IgG的Kappa链,其由于亲和基质在洗脱过程中的渗漏而存在于纯化的材料中。
为了获得29KD VEGF-C的N末端肽序列,产生了编码VEGF-C变体的构建体(VEGF-C NHis)。尤其是,该构建体编码一个将6×His标记物融合到该分泌的前体(即序列33的31和33氨基酸之间)的VEGF-C变体。除去32位点的Phe以防止可能的该标记序列在分泌VEGF-C过程中切除。将VEGF-C NHis构建体克隆到作为载体的pREP7;该构建体更详细地描述于下文的实施例28中。
用磷酸钙共沉淀技术将VEGF-C NHis转染到293 EBNA细胞。在15cm细胞培养皿中,(共25个平板)用DMEM/10%FCS中培养细胞。次日,将该细胞重新接种到含同样培养基的新培养皿(75个平板)并培养48小时。然后,用PBS洗涤一次并加入无FCS的DMEM培养基。细胞在此培养基中培养48小时并收集该培养基,以5000×g离心澄清,用Ultrasette Tangential FlowDevice(Filtron,Northborough,MA)浓缩500倍,如上述实施例5所述。用TALONTM金属亲和树脂(Clontech Laboratories,Inc.)和制造商的用含吲哚的缓冲液纯化天然蛋白的说明书所述方法,从浓缩的条件培养基中纯化VEGF-CNHis。用含20mM Tris-HCl(pH 8.0),100mM NaCl,和200mM吲哚的溶液洗脱该蛋白。通过用抗血清882(源于用PAM-126多肽免疫的兔882的抗血清)的免疫印迹检测含纯化的VEGF-CNHis的洗脱组分。混和含VEGF-C NHis的组分,透析并真空干燥。如图27所示,由于这种类型的VEGF-C的N末端的6×His标记物的存在,该VEGF-C NHis的主要二联体的上层组分比32KD型野生型VEGF-C迁移得稍慢,因此用SDS-PAGE中改进了该VEGF-C NHis 32KD变体从29KD带的分离。将约15μg的纯化VEGF-C进行还原态下的SDS-PAGE,电转移到Immobilon-P(PVDF)转移膜(Millipore,Inc.,Marlborough,MA)并将29KD的带进行N末端氨基酸序列分析。该序列分析表明N末端序列H2N-SLPAT…,对应于VEGF-C(序列33)的228-232位氨基酸。
该21KD的多肽带发生了序列H2N-AHYNTEILKS…,对应于起始于序列33的112个氨基酸的氨基末端。因此,导致21KD型的通过转染的293EBNA细胞产生的VEGF-C蛋白酶加工位点明显地产生于导致23KD型的由PC-3细胞分泌的VEGF-C的切割位点的下游的九个氨基酸。
该15KD型的N末端和32KD型的相同(NH2-FESGLDLSDA…)。当由COS细胞产生重组VEGF-C时没有检测出15KD型。这提示此型的产生是细胞谱系特异性的。
实施例22VEGF-C的二聚和单体型VEGF-C聚合体组合物如下分析。用如实施例11的pREP7 VEGF-C载体转染的细胞(293 EBNA细胞)用Pro-mix L-[35S]代谢标记混合物(Amersham公司)代谢标记到100uci/ml的终浓度。
平行地,也制备并分析了称为“R102S”的VEGF-C突变体。为制备编码VEGF-C-R102S的DNA,序列33中102位点的Arg密码子为Ser密码子所取代。将这个在pREP7载体中的VEGF-C-R102S-编码DNA转染到293 EBNA细胞中并如上述表达。用抗血清882(通过用对应于序列33的104-120位残基的多肽免疫兔而获得(见以前的实施))和抗血清905(通过用对应于前体VEGF-C前导部分的多肽H2N-ESGLDLSDAEPDAGEATAYASK(序列33的33-54位残基)免疫兔而得到)免疫沉淀VEGF-C多肽。
将每个细胞培养物的免疫沉淀物进行非变性态的SDS-DAGE(图21B)。从该凝胶上切出1-6带,在含200mM β-巯基乙醇的1×凝胶-负载的缓冲液中浸30分钟,并分别进行变性态下的SDS-PAGE(21A和12C,泳道1-6)。
如图21A-C所示,每个高分子量型的VEGF-C(图21B,带1-4)由至少通过二硫键结合的两个单体)比较图21A和21C,泳道1-4,在还原凝胶中)。该1-3带的主要成分是32/29KD的二聚体,其中的两个蛋白22等摩尔比存在。该主要的21KD型组分以单体或通过除二硫键连接的同源二聚体形式分泌(图21A和21C的泳道6)。
该R102S突变在序列33的第100位点处的Asp残基产生一个用于N-连接糖基化的附加位点。在此附加的糖基化位点的糖基化增加了含该位点的多肽的表观分子量,如图21A-C和图22A-B所证实。和初级结构类似于VEGF-C的多肽相比,该附加的糖基化降低了含该附加的糖基化位点VEGF-C-R102S型的迁移率。图21A-C和图22A-B表示了对应于32KD和15KD型wt VEGF-C的VEGF-C-R102S多肽增加了表观分子量,表明这些多肽的每一个都含有新引入的糖基化位点。尤其是,对应于源自VEGF-C的15KD多肽的VEGF-C-R102S和21KD型野生型(wt)VEGF-C在凝胶上共迁移,反应在凝胶上是其迁移到对应于更大表观分子量的位置(比较图21A和21C中的泳道4)。
在相关的实验中,制备和分析了另一个称为“R226,227S”的VEGF-C突变体。为制备编码VEGF-C-R226,227S的DNA,通过定点诱变用Ser密码子替代序列33的226和227位置的Arg密码子。将所得的DNA如上所述转化入293 EBNA细胞并在如对VEGF-C和VEGF-C-R102S所述的同样条件下表达和分析。在源自表达VEGF-C-R226,227S的细胞的条件培养基中,没有检测出32KD型的VEGF-C。这些结果提示wt VEGF-C的C末端切割位点相邻于序列33的残基226和227,并通过Arg到Ser的突变而破坏。该二联体的29KD组分的迁移率也没改变(图22A-B)。
总之,这些数据提示该主要的加工的VEGF-C型是一个由含通过二硫键连接到开始于序列33的228位氨基酸的29KD的多肽的前-VEGF-C(序列33的32-227氨基酸)的32KD多肽所组成的异源二聚体。这些数据也可以通过比较抗血清882和抗血清905标记的VEGF-C型的免疫沉淀模式而支持。
当用条件培养基进行VEGF-C免疫沉淀时,两种血清(882和905)都能识别主要的VEGF-C加工型(32/29KD,21KD和15KD)中的部分或全部三种。当该条件培养基通过在10mM二硫苏糖醇存在下于室温下培育两小时而还原并随后通过用25mM碘乙酰胺于室温下另外培养20分钟而烷化时,两种抗体都不沉淀29KD组分,虽然抗体882还能识别32KD,21KD和15KD多肽。这些结果和该寡核苷酸抗原的用于诱发含于抗血清882中的一个含有序列33的104-120位氨基酚残基的寡核苷酸的抗体的性质相一致。另一方面,抗体905只识别32KD和15KD多肽,其包括用于免疫以获得抗血清905的寡核苷酸序列(序列33的35-54位氨基酸)。考虑到32KD和15KD型的迁移率,用R102S宽变体的免疫沉淀结果是类似的(图23A-B)。抗体905的特异性可以通过其不能识别VEGF-CΔN变体型(其中的跨未加工多肽的32-102位残基的N末端多肽已被删除)而证实。
这些实验的结果也证明该21KD多肽也发现于(1)和其它分子型的异源二聚体中(见图21A-C和图22A-B),并且(2)以单体或者通过非二硫键合的同源二聚体形式分泌(图21A和21B,泳道6)。
本实施例中公开的实验证明了几种类型VEGF-C的存在。能观察到VEGF-C单体的变体并且这些单体可基于糖基化水平和模式而变化。此外,检测出VEGF-C为多聚体,如同源二聚或异源二聚体。VEGF-C的加工扼要描述于图18(未示二硫键)。所有的VEGF-C型均在本发明的范围内。
实施例23鼠胚胎的原位杂交为了分析VEGF-CmRNA在各种细胞和组织中的分布,制备P.C.12.5和14.5的鼠胚胎切片并通过用标记的VEGF-C探针的原位杂交检测。组织切片的原位杂交如Vstrik等人,细胞生物学杂志,1281197-1208(1995)所述进行。鼠VEGF-C反义RNA探针产生于含有对应于鼠VEGF-CcDNA(序列40)的499-979位核苷酸的cDNA片段的线性化pBluescript II SK+质粒(Seratagene Inc.,La Jolla,CA)。用T7聚合酶和[35S]-UTP(Amersham)合成放射性标记的RNA。鼠VEGF-B反义和有义RNA探针以类似方式从含有如Olofsson等人,美国国家科学院院刊,932576-2581(1996)中所述鼠VEGF-B cDNA插入片段的线性化pCR III质粒中合成。在含有30mMDTT和4×SSC的溶液中于65℃下高度严格洗涤45分钟。暴光该载玻片28天,显影并用苏木精染色。为对比,用VEGFR-3探针杂交类似切片并且也检测了P.C.12.5天胚胎的VEGF-B mRNA。
图34A-D示用反义(图34A)和有义(图34C-D)VEGF-C探针探测的P.C.12.5天胚胎切片的暗视野(图34A-C)和亮视野(图34D)显微照片。图34A示一旁矢状面切片,其中的VEGF-C mRNA在包围着发育着的后肾(mn)的血管附近的间质中尤其突出。此外,杂交信号也观察于发育着的脊椎(vc)间,发育着的肺(lu),颈部和额中。与在相邻切片(图34B)中的VEGF-B表达相比,这些信号的特异性是明显的,其中心肌给出极强的信号而在其它的几个组织中也检测出低水平的VEGF-B mRNA。两基因似乎均在vc间,lu中及额中表达。该VEGF-C有义探针的杂交显示在这些结构中(图34C)无特异性表达。
图35A-D示VEGF-C和VEGFR-3在P.C.12.5天鼠胚胎的颈部(其中定位有发育着的脊动脉和心静脉)中表达模式的对比。这就是根据长期存在的Sabin,Am.J.Anat.,943-91(1909)理论的第一个淋巴管从静脉囊样结构发芽的部位。如图35A-D所示,在对VEGFR-3阳性(图35B和35D)发育着的静脉囊(图35A和35C)周围的间质中检测出强烈的VEGF-C信号。
肠系膜提供发育着的带有血的肠并含有发育着的淋巴管。发育着的P.C.14.5天的肠系膜对VEGF-C mRNA是阳性的,其尤其在某些管(图35E-H中箭头)周围的结缔组织中高度表达。图35E的该信号可从血管内红血细胞的光反射的假阳性信号中区分出。图35F中所示的相邻肠系膜的VEGF-3信号起源于肠系膜(箭头)的小毛细管。因此,似乎在VEGF-C的mRNA产生及其受体间有一旁分泌关系。此资料表明VEGF-C在各种组织中表达。此外,该表达模式和VEGF-C在静脉和淋巴管发育中的作用具有一致性。而且,资料显示VEGF-C在非人类动物中表达。
实施例24在胎儿和成人组织中的VEGF,VEGF-B,及VEGF-C mRNA表达的检测。
含有2μg源于脑,肺,肝和肾(Clontech公司)的聚腺苷酸化RNAs的人胎儿组织的Northem印迹用下列探针的混合液杂交人全长VEGF-CcDNA插入片段(基因文库登录号×94216),获自PCR扩增的人VEGF-B167cDNA片段(核苷酸1-382,基因文库登录号U148800);以及含碱基对57-638的人VEGF的581bp cDNA片段(基因文库登记号X15997)。用本领域常规技术在严格条件下洗涤印迹。
用鼠VEGF-C cDNA片段(碱基对499-656)杂交含2μg源于P.C.7,11,15和17天胚胎的聚腺苷酸化的RNAs的鼠胚胎多种组织Northem印迹(Clontech公司)。用人VEGF,VEGF-B167,VEGF-C的探针以及VEGFR-3 cDNA片段(核苷酸1-595;基因文库登记号X68203)杂交鼠成熟组织Northem印迹。
在成年鼠组织中,用VEGF-C探针,以约4∶1的比率,检测出2.4kb和2.0kb的mRNA信号。最明显的信号获自肺和心脏RNA,而肾,肝脏,脑,和骨骼肌中水平较低,并且脾和睾丸中仅有可见水平。如同在人类组织中,在成年鼠中的VEGF mRNA表达在肺和心脏RNA中最充分,而其它样品表现出较少的和VFGF-C表达的律动调节。成年鼠的骨骼肌和心脏组织产生最高的VEGF-B mRNA水平,如前文提到的Olofsson等人,美国国家科学院院刊,932576-2581(1996)所述。与VEGFR-3表达相比,显示出表达VEGF-C的组织也含有其同源受体酪氨酸激酶的mRNA,虽然在成熟肝脏中的VEGFR-3 mRNA是不相称地丰富。
为了更好地检测胚胎发育过程中的VEGF-C mRNA调节,分离于各种妊娠期(P.C.7,11,15,17天的聚腺苷酸化RNA用鼠VEGF-C探针杂交。这些分析显示2.4kb VEGF-C mRNA量在妊娠期内是有相对的稳定性。
实施例25在人或纤维细胞培养基中通过血清、白介素-1和地塞米松调节VEGF族成员的mRNA。
人IMR-90或纤维细胞生长于含10%FCS和抗生素的DMEM培养基。该细胞生长到8%铺满时,在含0.5%FCS的的DMEM中饥饿48小时。然后,将生长培养基改成含或不含10ng/ml白介素-1(IL-1)及含或不含1mM地塞米松的且含5%FCS的DMEM,如图24A-B所示。用这些添加剂培养这些培养板指定的时间,而总细胞RNA用TRIZOL试剂盒(GIBCO-BRL)纯化。将约20μg源自每个样品的总RNA在1.5%甲醛-琼脂糖凝胶中如Sambrook等人,同上(1989)中电泳。将该凝胶用于Northern印迹并用放射性标记的源自人VEGF克隆(含碱基对57-638的581bp cDNA,基因文库登记号15997)的插入片段DNA和人VEGF-B167 cDNA片段(核苷核1-382,基因文库登录号U48800)杂交(图25B)。随后,用放射性标记的源于VEGF-C cDNA质粒(图24A)的插入片段探测。用有关于随机引物的酶延伸反应的常规技术标记引物,如本领域的普通技术所理解的那样。在转移前基于溴化乙锭染色的RNA的UV照相可见18S和28S rRNA的迁移率。
如图24A-B所示,可通过饥饿的IMR-90细胞以及刺激一小时后的细胞表达极低水平的VEGF-C和VEGF。相反,在这些条件下可见丰富的VEGF-B mRNA信号。4小时刺激后,对VEGF-C和VEGF mRNAs有强烈的诱发作用,并且在IL-1处理的样品中有进一步的加强。IL-1的作用在地塞米松存在时似乎被消除。在8小时样品中维持类似的增强模式,但在24小时和48小时样中两种RNA均发生了全部信号的逐渐下调。相反,VEGF-B mRNA水平维持恒定并因此在整个时间段内表示出明显的稳定性。该结果用于指导使用VEGF-C及其片段,其拮抗剂,及抗-VEGF-C抗体治疗多种疾病方法的尝试。
实施例26重组鼠VEGF-C的表达和检测该鼠VEGF-C cDNA表达为重组蛋白且检测了该分泌蛋白的受体结合特性。通过用在逆转录病毒载体中的VEGF-C cDNA转染的Bosc23细胞培养基研究鼠VEGF-C对人VEGFR-3胞外区的结合。
1.8kb鼠VEGF-C cDNA作为EcoRI片段克隆到含有SV 40早期启动子区的反转录病毒表达载pBabe-puro中[Morgenstern等人,核酸研究,183587-3595(1990)],并通过磷酸钙沉淀法转染到Bosc23包装细胞系(Pearet等人,美国国家科学院院刊908392-8396(1994)]。为对比,Bosc 23细胞也用前述的在pREP7表达载体中的人VEGF-C构建体转染。将该转染细胞在代谢标记前培养48小时。将细胞转入无Cys和Met的DMEM培养基,并在预培养和培养基更换45分钟后,在同样培养基中,即将Pro-mixTML-[35S]体外细胞标记的混合物(Amersham公司)加到终浓度约120μCi/mlo培养6小时后,收集培养基并离心澄清。
为进行免疫沉淀,将1ml的分别用空载体或鼠或人重组VEGF-C转染的代谢标记Bosc23细胞的培养基样各等份用2μl抗成人VEGF-CN-末端17个氨基酸寡肽(H2N-EETIKFAAAHYNTEILK)(序列33,104-120残基)的兔多克隆抗血清在冰上培养过夜。然后,用蛋白A Sepharose在4℃下轻搅培养该样品40分钟。分别先后用免疫沉淀缓冲液和20mMTris-HCl,pH 7.4洗涤该Sepharose粒两次和四次。在Laemmli缓冲液中煮沸该样品并通过12.5%十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)分析。
转染和代谢标记细胞的培养基的VEGF-C免疫沉淀显示了约30-32×103Mr(二联体)和22-23×103Mr在12.5%SDS-PAGE中的带。在非转染或如图32模拟转染(即标有“载体”的泳道)细胞样中没有检出这些带。这些结果表明抗人VEGF-C的抗体能识别相应的鼠配体。
对应受体结合实验,用共价偶联到Sepharose的VEGFR-3胞外区(见例3)在4℃下稍稍混合培养1ml源自代谢标记Bosc23细胞的培养基的等份4小时。用冰冷PBS洗涤该Sepharose粒四次,并通过凝胶电泳如Joukov等人,“欧洲分子生物学联合会杂志”(EMBOJ),15290-298(1996)所示分析。
正如从图32可见,与免疫沉淀实验相比,在受体结合实验中获得了类似的30-32×103Mr二联体和22-23×103Mr多肽带。因此,鼠VEGF-C结合于人VEGFR-3。序列分析得到的四个氨基酸残基的差异(残基H88-E91,图31)可能导致了鼠VEGF-C多肽的稍快的迁移率。
还研究了鼠重组VEGF-C诱发VEGFR-3自身磷酸化的能力。至于VEGFR-3受体刺激实验,亚铺满的NIH 3T3-Flt4细胞(Pajusola等,癌基因,93545-3555(1994))在含0.2%BSA而无血清的培养基中饥饿过夜。一般地,该细胞用源于VEGF-C载体转染的细胞的条件培养基刺激5分钟,用含200μm矾酸盐的冰PBS洗涤三遍,并在免疫沉淀分析的RIPA缓冲液中裂解。以16000×g离心该裂解物25分钟并用特异性抗血清培养将该所得上清液在冰上培养2小时,再用蛋白A-Sepharose免疫沉淀并在7%SDS-PAGE中分析。将该多肽转到硝酸纤维素膜上并用抗磷酸酪氨酸(Transduction实验室)和抗受体抗体免疫印迹分析,如Pajusola等,癌基因,93545-3555(1994)所述。在50℃下的100mM 2-巯基乙醇,2%SDS,62.5mM Tris-HCl,pH 6.7中通过偶尔搅拌进行滤膜剥离。实验结果如图33所示。结果证明含鼠VEGF-C的培养基刺激VEGFR-3的自身磷酸化到相当于人杆状病毒VEGF-C或酪氨酰磷酸酶抑制剂过矾酸盐的程度。
VEGFR-2刺激在亚铺满的表达Kdr(VEGF-2)(PAE-VEGFR-2)的猪动脉内皮(PAE)细胞中研究[Walten berger等人,生物化学杂志,26926988-26995(1994)],其是在含0.2%BSA的无血清培养基中饥饿过夜。如上述进行刺激和制备裂解物,为进行受体免疫沉淀中,使用了VEGFR-2的特异性抗血清[Waltenberger等人,生物化学杂志,26926988-26995(1994)]。如上述针对VEGFR-3在7%SDS-PAEG中检测该免疫沉淀物,随后用抗磷酸酪氨酸抗体进行Western印迹,剥离该滤膜,并用抗VEGFR-2抗体(Santa Cruz)重新探测。
鼠VEGF-C似乎是VEGFR-3自身磷酸化的有力诱导物,有195×103Mr前体和该受体(Pajusola等,癌基因,193545-3555(1994))的蛋白酶切的125×103Mr酪氨酸激酶多肽被磷酚化。首先用未浓缩的源于表达重组VEGF-C细胞的培养基进行VEGFR-2刺激,但免疫印迹分析没有显示任何的受体自身磷酸化。
为了进一步测定鼠重组VEGF-C是否也能如人VEGF-C所测的那样诱导VEGFR-2自身磷酸化,用10倍浓缩的源自用鼠VEGF-C表达载体转染的培养物的培养基刺激表达VEGFR-2的PAE细胞并检测其自身磷酸化。为了对比,使用了用十倍浓缩的含人重组VEGF-C(Joukov等,(1996))的培养基,未浓缩源于人VEGF-C杆状病毒感染的昆虫细胞的培养基,或者过矾酸盐(酪氨酰磷酸酶抑制剂)处理的细胞。如图33所示,对应于人杆状病毒VEGF-C以及过矾酸盐的处理,显著地磷酸化了VEGF-2,而人和鼠重组VEGF-C分别引起了弱的和仅可测的自身磷酸化的增强。用空载体或者以反义方向克隆的VEGF-C转染的细胞培养物的培养基并不诱发VEGFR-2的自身磷酸化。因此,鼠VEGF-C结合于VEGFR-3并以比VEGF-2激活所需的较低的浓度激活该受体。然而,本发明包括那些用本发明的材料利用VEGF-C和VEGFR-2,以及VEGF-C和VEGFR-3的相互作用的方法。
实施例27在Pichia酵母中表达的VEGF-C E104-S213片段刺激Flt4(VEGFR-3)和KDR(VEGFR-2)的自身磷酸化构建了一个截短型人VEGF-C cDNA,其中(1)将编码推定的成熟VEGF-C氨基末端H2N-E(104)ETIK(序列33,残基104 et seq.)序列符合读框融合到酵母PH 01信号序列(Invitrogen Pichia表达试剂盒,编号#K1710-01),并(2)将一个终止密码子引入213位氨基酸后(H2N-…RCMS;即序列32的213位密码子后)。然后将所得的截短型cDNA构建体插入到PichiaPastoris表达载体pHIL-S1(Invitrogen)。为克隆,突变了编码VEGF-C序列的内部BglII位点而没有改变该编码多肽的序列。
然后,将该VEGF-C表达载体转染到Pichia细胞并通过用Western印迹在该培养物的培养基中筛选VEGF-C蛋白的表达而鉴定阳性克隆。使一个阳性克隆生长于50ml培养物,并且用甲醇诱导从0到60小时的不同时间。将约10ul培养基通过凝胶电泳分析,随后Western印迹并用抗VEGF-C抗血清检测,如上述。如在图25中可见,一个约24KD多肽(注明该带由于糖基化而扩散)在用重组VEGF-C构建体转染的细胞的培养基中累积,但在模拟转染细胞或仅用载体转染的细胞的培养基中则没有。
含重组VEGF-C蛋白的培养基通过(Centricon 30KD截断的超滤浓缩并用于刺激表达Flt4(VEGFR-3)的NIH 3T3细胞以及表达KDR(VEGFR-2)的猪动脉内皮(PAE)细胞。将所刺激的细胞裂解并用VEGFR-特异性抗血清免疫沉淀,并通过用抗磷酸酪氨酸抗体,化学发光,和荧光自显影的Western印迹检测该免疫沉淀物。作为该VEGFRs的最大自身磷酸化的阳性对照,用钒酸根(VO4)处理该细胞10分钟。如图26所示的结果,源于分泌该重组VEGF-C多肽的Pichia培养物的培养基诱导195KD和125KD Flt4l多肽以及约200KD KDR多肽的自身磷酸化。另一方面,矾酸根诱导该受体带以及其它可能和该受体共沉淀的带的强烈的酪氨酰磷酸化。
这些结果证明由104E-213S(序列33,104-213残基)氨基酸残基组成的VEGF-C的VEGF同源区可在酵母中重组生产并能刺激Flt4(VEGFR-3)和KDR(VEGFR-2)的自身磷酸化。如本文所述的能刺激Flt4或者KDR自身磷酸化的重组VEGF-C片段也作为本发明的方面;使用这些片段的方法也在本发明的范围内。
实施例28VEGF-C的不同加工型的特征下列寡核苷酸用于产生一系列VEGF-C变体5′-TCTCTTCTGTGCTTGAGTTGAG-3′(序列42),用于产生VEGF-C R102S(102位点的Arg突变为Ser(序列33));5′-TCTCTTCTGTCCCTGAGTTGAG-3′(序列43),用于产生VEGF-C R102G(102位点的Arg突变为Gly(序列33));5′-TGTGCTGCAGCAAATTTTATAGTCTCTTCTGTGGCGGCGGCGGCGGCGGGCGCCTCGCGAGGACC-3′(序列44),用于产生VEGF-CΔN(删除对应于32-102氨基酸(序列33)的N末端前肽);5′-CTGGCAGGGAACTGCTAATAATGGAATGAA-3′(序列45),用于产生VEGF-C R226,227S(序列33)位点的Arg密码子突变为Ser;5′-GGCCTCCGCGTCCGAGAGGTCGAGTCCGGACTCGTGATGGTGATGGTGATGGGCGGCGGCGGCGGCGGGCGCCTCGCGAGGACC-3’(序列46),用于产生VEGF-C NHis(该构建体编码带有融合到该分泌的前体(序列33的32位氨基酸)N末端的6×His标记物的多肽)。
进一步将某些前述的VEGF-C变体构建体修饰成另外的构建体。例如,pALTER(Promega)中的VEGF-2 R102G和寡核苷酸5′-GTATTATAATGTCCTCCAAATTTTATAG-3′(序列47)用于产生VEGF-C4G,其编码带有四个点突变的多肽R102G,A110G,A111G,和A112G(在110-112位点Ala突变成Gly)。此四个定点突变位点相邻于在PC-3中表达以及在293 EBNA中重组表达VEGF-C的预定裂解位点。
用VEGF-CΔN和寡核苷酸5′-GTTCGCTGCCTGACACTG TGGTAGTGTTGCTGCTGGCGGCCGCTAGTGATGGTGATGGTGATGAATAATGGAATGAACTTGTCTGTAAACATCCAG-3′(序列48)制备另一个构建体产生VEGF-CΔNHis。该构建体编码带有删除的N末端前肽(32-102位氨基酸);删除的C末端前肽(序列33的226-419位氨基酸);以及C末端附加的6×His标记物的多肽。
用Hind III和Not I进一步消化所有构建体,亚克隆到Hind III/Not I消化的pREP7载体,并用于转染293 EBNA细胞。转染后约48小时,该细胞或者如上述用Pro-mixTM代谢标记,或者在无血清培养基中饥饿2小时。然后,收培养基并用于随后的实验。如图27A-B所见,wt VEGF-C,VEGF-C NHis和VEGF-CΔNΔC His在293 EBNA细胞中表达到类似水平。同时,VEGF-C 4G多肽的表达相当低,可能是由于翻译产物的构象改变和稳定性降低。然而,上述全部VEGF-C变体都分泌于该细胞(比较图27A和27B)。将源于转染和饥饿细胞的条件培养基浓缩五倍并用于测定其刺激表达于NIH 3T3细胞的Flt4(VEGFR-3)和表达于PAE细胞的KDR(VEGFR2)的酪氨酸磷酸化的能力。
图28A-B示wt VEGF-C以及三个突变体多肽刺激VEGFR-3的酪氨酸磷酸化。最显著的刺激是通过短成熟的VEGF-CΔNΔC CHis而完成的。此突变体,以及VEGF-C NHis还刺激VEGFR-2的酪氨酸磷酸化。因此,虽然分泌的重组VEGF-C的主要成份是32/29KD的二聚体,引起VEGF-C结合于VEGFR-3和VEGFR-2的活性部分定位于VEGF-C前体的102-226位氨基酸之间(序列33)。用诸如本文所述的检测方法分析和对比这些VEGF-C蛋白及变体的结合特性及生物活性将提供有关所测的主要的32/29KD和21-23KD VEGF-C加工型的重要性的资料。资料表明编码该VEGF-C前体(序列33)的103-225位氨基酸残基的构建体产生出能同时对VEGFR-3和VEGF-2起作用的重组配体。
本实施例和前述实施例的资料证明许多VEGF-C多肽片段保留了生物活性。已发现通过天然加工切割确定C末端而生产的天然的跨序列33的103-226(或103-227)位氨基酸的VEGF-C多肽有活性。实施例27证实带有序列33的104-213位残基的片段保留了生物活性。
此外,实施例21的结果证明具有序列33的112位点处的氨基末端的VEGF-C多肽保留活性。其它实验显示缺少序列33的1-112位残基的片段保留了生物活性。
在一个相关的实验中,序列33(序列32,991-993位核苷酸)的214位的Lys为终止子所代替。所得的重组多肽还能诱导Flt4自身磷酸化,提示跨序列33的113-213位氨基酸残基的多肽是生物活性的。
VEGF族成员的多肽序列比较显示即使比如序列33所示的多肽更小的片段也还有生物活性。尤其是,该VEGF族多肽的8个高度保守的Cys残基确定了有进化意义的由序列33(见图31)的131至211位残基的区域。因此,预计跨约131位到约211位的多肽保留有VEGF-C生物活性。事实上,推定那些保留保守基序RCXXCC的多肽(即含序列33的大约161-大约211残基的多肽)保留有VEGF-C生物活性。为维持这些片段的天然构象,优选地保留羧基末端的大约1-2个额外的氨基酸和氨基末端的1-2或更多的氨基酸。
出乎上述考虑,证据显示缺少保守的Cys的较小的片段和/或片段变体仍保留着VEGF-C生物活性。相应地,本发明的材料和方法包括全部的至少保留了VEGF-C的一种生物学活性的VEGF-C片段和变体,而不论其有或无该保守的Cys残基系列的成员。
实施例29在转基因小鼠中的于人K14角蛋白启动子控制下的人VEGF-C的表达诱导了淋巴管在其皮肤中的大量生长。
Flt4受体酪氨酸激酶在淋巴管内皮中相对特异性地表达。Kaipainen等人,美国国家科学院院刊,923566-3570(1995)。此外,该VEGF-C生长因子刺激Flt4受体,而对血管的KDR受体的活性较低(Joukov等人,“欧洲分子生物学联合会杂志”(EMBO J.),15290-298(1996);见实施例26)。
在转基因小鼠中进行实验以分析VEGF-C在组织中过量表达的特异效应。人K14角蛋白的启动子在分层的鳞状内皮的基细胞中有活性(Vassoar等,美国国家科学院院刊,861563-1567(1989))并在重组VEGF-C转基因中用作表达控制因子。含K14角蛋白启动子的载体描述于Vassar等,GenesDev.,5714-727(1991)和Nelson等,细胞生物学杂志,97244-251(1983)。
用人全长VEGF-C cDNA(基因文库登记号X94216)构建重组VEGF-C转基因。该序列是用XhoI/NotI从pCI-neo载体(Promega)切下,并分离出所得的含开放阅读框和终止子(序列32的352-1611位核苷酸)的2027 bp片段。然后,将该分离的片段用DNA聚合酶的Klenon片段进行末端补平反应。然后将平端片段连接到K14载体中的类似开放的Bam HI限制性位点。所得的构建体含有衍生于pCI-neo载体的多接头的EcoRI位点。该EcoRI位点用常规技术(用EcoRI部分消化该重组的中间体后的Klenow介导的补平反应)除去以便可随后的待注射入受精鼠卵母细胞的DNA片段的切除。称为K14-VEGF-C的所得克隆图示于图20。
从含K14启动子,VEGF-C cDNA,和K14聚腺苷酸化信号的克隆K14 VEGF-C中分离EcoRI-Hind III片段并注射入FVB-NIH鼠品系受精的卵母细胞中。将所经注射的接合子移植到假孕C57 BL/6×DBAJ2]杂交鼠的输卵管。通过用引物5′-CATGTACGAACCGCCAG-3′(序列49)和5′-AATGACCAGAGAGAGGCGAG-3′(序列50)的尾DNA PCR反应检测所建鼠的转基因的存在。此外,将尾DNAs进行EcoRV消化并随后用注入到该鼠的EcoRI-Hind III片段进行Southern分析。在三周龄的8个幼仔的分析中发现了2个阳性,其基因组中分别带有该转基因的约40-50个拷贝和4-6个拷贝。
带有高拷贝数转基因的鼠是小的,比其同窝仔发育得更慢且进食(如吮乳)有困难。进一步的检查发现鼻部肿胀且红并且毛皮不佳。虽然喂以特殊的液体饲食,其在喂食后出现上呼吸道和消化道水肿并且有呼吸困难。此鼠出生八天后死亡并即行进行组织学,免疫组织化学,和原位杂交的处理。
组织学检查发现与同窝仔相比,该K14-VEGF-C转基因小鼠的背部的皮是萎缩且结缔组织为缺少红细胞的大腔隙所代替,但衬有薄的内皮层(图29A-D中的白箭头)。这些扩张的管样结构类似于在人淋巴管瘤中所见的那些。减少了皮肤附属器官和毛囊。在鼻部,还可见管的数目的增加。因此,VEGF-C在基部表皮中的过量表达能促进下面的皮肤中包括大的腔隙的管结构的大量生长。包围着这些腔隙的内皮细胞在原位杂交中含丰富的Flt4 mRNA(方法见实施例23和30)。管形态学显示VEGF-C刺激具有淋巴管特征的管的生长。其它的K14-VEGF-C转基因鼠具有类似的皮肤组织病理学。
前述体内实验资料表明(i)具有VEGF-C生物活性的VEGF-C多肽和多肽变体,以及(ii)抗VEGF-C抗体和抑制VEGF-C活性(如通过结合VEGF-C或干涉VEGF-C/受体相互作用)的VEGF-C拮抗剂的用途。例如,资料表明VEGF-C多肽对需要淋巴组织生长的病人的治疗应用(如那些乳腺癌手术或其它外科手术后的已除去了淋巴组织并且淋巴引流又因此而受损导致肿胀的病人;或者那些患象皮病的病人)。资料表明抗VEGF-C抗体物质和VEGF-C拮抗剂对那些可能需要抑制淋巴组织生长的疾病的治疗应用(如治疗淋巴管瘤)。相应地,给药VEGF-C和VEGF-C变体和拮抗剂的方法也作为本发明的方法和材料。
实施例30在发育着的鼠中表达VEGF-C和Flt4制备P.C.16天怀孕鼠的胚胎并固定于4%多聚甲醛(PFA),石蜡包埋,并切成6μm厚。将切片置于硅烷化显微镜载玻片上并用二甲苯处理,再水化,在4%PFA中固定20分钟,用蛋白酶K(7mg/ml;Merck,Darmstadt,德国)于室温下处理5分钟,再固定于4%PFA并用乙酐处理,在增加乙醇浓度的溶液中脱水,干燥并用于原位杂交。
如Vstrik等,细胞生物学杂志,1281197-1208(1995)中所述进行切片的原位杂交。从线性化的pBluescript II SK+质粒(Stratagene公司)中产生鼠VEGF-C反义RNA探针,其含有对应于鼠VEGF-C cDNA499-979位核苷酸的片段,其中的非编码区和BR3P重复通过核酸外切酶III处理而切去。该片段已克隆λpBluescript II SK+的EcoRI和Hind III位点。用T7 RNA聚合酶和[35S]-UTP(Amersham,Little Chalfont,UK)合成放射性标记的RNA。每个载玻片应大约二百万cpm的VEGF-C探针。杂交过夜后,该载玻片首先在2×SSC和20-30mM DDT中于50℃下洗涤1小时。继续处理,严格洗涤,4×SSC和20mM DTT和50%去离子化甲酰胺,在65℃下30分钟,随后用RNase A在37℃下处理(20μg/ml)30分钟。重复该高度严格的洗涤45分钟。最后,将该载玻片脱水并在室温下干燥30分钟。将该载玻片浸入照相乳胶中并曝光4周。用Kodak D-16显影剂显色,用苏木精衬染并用Permount(Fisher Chemical)计数。
在Flt4序列的原位杂交中,使用了包括公开序列(Finnerty等,癌基因,82293-2298(1993))的1-192bp的鼠Flt4 cDNA片段,并且除了下述外,根据上述方法。每个载玻片应用了约一百万CPM的Flt4探针。杂交后的严格洗涤在1×SSC和30mM DTT中进行105分钟。
图示了该杂交的切片在暗视野显微镜(图36A-C)和亮视野显微镜(图36D)下的显微照片。照片的放大倍数是4×(图36A-B)和10×(图36C-D)。所示的横切片源自头部且所示的VEGF-C和FLT4区的是在约14个分开的部分,Flt4更多地定位于该胚胎头部。在图36A中(Flt4探针),发育着的鼻咽腔位于上部中线,后部;图36A的前部是带有产生着的纤维囊的鼻部以及,在中线上,形成的鼻腔。在两边,视黄醛染料在暗视野显微镜下产生一个假阳性信号。最显著的Flt4-杂交结构似乎是对应于发育着的淋巴和静脉内皮。注明有丛样内皮血管结构包围着发育着的鼻咽粘膜。在图36B中,最显著的信号获自发育着的鼻甲的后部,其以较高的放大倍数(图36C-D)显示包围疏松的结缔组织/形成软骨的上皮。此结构在原位杂交中给出强烈的VEGF-C信号。图36B中也发现了鼻部周围有更弱的杂交区,虽然此信号看起来均匀的多。因此,VEGF-C的表达在发育着的鼻甲中惊人地高。
该甲被丰富的静脉丛包围,作为表皮细胞产生的粘膜来源以及温暖吸入空气而在鼻生理中是重要的。提示该VEGF-C在粘膜的甲静脉丛的形成中是重要的,而且其也可调节鼻粘膜分泌所需的渗透性。VEGF-C及其衍生物和拮抗剂也可能用于调节甲组织和粘膜的充盈并因此调节上呼吸道的直径,以及粘液生产的数量和质量。这些因素在上呼吸道炎症(包括过敏)和传染性疾病中具有极大的临床意义。相应地,本发明考虑了本发明的材料在包括VEGF-C Flt4,及其衍生物在诊断和治疗影响上呼吸道(包括鼻结构)的炎症和传染性疾病方法中的应用。
实施例31人VEGF-C基因的外显子-内含子结构的鉴定用VEGF-C cDNA片段作为探针从人基因组DNA文库中分离含人VEGF-C基因的1,2,和3外显子的两个基因组DNA克隆。尤其是,用PCR产生的对应于人VEGF-C cDNA(序列32)的629-746位核苷酸片段筛选在入噬菌体EMBL-3λ中的人基因文库(Clontech)。鉴定出一个称为“λ3”的阳性克隆株,而将该插入片段作为14kb XhoI片段亚克隆到pBSK II载体(Stratagene)。也用标记的130bp Not I-Sac I片段从VEGF-C cDNA的5′-非编码区筛选基因文库(Not I位点是在克隆载体的多接头中;Sac I位点对应于序列32的92-97位核苷酸)。得到了称为“λ5”和“λ8”的两个阳性克隆。限制性图谱分析表明λ3克隆含有外显子2和3,而λ5克隆含有外显子1和推定的启动子区。
从基因组VEGF-C P1质核克隆中亚克隆含外显子4,5,6和7的三个基因组片段。尤其是,使用了从基因组P1质粒克隆7660(Paavonen等人,Circulation,931079-1082(1996)中分离的DNA。将P1插入片段DNA的EcoRI片段连接到pBSK II载体。使用全长VEGF-C cDNA作为探针通过菌落杂交鉴定出含人VEGF-C cDNA同源序列的克隆7660的亚克隆。鉴定并分离出含有保留的外显子4-7的三个不同的基因片段。
为测定基因组结构,用限制性内切酶切对该克隆作图。编码区和外显子-内显子连接还进行了部分测序。该分析结果图示于图11和17。所有的内含子-外显子边界序列(图17,序列57-68)与共有序列剪接信号一致(Mount,核酸研究,10459-472(1982))。外显子5和6间的内含子长度通过核苷酸测序而直接测定并发现为301bp。外显子2和3间的内含子长度通过限制性图谱和Southern杂交测定并发现为大约1.6kb。每一个其它的内含子的长度均超过10kb。
一个类似的分析用于鼠基因组VEGF-C基因。鼠VEGF-C内含子-外显子边界序列图示于图17和序列69-80。
限制性图谱和测序资料表明由外显子1编码信号序列和N-末端前肽的第一个残基。第二个外显子编码N末端前肽的羧基末端部分和VEGF同源区的氨基末端。VEGF同源区的最保守序列分布于外显于3(含6个保守的Cys残基)和4(含Cys残基)。其余的外显子编码C-6X-C-10X-CRC(外显子5和7)型的富含Cys的基序以及C-6X-B-3X-C-C-C型的五倍重复基序,其是丝蛋白的特征。
为进一步鉴定VEGF-C基因启动子,进一步分析了λ5克隆。用单和双消化及Southern杂交的组合对此克隆进行限制性酶切作图发现其包括(1)一个位于可推定的起始密码子ATG密码子上游的约5kb的区域,(2)外显子1,以及(3)VEGF-C基因的内含子I部分。
将含有外显子1和5′及3′侧翼序列的克隆λ5的3.7kb Xba I片段亚克隆并进一步分析。如前述,一个主要的VEGF-C mRNA带于大约2.4kb的位置迁移。从1257 bp的编码VEGF-C序列和391 bp3′非编码序列加上大约50-200bp的poly A序列算起,该mRNA起始位点应位于翻译起始密码子上游的大约550-700bp处。
为进一步鉴定人VEGF-C基因的启动子,分离了包括翻译起始位点上游的大约1.4kb的基因克隆,并且测序了5′非编码cDNA序列和推定的启动子区。所得的序列示于序列54。类似于在VEGF基因所观测的那样,该VEGF-C启动子富含G和C残基而缺少共有的TATA和CCAAT序列。而其有许多推定的SP1(一种普遍的核酸蛋白)结合位点可起动无TATA基因的转录。见于Pugh和Tjian,基因与发育,5105-119(1991)。此外,发现VEGF-C翻译起点上游的序列含有AP-2因子结合位点的常见的共有序列。这提示作为AP-2转录因子[Curran和Franza,细胞,55395-397(1988)]的cAMP依赖性蛋白激酶和蛋白激酶C介导VEGF-C转录调节。
该VEGF-C基因在成人组织如心脏,胎盘,卵巢和小肠中过量表达,并被各种因子所诱导。实际上,几个组织特异性基因表达的调节因子,如NFKB和GATA的潜在结合位点的确位于VEGF-C启动子的末梢部分。例如,已知NFKB调节内皮细胞中组织因子的表达。也考虑GATA族的转录因子调节细胞型特异性基因表达。
不像VEGF,VEGF-C基因不含低氧量一可诱导因子HIF-1的结合位点(Levy等人,生物化学杂志,27013333-13340(1995))。该发现提示若通过低氧量调节VEGF-C mRNA,其机理将主要是基于mRNA稳定性的调节。在这方面,许多研究表明低氧量诱导VEGF基因的主要控制点是调节mRNA的稳态水平。见于Levy等,生物化学杂志,2712746-2753(1996)。该VEGF mRNA稳定和衰变的相对比例已被认为是通过在其非翻译区(UTR)的已证明为调节mRNA稳定性的特异序列基序的存在而决定(Chen和Shgn,分子细胞生物学,148471-8482(1994))。该VEGF-C基因的3′-UTR还含有在序列32的1873-1878位点的该型的推定基序(TTATTE)。
实施例32一个VEGF-C剪接变体的鉴定如实施例16所述,主要的2.4kb VEGF-C mRNA和少量的2.0kb mRNA是可检测的。为弄清这些RNAs的起源,分离和鉴定了另外几个VEGF-CcDNA。用153bp人VEGF-C cDNA片段作为探针如实施例10所示筛选在λgt11载体(Clontech,产品编号#HL1048b)中的源于HT1080细胞的人纤维肉瘤cDNA文库。也见于Joukov等,EMBO J.,15290-298(1996)。挑出九个阳性克隆并通过用寡核苷酸5′-CACGGCTTATGCAAGCAAAG-3′(序列55)和5′-AACACAGTTTTCCATAATAG-3′(序列56)的PCR分析。选择这些寡核苷酸扩增对应于序列32的495-1661位核苷酸的VEGF-C cDNA部分。用55℃的退火温度和25个循环进行PCR。
在琼脂糖凝胶上电泳该所得的PCR产物。所分析的九个克隆中产生了五个具有预期的1147bp长度的PCR片段,而一个稍短。将较短的片段和期望长度的片段中的一个克隆λpCRTMII载体(Invitorgen)并序列分析。测序表明较短的PCR片段带有对应于序列32的904-1055位核苷酸的153bp的缺失。这些缺失碱基对应于人和鼠VEGF-C基因的外显子4,图示于图17中。外显子4的缺失导致了一个本身又导致全长VEGF-C前体的C末端截短的读码移位,而其有15个氨基酸残基以不同于用于表达全长蛋白的读框翻译于外显子5。因此,所得的截短多肽的C末端氨基酸序列为…Leu(181)-Ser-Lys-Thr-Val-Ser-Gly-Ser-Glu-Gln-Asp-Leu-Pro-His-Glu-Leu-His-Val-Glu(199)(序列181)。由该剪接变体编码的VEGF-C变体不含VEGF-C前体的C-末端切割位点。因此,一个推定的无保守的外显子4的可变剪接RNA型鉴定于HT-1080纤维肉瘤细胞并且预计该型编码一个199个氨基酸的可作为VEGF-C拮抗剂的蛋白质。
实施例33在不同细胞体外培养物中类似地加工VEGF-C为了研究VEGF-C是否在不同类型细胞中类似地加工,用wt人VEGF-C cDNA转染293 EBNA细胞,COS-1细胞和HT-1080细胞并用Pro-MixTM如实施例22所述标记。收集源于该培养的条件培养基并用抗血清882(描述于实施例21,识别对应于序列33的104-120位氨基酸的肽)进行免疫沉淀。通过SDS-PAGE分离该免疫沉淀的多肽,并通过放射自显影检测。从所有实验细胞系中检测的分泌重组VEGF-C的主要型是29/32KD二联体。这两个多肽通过二硫键如实施例22所述彼此结合。在该培养基中还检测出约21KD的显著性较低的带。此外,检测了非加工的63KDa的VEGF-C前体。这一类型在COS-1细胞中更显著,提示COS细胞中VEGF-C的蛋白酶切加工没有293 EBNA细胞中有效。在HT-1080细胞中于这些实验条件下没有检测出内源性VEGF-C(在非转染细胞中),但在PC-3细胞的条件培养基中易于检出。分析PC-3细胞和293 EBNA细胞中该亚单位多肽大小和比例显示了非常类似的结果最显著型是29/32KDa的二联体以及次显著型是21KD多肽。由293 EBNA细胞产生的21KD型不能为Weste惹怒印迹中882抗体所识别,虽然在同样抗体用于免疫沉淀(见于前例)时其能被识别。如实施例21所述,293 EBNA细胞中32KD型的剪切发生于氨基酸残基111和112间(序列33),PC-3细胞中切割位点的下游(102和103残基间)。因此,293 EBNA细胞产生的21KD型不含用于产生抗血清882的完整的N-末端肽。
在相关的实验中,将PC-3细胞于分离条件培养基前在无血清培养基中培养不同时间(1-8天)。用Centricon device(Amicon,Beverly,USA)浓缩该条件培养基并用抗血清882进行Western印迹分析。培养一天后,检测出一个显著的32KD带。在培养4天和8天的条件培养基中检测出增加量的21-23KD型。在实施例5和几个随后的实施例中简单地称为23KD多肽的该多肽带的扩散性最大可能是由于糖基化的异源性和不同量。这些结果表明该细胞最初分泌一个32KD多肽,其在培养基中进一步加工或切割成21-23KD型。然后,由于不同的糖基化程度以及,加工切割位点的微小的不均一性,如获自PC-3和293 EBNA细胞培养基的氨基末端,导致了该多肽带的微不均一性。该羧基末端切割位点还可能会变化,可能的切割位点的例子位于225-226,226-227和227-228位残基间以及216-217位残基间。总的说来,这些结果提示分泌的细胞蛋白酶可能导致该21-23KD型VEGF-C由32KD多肽产生。该蛋白酶也可以用于体外实验中以在VEGF-C生产过程中在溶液中切割VEGF-C前体蛋白,或用于细胞培养和体内实验中以释放生物活性的VEGF-C。
实施例34通过VEGFR-3和VEGFR-2胞外区的VEGF-C型的不同结合在两个平行试验中,用一个编码重组的wt VEGF-C或编码VEGF-DNDCHis(实施例28)的构建体转染293 EBNA细胞并在转染后约48小时,用Pro-MixTM如前例如述代射标记。收集模拟转染和转染细胞的培养基并用于受体结合检测。
受体结合在含约0.2μg(a)一个包括融合到免疫球蛋白序列(VEGFR-3-Ig)的VEGFR-3胞外区的融合蛋白或者(b)一个包括融合到碱性磷酸酶序列(VEGFR-2-AP;Cao等人,生物化学杂志,2713154-62(1996))的结合缓冲液(PBS,0.5%BSA,0.02%Tween 20,1μg/ml肝素)中进行。作为对照,将相同等份的293 EBNA条件培养基和2μl抗VEGF-C抗血清(VEGF-CIP)混合。
室温下培养两小时后,抗VEGF-C抗体和VEGFR-3-Ig蛋白吸附到蛋白A-Sepharose(PAS)并用抗AP单抗(Medix Biotech,GenzymeDiagnostics,San Carlos,CA,USA)和蛋白G-Sepharose免疫沉淀VEGFR-2-AP。在结合缓冲液和20mM Tirs-HCl(pH 7.4)中先后分别洗涤含结合于VEGFR-3-Ig或VEGFR-2-AP上的VEGF-C的复合物三次和两次并将VEGF-C免疫沉淀物先后分别在RIPA缓冲液和20mM Tris-HCl(pH7.4)中洗涤三次和两次,再通过在还原和非还原态下的SDS-PAGE检测。作为对照,用抗AP和PGS或用PAS沉淀该同样的培养基以控制可能的非特异性吸附。
这些实验表明VEGFR-3结合于32/29KD和21-23KD型重组VEGF-C,而VEGF-R-2优选结合于该条件培养基的21-23KD组分。此外,观察到少量的63KD和52KD VEGF-C型结合于VEGFR-3。在非还原态下的进一步分析表明大部分结合于任一受体的21-23KD VEGF-C不含链间二硫键。这些发现支持了VEGF-C结合于VEGFR-2的结论。这资料提示仅对VEGFR-3有活性或对VEGFR-3和VEGFR-2同时有活性的重组型VEGF-C的应用。另一方面,这些结果以及实施例28的结果并没有排除32/29KD二聚体结合于VEGFR-3却不激活它的可能。该32/29KD二聚体不能活化VEGFR-3可解释N-His VEGF-C转染的细胞的条件培养基比VEGF-C DNDCHis转染细胞诱导出次显著VEGFR-3酪氨酸磷酸化,即使前一个多肽的表达更高(见图27和28)。结合于VEGF-C受体但不能活化该受体的稳定VEGF-C多肽变化体用作VEGF-C拮抗剂。
生物材料保藏质粒FLT4-L已按布达佩斯条约保藏于美国典型培养物保藏中心(ATCC),12301 Parklawn Dr.,Rockville MD 20952(USA),并已得到保藏日1995年7月24日和ATCC登录号97231。
虽然已按具体的实施方案描述了本发明,可以理解的是本领域的技术人员会进行变化和修改。相应地,本发明仅加入那些出现于附加的权利要求书的限制。
序列表(1)一般资料(i)申请人Helsinki University Licensing Lts Oy(ii)发明题目受体配体VEGF-C(iii)序列数81(iv)通信地址(A)地址Oy Jalo Ant-Wuorinen Ab(B)街道Iso Roobertinkatu 4-6A(C)城市Helsinki(E)国家Finland(F)邮编00120(v)计算机可读形式(A)媒介类型软盘(B)计算机IBM PC兼容(C)操作系统PC-DOS/MS-DOS(D)软件Patent In Release#1.0,Version#1.30(vi)当前申请资料(A)申请号(B)申请日(C)分类(vii)在先申请资料(A)申请号08/671,573(B)申请日1996年6月28日(vii)在先申请资料(A)申请号08/601,132(B)申请日1996年2月14日(vii)在先申请资料(A)申请号08/585,895(B)申请日1996年1月12日(vii)在先申请资料(A)申请号08/510,133
(B)申请日1995年8月1日(viii)律师/代理人资料(A)姓名Karvinen,Leena(B)登记号28999(ix)电信资料(A)电话+358 0 648 606(B)电传+358 0 640 575(C)电报123505 JALO FI(2)序列1资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列1TGTCCTCGCT GTCCTTGTCT 20(2)序列2资料(i)序列特征(A)长度70个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列2ACATGCATGC CACCATGCAG CGGGGCGCCG CGCTGTGCCT GCGACTGTGG CTCTGCCTGG 60GACTCCTGGA 70(2)序列3资料(i)序列特征(A)长度24碱基对(B)类型核酸
(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列3ACATGCATGC CCCGCCGGTC ATCC 24(2)序列4资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列4CGGAATTCCC CATGACCCCA AC22(2)序列5资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列5CCATCGATGG ATCCTACCTG AAGCCGCTTT CTT 33(2)序列6资料(i)序列特征(A)长度17个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列6ATTTAGGTGA CACTATA 17(2)序列7资料(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列7CCATCGATGG ATCCCGATGC TGCTTAGTAG CTGT34(2)序列8资料(i)序列特征(A)长度40个氨基酸(B)类型氨基酸(C)链型单链(D)拓朴结构线性(ii)分子类型肽(xi)序列描述序列8Pro Met Thr Pro Thr Thr Tyr Lys Gly Ser Val Asp Asn Gln Thr Asp1 5 10 15Ser Gly Met Val Leu Ala Ser Glu Glu Phe Glu Gln Ile Glu Ser Arg20 25 30His Arg Gln Glu Ser Gly Phe Arg35 40(2)序列9资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列9CTGGAGTCGA CTTGGCGGAC T 21(2)序列10资料(i)序列特征(A)长度60个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列10CGCGGATCCC TAGTGATGGT GATGGTGATG TCTACCTTCG ATCATGCTGC CCTTATCCTC60(2)序列11资料(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列11CCCAAGCTTG GATCCAAGTG GCTACTCCAT GACC34(2)序列12资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列12GTTGCCTGTG ATGTGCACCA20(2)序列13资料(i)序列特征(A)长度18个氨基酸
(B)类型氨基酸(C)链型单链(D)拓朴结构线性(ii)分子类型肽(xi)序列描述序列13Xaa Glu Glu Thr Ile Lys phe Ala Ala Ala His Tyr Asn Thr Glu Ile1 5 10 15Leu Lys(2)序列14资料(i)序列特征(A)长度17个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列14GCAGARGARA CNATHAA 17(2)序列15资料(i)序列特征(A)长度5个氨基酸(B)类型氨基酸(C)链型单链(D)拓朴结构线性(ii)分子类型肽(xi)序列描述序列15Glu Glu Thr Ile Lys1 5(2)序列16资料(i)序列特征(A)长度18碱基对(B)类型核酸
(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列16GCAYTTNARD ATYTCNGT 18(2)序列17资料(i)序列特征(A)长度5个氨基酸(B)类型氨基酸(C)链型单链(D)拓朴结构线性(ii)分子类型肽(xi)序列描述序列17Thr Glu Ile Leu Lys1 5(2)序列18资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列18ATTCGCTGCA GCACACTACA AC 22(2)序列19资料(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA
(xi)序列描述序列19TCNGTGTTGT AGTGTGCTG 19(2)序列20资料(i)序列特征(A)长度7个氨基酸(B)类型氨基酸(C)链型单链(D)拓朴结构线性(ii)分子类型肽(xi)序列描述序列20Ala Ala His Tyr Asn Thr Glu1 5(2)序列21资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列21TAATACGACT CACTATAGGG 20(2)序列22资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列22GTTGTAGTGT GCTGCAGCGA ATTT 24(2)序列23资料
(i)序列特征(A)长度8个氨基酸(B)类型氨基酸(C)链型单链(D)拓朴结构线性(ii)分子类型肽(xi)序列描述序列23Lys Phe Ala Ala Ala His Tyr Asn1 5(2)序列24资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列24TCACTATAGG GAGACCCAAG C 24(2)序列25资料(i)序列特征(A)长度219个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列25TCACTATAGG GAGACCCAAG CTTGGTACCG AGCTCGGATC CACTAGTAAC GGCCGCCAGT 60GTGGTGGAAT TCGACGAACT CATGACTGTA CTCTACCCAG AATATTGGAA AATGTACAAG 120TGTCAGCTAA GGCAAGGAGG CTGGCAACAT AACAGAGAAC AGGCCAACCT CAACTCAAGG 180ACAGAAGAGA CTATAAAATT CGCTGCAGCA CACTACAAC 219(2)序列26资料(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列26ACAGAGAACA GGCCAACC 18(2)序列27资料(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列27TCTAGCATTT AGGTGACAC 19(2)序列28资料(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列28AAGAGACTAT AAAATTCGCT GCAGC 25(2)序列29资料(i)序列特征(A)长度20个碱基对(B)类型核酸
(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列29CCCTCTAGAT GCATGCTCGA20(2)序列30资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列30GTTGTAGTGT GCTGCAGCGA ATTT 24(2)序列31资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列31TCACTATAGG GAGACCCAAG C 21(2)序列32资料(i)序列特征(A)长度1997个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(ix)特征
(A)名称/索引CDS(B)位置352..1608(x)序列描述序列32CCCGCCCCGC CTCTCCAAAA AGCTACACCG ACGCGGACCG CGGCGGCGTC CTCCCTCGCC 60CTCGCTTCAC CTCGCGGGCT CCGAATGCGG GGAGCTCGGA TGTCCGGTTT CCTGTGAGGC 120TTTTACCTGA CACCCGCCGC CTTTCCCCGG CACTGGCTGG GAGGGCGCCC TGCAAAGTTG 180GGAACGCGGA GCCCCGGACC CGCTCCCGCC GCCTCCGGCT CGCCCAGGGG GGGTCGCCGG 240GAGGAGCCCG GGGGAGAGGG ACCAGGAGGG GCCCGCGGCC TCGCAGGGGC GCCCGCGCCC 300CCACCCCTGC CCCCGCCAGC GGACCGGTCC CCCACCCCCG GTCCTTCCAC C ATG CAC 357Met His1TTG CTG GGC TTC TTC TCT GTG GCG TGT TCT CTG CTC GCC GCT GCG CTG 405Leu Leu Gly Phe Phe Ser Val Ala Cys Ser Leu Leu Ala Ala Ala Leu5 10 15CTC CCG GGT CCT CGC GAG GCG CCC GCC GCC GCC GCC GCC TTC GAG TCC 453Leu Pro Gly Pro Arg Glu Ala Pro Ala Ala Ala Ala Ala Phe Glu Ser20 25 30GGA CTC GAC CTC TCG GAC GCG GAG CCC GAC GCG GGC GAG GCC ACG GCT 501Gly Leu Asp Leu Ser Asp Ala Glu Pro Asp Ala Gly Glu Ala Thr Ala35 40 45 50TAT GCA AGC AAA GAT CTG GAG GAG CAG TTA CGG TCT GTG TCC AGT GTA 549Tyr Ala Ser Lys Asp Leu Glu Glu Gln Leu Arg Ser Val Ser Ser Val55 60 65GAT GAA CTC ATG ACT GTA CTC TAC CCA GAA TAT TGG AAA ATG TAC AAG 597Asp Glu Leu Met Thr Val Leu Tyr Pro Glu Tyr Trp Lys Met Tyr Lys70 75 80TGT CAG CTA AGG AAA GGA GGC TGG CAA CAT AAC AGA GAA CAG GCC AAC 645Cys Gln Leu Arg Lys Gly Gly Trp Gln His Asn Arg Glu Gln Ala Asn85 90 95CTC AAC TCA AGG ACA GAA GAG ACT ATA AAA TTT GCT GCA GCA CAT TAT 693Leu Asn Ser Arg Thr Glu Glu Thr Ile Lys Phe Ala Ala Ala His Tyr100 105 110AAT ACA GAG ATC TTG AAA AGT ATT GAT AAT GAG TGG AGA AAG ACT CAA 741Asn Thr Glu Ile Leu Lys Ser Ile Asp Asn Glu Trp Arg Lys Thr Gln115 120 125 130TGC ATG CCA CGG GAG GTG TGT ATA GAT GTG GGG AAG GAG TTT GGA GTC 789Cys Met Pro Arg Glu Val Cys Ile Asp Val Gly Lys Glu Phe Gly Val135 140 145GCG ACA AAC ACC TTC TTT AAA CCT CCA TGT GTG TCC GTC TAC AGA TGT 837Ala Thr Asn Thr Phe Phe Lys Pro Pro Cys Val Ser Val Tyr Arg Cys150 155 160GGG GGT TGC TGC AAT AGT GAG GGG CTG CAG TGC ATG AAC ACC AGC ACG 885Gly Gly Cys Cys Asn Ser Glu Gly Leu Gln Cys Met Asn Thr Ser Thr165 170 175AGC TAC CTC AGC AAG ACG TTA TTT GAA ATT ACA GTG CCT CTC TCT CAA 933Ser Tyr Leu Ser Lys Thr Leu Phe Glu Ile Thr Val Pro Leu Ser Gln180 185 190GGC CCC AAA CCA GTA ACA ATC AGT TTT GCC AAT CAC ACT TCC TGC CGA 981Gly Pro Lys Pro Val Thr Ile Ser Phe Ala Asn His Thr Ser Cys Arg195 200 205 210TGC ATG TCT AAA CTG GAT GTT TAC AGA CAA GTT CAT TCC ATT ATT AGA 1029Cys Met Ser Lys Leu Asp Val Tyr Arg Gln Val His Ser Ile Ile Arg215 220 225CGT TCC CTG CCA GCA ACA CTA CCA CAG TGT CAG GCA GCG AAC AAG ACC 1077Arg Ser Leu Pro Ala Thr Leu Pro Gln Cys Gln Ala Ala Asn Lys Thr230 235 240TGC CCC ACC AAT TAC ATG TGG AAT AAT CAC ATC TGC AGA TGC CTG GCT 1125Cys Pro Thr Asn Tyr Met Trp Asn Asn His Ile Cys Arg Cys Leu Ala245 250 255CAG GAA GAT TTT ATG TTT TCC TCG GAT GCT GGA GAT GAC TCA ACA GAT 1173Gln Glu Asp Phe Met Phe Ser Ser Asp Ala Gly Asp Asp Ser Thr Asp260 265 270GGA TTC CAT GAC ATC TGT GGA CCA AAC AAG GAG CTG GAT GAA GAG ACC 1221Gly Phe His Asp Ile Cys Gly Pro Asn Lys Glu Leu Asp Glu Glu Thr275 280 285 290TGT CAG TGT GTC TGC AGA GCG GGG CTT CGG CCT GCC AGC TGT GGA CCC 1269Cys Gln Cys Val Cys Arg Ala Gly Leu Arg Pro Ala Ser Cys Gly Pro295 300 305CAC AAA GAA CTA GAC AGA AAC TCA TGC CAG TGT GTC TGT AAA AAC AAA 1317His Lys Glu Leu Asp Arg Asn Ser Cys Gln Cys Val Cys Lys Asn Lys310 315 320CTC TTC CCC AGC CAA TGT GGG GCC AAC CGA GAA TTT GAT GAA AAC ACA 1365Leu Phe Pro Ser Gln Cys Gly Ala Asn Arg Glu Phe Asp Glu Asn Thr325 330 335TGC CAG TGT GTA TGT AAA AGA ACC TGC CCC AGA AAT CAA CCC CTA AAT 1413Cys Gln Cys Val Cys Lys Arg Thr Cys Pro Arg Asn Gln Pro Leu Asn340 345 350CCT GGA AAA TGT GCC TGT GAA TGT ACA GAA AGT CCA CAG AAA TGC TTG 1461Pro Gly Lys Cys Ala Cys Glu Cys Thr Glu Ser Pro Gln Lys Cys Leu355 360 365 370TTA AAA GGA AAG AAG TTC CAC CAC CAA ACA TGC AGC TGT TAC AGA CGG 1509Leu Lys Gly Lys Lys Phe His His Gln Thr Cys Ser Cys Tyr Arg Arg375 380 385CCA TGT ACG AAC CGC CAG AAG GCT TGT GAG CCA GGA TTT TCA TAT AGT 1557Pro Cys Thr Asn Arg Gln Lys Ala Cys Glu Pro Gly Phe Ser Tyr Ser390 395 400GAA GAA GTG TGT CGT TGT GTC CCT TCA TAT TGG AAA AGA CCA CAA ATG 1605Glu Glu Val Cys Arg Cys Val Pro Ser Tyr Trp Lys Arg Pro Gln Met405 410 415AGC TAAGATTGTA CTGTTTTCCA GTTCATCGAT TTTCTATTAT GGAAAACTGT 1658SerGTTGCCACAG TAGAACTGTC TGTGAACAGA GAGACCCTTG TGGGTCCATG CTAACAAAGA1718CAAAAGTCTG TCTTTCCTGA ACCATGTGGA TAACTTTACA GAAATGGACT GGAGCTCATC1778TGCAAAAGGC CTCTTGTAAA GACTGGTTTT CTGCCAATGA CCAAACAGCC AAGATTTTCC1838TCTTGTGATT TCTTTAAAAG AATGACTATA TAATTTATTT CCACTAAAAA TATTGTTTCT1898GCATTCATTT TTATAGCAAC AACAATTGGT AAAACTCACT GTGATCAATA TTTTTATATC1958ATGCAAAATA TGTTTAAAAT AAAATGAAAA TTGTATTAT 1997(2)序列33资料(i)序列特征
(A)长度419个氨基酸(B)类型氨基酸(D)拓朴结构线性(ii)分子类型蛋白质(xi)序列描述序列33Met His Leu Leu Gly Phe Phe Ser Val Ala Cys Ser Leu Leu Ala Ala1 5 10 15Ala Leu Leu Pro Gly Pro Arg Glu Ala Pro Ala Ala Ala Ala Ala Phe20 25 30Glu Ser Gly Leu Asp Leu Ser Asp Ala Glu Pro Asp Ala Gly Glu Ala35 40 45Thr Ala Tyr Ala Ser Lys Asp Leu Glu Glu Gln Leu Arg Ser Val Ser50 55 60Ser Val Asp Glu Leu Met Thr Val Leu Tyr Pro Glu Tyr Trp Lys Met65 70 75 80Tyr Lys Cys Gln Leu Arg Lys Gly Gly Trp Gln His Asn Arg Glu Gln85 90 95Ala Asn Leu Asn Ser Arg Thr Glu Glu Thr Ile Lys Phe Ala Ala Ala100 105 110His Tyr Asn Thr Glu Ile Leu Lys Ser Ile Asp Asn Glu Trp Arg Lys115 120 125Thr Gln Cys Met Pro Arg Glu Val Cys Ile Asp Val Gly Lys Glu Phe130 135140Gly Val Ala Thr Asn Thr Phe Phe Lys Pro Pro Cys Val Ser Val Tyr145 150 155 160Arg Cys Gly Gly Cys Cys Asn Ser Glu Gly Leu Gln Cys Met Asn Thr165 170 175Ser Thr Ser Tyr Leu Ser Lys Thr Leu Phe Glu Ile Thr Val Pro Leu180 185 190Ser Gln Gly Pro Lys Pro Val Thr Ile Ser Phe Ala Asn His Thr Ser195 200 205Cys Arg Cys Met Ser Lys Leu Asp Val Tyr Arg Gln Val His Ser Ile210 215 220Ile Arg Arg Ser Leu Pro Ala Thr Leu Pro Gln Cys Gln Ala Ala Asn225 230 235 240Lys Thr Cys Pro Thr Asn Tyr Met Trp Asn Asn His Ile Cys Arg Cys245 250 255Leu Ala Gln Glu Asp Phe Met Phe Ser Ser Asp Ala Gly Asp Asp Ser260 265 270Thr Asp Gly Phe His Asp Ile Cys Gly Pro Asn Lys Glu Leu Asp Glu275 280 285Glu Thr Cys Gln Cys Val Cys Arg Ala Gly Leu Arg Pro Ala Ser Cys290 295 300Gly Pro His Lys Glu Leu Asp Arg Asn Ser Cys Gln Cys Val Cys Lys305 310 315 320Asn Lys Leu Phe Pro Ser Gln Cys Gly Ala Asn Arg Glu Phe Asp Glu325 330 335Asn Thr Cys Gln Cys Val Cys Lys Arg Thr Cys Pro Arg Asn Gln Pro340 345 350Leu Asn Pro Gly Lys Cys Ala Cys Glu Cys Thr Glu Ser Pro Gln Lys355 360 365Cys Leu Leu Lys Gly Lys Lys Phe His His Gln Thr Cys Ser Cys Tyr370 375 380Arg Arg Pro Cys Thr Asn Arg Gln Lys Ala Cys Glu Pro Gly Phe Ser385 390 395 400Tyr Ser Glu Glu Val Cys Arg Cys Val Pro Ser Tyr Trp Lys Arg Pro405 410 415Gln Met Ser(2)序列34资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列34TGAGTGATTTGTAGCTGCTGTG 22(2)序列35资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列35TATTGCAGCAACCCCCACATCT 22(2)序列36资料(i)序列特征(A)长度4416碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列36CCACGCGCAG CGGCCGGAGA TGCAGCGGGG CGCCGCGCTG TGCCTGCGAC TGTGGCTCTG 60CCTGGGACTC CTGGACGGCC TGGTGAGTGG CTACTCCATG ACCCCCCCGA CCTTGAACAT 120CACGGAGGAG TCACACGTCA TCGACACCGG TGACAGCCTG TCCATCTCCT GCAGGGGACA 180GCACCCCCTC GAGTGGGCTT GGCCAGGAGC TCAGGAGGCG CCAGCCACCG GAGACAAGGA 240CAGCGAGGAC ACGGGGGTGG TGCGAGACTG CGAGGGCACA GACGCCAGGC CCTACTGCAA 300GGTGTTGCTG CTGCACGAGG TACATGCCAA CGACACAGGC AGCTACGTCT GCTACTACAA 360GTACATCAAG GCACGCATCG AGGGCACCAC GGCCGCCAGC TCCTACGTGT TCGTGAGAGA 420CTTTGAGCAG CCATTCATCA ACAAGCCTGA CACGCTCTTG GTCAACAGGA AGGACGCCAT 480GTGGGTGCCC TGTCTGGTGT CCATCCCCGG CCTCAATGTC ACGCTGCGCT CGCAAAGCTC 540GGTGCTGTGG CCAGACGGGC AGGAGGTGGT GTGGGATGAC CGGCGGGGCA TGCTCGTGTC 600CACGCCACTG CTGCACGATG CCCTGTACCT GCAGTGCGAG ACCACCTGGG GAGACCAGGA 660CTTCCTTTCC AACCCCTTCC TGGTGCACAT CACAGGCAAC GAGCTCTATG ACATCCAGCT 720GTTGCCCAGG AAGTCGCTGG AGCTGCTGGT AGGGGAGAAG CTGGTCCTGA ACTGCACCGT 780GTGGGCTGAG TTTAACTCAG GTGTCACCTT TGACTGGGAC TACCCAGGGA AGCAGGCAGA 840GCGGGGTAAG TGGGTGCCCG AGCGACGCTC CCAGCAGACC CACACAGAAC TCTCCAGCAT 900CCTGACCATC CACAACGTCA GCCAGCACGA CCTGGGCTCG TATGTGTGCA AGGCCAACAA 960CGGCATCCAG CGATTTCGGG AGAGCACCGA GGTCATTGTG CATGAAAATC CCTTCATCAG1020CGTCGAGTGG CTCAAAGGAC CCATCCTGGA GGCCACGGCA GGAGACGAGC TGGTGAAGCT1080GCCCGTGAAG CTGGCAGCGT ACCCCCCGCC CGAGTTCCAG TGGTACAAGG ATGGAAAGGC1140ACTGTCCGGG CGCCACAGTC CACATGCCCT GGTGCTCAAG GAGGTGACAG AGGCCAGCAC1200AGGCACCTAC ACCCTCGCCC TGTGGAACTC CGCTGCTGGC CTGAGGCGCA ACATCAGCCT1260GGAGCTGGTG GTGAATGTGC CCCCCCAGAT ACATGAGAAG GAGGCCTCCT CCCCCAGCAT1320CTACTCGCGT CACAGCCGCC AGGCCCTCAC CTGCACGGCC TACGGGGTGC CCCTGCCTCT1380CAGCATCCAG TGGCACTGGC GGCCCTGGAC ACCCTGCAAG ATGTTTGCCC AGCGTAGTCT1440CCGGCGGCGG CAGCAGCAAG ACCTCATGCC ACAGTGCCGT GACTGGAGGG CGGTGACCAC1500GCAGGATGCC GTGAACCCCA TCGAGAGCCT GGACACCTGG ACCGAGTTTG TGGAGGGAAA1560GAATAAGACT GTGAGCAAGC TGGTGATCCA GAATGCCAAC GTGTCTGCCA TGTACAAGTG1620TGTGGTCTCC AACAAGGTGG GCCAGGATGA GCGGCTCATC TACTTCTATG TGACCACCAT1680CCCCGACGGC TTCACCATCG AATCCAAGCC ATCCGAGGAG CTACTAGAGG GCCAGCCGGT1740GCTCCTGAGC TGCCAAGCCG ACAGCTACAA GTACGAGCAT CTGCGCTGGT ACCGCCTCAA1800CCTGTCCACG CTGCACGATG CGCACGGGAA CCCGCTTCTG CTCGACTGCA AGAACGTGCA1860TCTGTTCGCC ACCCCTCTGG CCGCCAGCCT GGAGGAGGTG GCACCTGGGG CGCGCCACGC1920CACGCTCAGC CTGAGTATCC CCCGCGTCGC GCCCGAGCAC GAGGGCCACT ATGTGTGCGA1980AGTGCAAGAC CGGCGCAGCC ATGACAAGCA CTGCCACAAG AAGTACCTGT CGGTGCAGGC2040CCTGGAAGCC CCTCGGCTCA CGCAGAACTT GACCGACCTC CTGGTGAACG TGAGCGACTC2100GCTGGAGATG CAGTGCTTGG TGGCCGGAGC GCACGCGCCC AGCATCGTGT GGTACAAAGA2160CGAGAGGCTG CTGGAGGAAA AGTCTGGAGT CGACTTGGCG GACTCCAACC AGAAGCTGAG2220CATCCAGCGC GTGCGCGAGG AGGATGCGGG ACGCTATCTG TGCAGCGTGT GCAACGCCAA2280GGGCTGCGTC AACTCCTCCG CCAGCGTGGC CGTGGAAGGC TCCGAGGATA AGGGCAGCAT2340GGAGATCGTG ATCCTTGTCG GTACCGGCGT CATCGCTGTC TTCTTCTGGG TCCTCCTCCT2400CCTCATCTTC TGTAACATGA GGAGGCCGGC CCACGCAGAC ATCAAGACGG GCTACCTGTC2460CATCATCATG GACCCCGGGG AGGTGCCTCT GGAGGAGCAA TGCGAATACC TGTCCTACGA2520TGCCAGCCAG TGGGAATTCC CCCGAGAGCG GCTGCACCTG GGGAGAGTGC TCGGCTACGG2580CGCCTTCGGG AAGGTGGTGG AAGCCTCCGC TTTCGGCATC CACAAGGGCA GCAGCTGTGA2640CACCGTGGCC GTGAAAATGC TGAAAGAGGG CGCCACGGCC AGCGAGCACC GCGCGCTGAT2700GTCGGAGCTC AAGATCCTCA TTCACATCGG CAACCACCTC AACGTGGTCA ACCTCCTCGG2760GGCGTGCACC AAGCCGCAGG GCCCCCTCAT GGTGATCGTG GAGTTCTGCA AGTACGGCAA2820CCTCTCCAAC TTCCTGCGCG CCAAGCGGGA CGCCTTCAGC CCCTGCGCGG AGAAGTCTCC2880CGAGCAGCGC GGACGCTTCC GCGCCATGGT GGAGCTCGCC AGGCTGGATC GGAGGCGGCC2940GGGGAGCAGC GACAGGGTCC TCTTCGCGCG GTTCTCGAAG ACCGAGGGCG GAGCGAGGCG3000GGCTTCTCCA GACCAAGAAG CTGAGGACCT GTGGCTGAGC CCGCTGACCA TGGAAGATCT3060TGTCTGCTAC AGCTTCCAGG TGGCCAGAGG GATGGAGTTC CTGGCTTCCC GAAAGTGCAT3120CCACAGAGAC CTGGCTGCTC GGAACATTCT GCTGTCGGAA AGCGACGTGG TGAAGATCTG3180TGACTTTGGC CTTGCCCGGG ACATCTACAA AGACCCTGAC TACGTCCGCA AGGGCAGTGC3240CCGGCTGCCC CTGAAGTGGA TGGCCCCTGA AAGCATCTTC GACAAGGTGT ACACCACGCA3300GAGTGACGTG TGGTCCTTTG GGGTGCTTCT CTGGGAGATC TTCTCTCTGG GGGCCTCCCC3360GTACCCTGGG GTGCAGATCA ATGAGGAGTT CTGCCAGCGG CTGAGAGACG GCACAAGGAT3420GAGGGCCCCG GAGCTGGCCA CTCCCGCCAT ACGCCGCATC ATGCTGAACT GCTGGTCCGG3480AGACCCCAAG GCGAGACCTG CATTCTCGGA GCTGGTGGAG ATCCTGGGGG ACCTGCTCCA3540GGGCAGGGGC CTGCAAGAGG AAGAGGAGGT CTGCATGGCC CCGCGCAGCT CTCAGAGCTC3600AGAAGAGGGC AGCTTCTCGC AGGTGTCCAC CATGGCCCTA CACATCGCCC AGGCTGACGC3660TGAGGACAGC CCGCCAAGCC TGCAGCGCCA CAGCCTGGCC GCCAGGTATT ACAACTGGGT3720GTCCTTTCCC GGGTGCCTGG CCAGAGGGGC TGAGACCCGT GGTTCCTCCA GGATGAAGAC3780ATTTGAGGAA TTCCCCATGA CCCCAACGAC CTACAAAGGC TCTGTGGACA ACCAGACAGA3840CAGTGGGATG GTGCTGGCCT CGGAGGAGTT TGAGCAGATA GAGAGCAGGC ATAGACAAGA3900AAGCGGCTTC AGGTAGCTGA AGCAGAGAGA GAGAAGGCAG CATACGTCAG CATTTTCTTC3960TCTGCACTTA TAAGAAAGAT CAAAGACTTT AAGACTTTCG CTATTTCTTC TACTGCTATC4020TACTACAAAC TTCAAAGAGG AACCAGGAGG ACAAGAGGAG CATGAAAGTG GACAAGGAGT4080GTGACCACTG AAGCACCACA GGGAAGGGGT TAGGCCTCCG GATGACTGCG GGCAGGCCTG4140GATAATATCC AGCCTCCCAC AAGAAGCTGG TGGAGCAGAG TGTTCCCTGA CTCCTCCAAG4200GAAAGGGAGA CGCCCTTTCA TGGTCTGCTG AGTAACAGGT GCNTTCCCAG ACACTGGCGT4260TACTGCTTGA CCAAAGAGCC CTCAAGCGGC CCTTATGCCA GCGTGACAGA GGGCTCACCT4320CTTGCCTTCT AGGTCACTTC TCACACAATG TCCCTTCAGC ACCTGACCCT GTGCCCGCCA4380GTTATTCCTT GGTAATATGA GTAATACATC AAAGAG 4416(2)序列37资料(i)序列特征(A)长度4273碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列37AAGCTTATCG ATTTCGAACC CGGGGGTACC GAATTCCTCG AGTCTAGAGG AGCATGCCTG 60CAGGTCGACC GGGCTCGATC CCCTCGCGAG TTGGTTCAGC TGCTGCCTGA GGCTGGACGA 120CCTCGCGGAG TTCTACCGGC AGTGCAAATC CGTCGGCATC CAGGAAACCA GCAGCGGCTA 180TCCGCGCATC CATGCCCCCG AACTGCAGGA GTGGGGAGGC ACGATGGCCG CTTTGGTCCC 240GGATCTTTGT GAAGGAACCT TACTTCTGTG GTGTGACATA ATTGGACAAA CTACCTACAG 300AGATTTAAAG CTCTAAGGTA AATATAAAAT TTTTAAGTGT ATAATGTGTT AAACTACTGA 360TTCTAATTGT TTGTGTATTT TAGATTCCAA CCTATGGAAC TGATGAATGG GAGCAGTGGT 420GGAATGCCTT TAATGAGGAA AACCTGTTTT GCTCAGAAGA AATGCCATCT AGTGATGATG 480AGGCTACTGC TGACTCTCAA CATTCTACTC CTCCAAAAAA GAAGAGAAAG GTAGAAGACC 540CCAAGGACTT TCCTTCAGAA TTGCTAAGTT TTTTGAGTCA TGCTGTGTTT AGTAATAGAA 600CTCTTGCTTG CTTTGCTATT TACACCACAA AGGAAAAAGC TGCACTGCTA TACAAGAAAA 660TTATGGAAAA ATATTCTGTA ACCTTTATAA GTAGGCATAA CAGTTATAAT CATAACATAC 720TGTTTTTTCT TACTCCACAC AGGCATAGAG TGTCTGCTAT TAATAACTAT GCTCAAAAAT 780TGTGTACCTT TAGCTTTTTA ATTTGTAAAG GGGTTAATAA GGAATATTTG ATGTATAGTG 840CCTTGACTAG AGATCATAAT CAGCCATACC ACATTTGTAG AGGTTTTACT TGCTTTAAAA 900AACCTCCCAC ACCTCCCCCT GAACCTGAAA CATAAAATGA ATGCAATTGT TGTTGTTAAC 960TTGTTTATTG CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA TTTCACAAAT1020AAAGCATTTT TTTCACTGCA TTCTAGTTGT GGTTTGTCCA AACTCATCAA TGTATCTTAT1080CATGTCTGGA TCTGCCGGTC TCCCTATAGT GAGTCGTATT AATTTCGATA AGCCAGGTTA1140ACCTGCATTA ATGAATCGGC CAACGCGCGG GGAGAGGCGG TTTGCGTATT GGGCGCTCTT1200CCGCTTCCTC GCTCACTGAC TCGCTGCGCT CGGTCGTTCG GCTGCGGCGA GCGGTATCAG1260CTCACTCAAA GGCGGTAATA CGGTTATCCA CAGAATCAGG GGATAACGCA GGAAAGAACA1320TGTGAGCAAA AGGCCAGCAA AAGGCCAGGA ACCGTAAAAA GGACGCGTTG CTGGCGTTTT1380TCCATAGGCT CCGCCCCCCT GACGAGCATC ACAAAAATCG ACGCTCAAGT CAGAGGTGGC1440GAAACCCGAC AGGACTATAA AGATACCAGG CGTTTCCCCC TGGAAGCTCC CTCGTGCGCT1500CTCCTGTTCC GACCCTGCCG CTTACCGGAT ACCTGTCCGC CTTTCTCCCT TCGGGAAGCG1560TGGCGCTTTC TCAATGCTCA CGCTGTAGGT ATCTCAGTTC GGTGTAGGTC GTTCGCTCCA1620AGCTGGGCTG TGTGCACGAA CCCCCCGTTC AGCCCGACCG CTGCGCCTTA TCCGGTAACT1680ATCGTCTTGA GTCCAACCCG GTAAGACACG ACTTATCGCC ACTGGCAGCA GCCACTGGTA1740ACAGGATTAG CAGAGCGAGG TATGTAGGCG GTGCTACAGA GTTCTTGAAG TGGTGGCCTA1800ACTACGGCTA CACTAGAAGG ACAGTATTTG GTATCTGCGC TCTGCTGAAG CCAGTTACCT1860TCGGAAAAAG AGTTGGTAGC TCTTGATCCG GCAAACAAAC CACCGCTGGT AGCGGTGGTT1920TTTTTGTTTG CAAGCAGCAG ATTACGCGCA GAAAAAAAGG ATCTCAAGAA GATCCTTTGA1980TCTTTTCTAC GGGGTCTGAC GCTCAGTGGA ACGAAAACTC ACGTTAAGGG ATTTTGGTCA2040TGAGATTATC AAAAAGGATC TTCACCTAGA TCCTTTTAAA TTAAAAATGA AGTTTTAAAT2100CAATCTAAAG TATATATGAG TAAACTTGGT CTGACAGTTA CCAATGCTTA ATCAGTGAGG2160CACCTATCTC AGCGATCTGT CTATTTCGTT CATCCATAGT TGCCTGACTC CCCGTCGTGT2220AGATAACTAC GATACGGGAG GGCTTACCAT CTGGCCCCAG TGCTGCAATG ATACCGCGAG2280ACCCACGCTC ACCGGCTCCA GATTTATCAG CAATAAACCA GCCAGCCGGA AGGGCCGAGC2340GCAGAAGTGG TCCTGCAACT TTATCCGCCT CCATCCAGTC TATTAATTGT TGCCGGGAAG2400CTAGAGTAAG TAGTTCGCCA GTTAATAGTT TGCGCAACGT TGTTGCCATT GCTACAGGCA2460TCGTGGTGTC ACGCTCGTCG TTTGGTATGG CTTCATTCAG CTCCGGTTCC CAACGATCAA2520GGCGAGTTAC ATGATCCCCC ATGTTGTGCA AAAAAGCGGT TAGCTCCTTC GGTCCTCCGA2580TCGTTGTCAG AAGTAAGTTG GCCGCAGTGT TATCACTCAT GGTTATGGCA GCACTGCATA2640ATTCTCTTAC TGTCATGCCA TCCGTAAGAT GCTTTTCTGT GACTGGTGAG TACTCAACCA2700AGTCATTCTG AGAATAGTGT ATGCGGCGAC CGAGTTGCTC TTGCCCGGCG TCAATACGGG2760ATAATACCGC GCCACATAGC AGAACTTTAA AAGTGCTCAT CATTGGAAAA CGTTCTTCGG2820GGCGAAAACT CTCAAGGATC TTACCGCTGT TGAGATCCAG TTCGATGTAA CCCACTCGTG2880CACCCAACTG ATCTTCAGCA TCTTTTACTT TCACCAGCGT TTCTGGGTGA GCAAAAACAG2940GAAGGCAAAA TGCCGCAAAA AAGGGAATAA GGGCGACACG GAAATGTTGA ATACTCATAC3000TCTTCCTTTT TCAATATTAT TGAAGCATTT ATCAGGGTTA TTGTCTCATG AGCGGATACA3060TATTTGAATG TATTTAGAAA AATAAACAAA TAGGGGTTCC GCGCACATTT CCCCGAAAAG3120TGCCACCTGA CGTCTAAGAA ACCATTATTA TCATGACATT AACCTATAAA AATAGGCGTA3180TCACGAGGCC CTTTCGTCTC GCGCGTTTCG GTGATGACGG TGAAAACCTC TGACACATGC3240AGCTCCCGGA GACGGTCACA GCTTGTCTGT AAGCGGATGC CGGGAGCAGA CAAGCCCGTC3300AGGGCGCGTC AGCGGGTGTT GGCGGGTGTC GGGGCTGGCT TAACTATGCG GCATCAGAGC3360AGATTGTACT GAGAGTGCAC CATATGGACA TATTGTCGTT AGAACGCGGC TACAATTAAT3420ACATAACCTT ATGTATCATA CACATACGAT TTAGGTGACA CTATAGAACT CGAGCAGAGC3480TTCCAAATTG AGAGAGAGGC TTAATCAGAG ACAGAAACTG TTTGAGTCAA CTCAAGGATG3540GTTTGAGGGA CTGTTTAACA GATCCCCTTG GTTTACCACC TTGATATCTA CCATTATGGG3600ACCCCTCATT GTACTCCTAA TGATTTTGCT CTTCGGACCC TGCATTCTTA ATCGATTAGT3660CCAATTTGTT AAAGACAGGA TATCAGTGGT CCAGGCTCTA GTTTTGACTC AACAATATCA3720CCAGCTGAAG CCTATAGAGT ACGAGCCATA GATAAAATAA AAGATTTTAT TTAGTCTCCA3780GAAAAAGGGG GGAATGAAAG ACCCCACCTG TAGGTTTGGC AAGCTAGCTT AAGTAACGCC3840ATTTTGCAAG GCATGGAAAA ATACATAACT GAGAATAGAG AAGTTCAGAT CAAGGTCAGG3900AACAGATGGA ACAGCTGAAT ATGGGCCAAA CAGGATATCT GTGGTAAGCA GTTCCTGCCC3960CGGCTCAGGG CCAAGAACAG ATGGAACAGC TGAATATGGG CCAAACAGGA TATCTGTGGT4020AAGCAGTTCC TGCCCCGGCT CAGGGCCAAG AACAGATGGT CCCCAGATGC GGTCCAGCCC4080TCAGCAGTTT CTAGAGAACC ATCAGATGTT TCCAGGGTGC CCCAAGGACC TGAAATGACC4140CTGTGCCTTA TTTGAACTAA CCAATCAGTT CGCTTCTCGC TTCTGTTCGC GCGCTTCTGC4200TCCCCGAGCT CAATAAAAGA GCCCACAACC CCTCACTCGG GGCGCCAGTC CTCCGATTGA4260CTGAGTCGCC CGG 4273(2)序列38资料(i)序列特征(A)长度216碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列38CAAGAAAGCG GCTTCAGCTG TAAAGGACCT GGCCAGAATG TGGCTGTGAC CAGGGCACAC 60CCTGACTCCC AAGGGAGGCG GCGGCGGCCT GAGCGGGGGG CCCGAGGAGG CCAGGTGTTT 120TACAACAGCG AGTATGGGGA GCTGTCGGAG CCAAGCGAGG AGGACCACTG CTCCCCGTCT 180GCCCGCGTGA CTTTCTTCAC AGACAACAGC TACTAA 216(2)序列39资料(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(C)链型单链(D)拓朴结构线性(ii)分子类型肽(xi)序列描述序列39Glu Glu Thr Ile Lys Phe Ala Ala Ala His Tyr Asn Thr Glu Ile Leu1 5 10 15Lys(2)序列40资料(i)序列特征(A)长度1836个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(ix)特征(A)名称/索引CDS(B)位置168..1412(xi)序列描述序列40GCGGCCGCGT CGACGCAAAA GTTGCGAGCC GCCGAGTCCC GGGAGACGCT CGCCCAGGGG 60GGTCCCCGGG AGGAAACCAC GGGACAGGGA CCAGGAGAGG ACCTCAGCCT CACGCCCCAG 120CCTGCGCCAG CCAACGGACC GGCCTCCCTG CTCCCGGTCC ATCCACC ATG CAC TTG 176
Met His Leu1CTG TGC TTC TTG TCT CTG GCG TGT TCC CTG CTC GCC GCT GCG CTG ATC 224Leu Cys Phe Leu Ser Leu Ala Cys Ser Leu Leu Ala Ala Ala Leu Ile5 10 15CCC AGT CCG CGC GAG GCG CCC GCC ACC GTC GCC GCC TTC GAG TCG GGA 272Pro Ser Pro Arg Glu Ala Pro Ala Thr Val Ala Ala Phe Glu Ser Gly20 25 30 35CTG GGC TTC TCG GAA GCG GAG CCC GAC GGG GGC GAG GTC AAG GCT TTT 320Leu Gly Phe Ser Glu Ala Glu Pro Asp Gly Gly Glu Val Lys Ala Phe40 45 50GAA GGC AAA GAC CTG GAG GAG CAG TTG CGG TCT GTG TCC AGC GTA GAT 368Glu Gly Lys Asp Leu Glu Glu Gln Leu Arg Ser Val Ser Ser Val Asp55 60 65GAG CTG ATG TCT GTC CTG TAC CCA GAC TAC TGG AAA ATG TAC AAG TGC 416Glu Leu Met Ser Val Leu Tyr Pro Asp Tyr Trp Lys Met Tyr Lys Cys70 75 80CAG CTG CGG AAA GGC GGC TGG CAG CAG CCC ACC CTC AAT ACC AGG ACA 464Gln Leu Arg Lys Gly Gly Trp Gln Gln Pro Thr Leu Asn Thr Arg Thr85 90 95GGG GAC AGT GTA AAA TTT GCT GCT GCA CAT TAT AAC ACA GAG ATC CTG 512Gly Asp Ser Val Lys Phe Ala Ala Ala His Tyr Asn Thr Glu Ile Leu100 105 110 115AAA AGT ATT GAT AAT GAG TGG AGA AAG ACT CAA TGC ATG CCA CGT GAG 560Lys Ser Ile Asp Asn Glu Trp Arg Lys Thr Gln Cys Met Pro Arg Glu120 125 130GTG TGT ATA GAT GTG GGG AAG GAG TTT GGA GCA GCC ACA AAC ACC TTC 608Val Cys Ile Asp Val Gly Lys Glu Phe Gly Ala Ala Thr Asn Thr Phe135 140 145TTT AAA CCT CCA TGT GTG TCC GTC TAC AGA TGT GGG GGT TGC TGC AAC 656Phe Lys Pro Pro Cys Val Ser Val Tyr Arg Cys Gly Gly Cys Cys Asn150 155 160AGG GAG GGG CTG CAG TGC ATG AAC ACC AGC ACA GGT TAC CTC AGC AAG 704Arg Glu Gly Leu Gln Cys Met Asn Thr Ser Thr Gly Tyr Leu Ser Lys165 170 175ACG TTG TTT GAA ATT ACA GTG CCT CTC TCA CAA GGC CCC AAA CCA GTC 752Thr Leu Phe Glu Ile Thr Val Pro Leu Ser Gln Gly Pro Lys Pro Val180 185 190 195ACA ATC AGT TTT GCC AAT CAC ACT TCC TGC CGG TGC ATG TCT AAA CTG 800Thr Ile Ser Phe Ala Asn His Thr Ser Cys Arg Cys Met Ser Lys Leu200 205 210GAT GTT TAC AGA CAA GTT CAT TCA ATT ATT AGA CGT TCT CTG CCA GCA 848Asp Val Tyr Arg Gln Val His Ser Ile Ile Arg Arg Ser Leu Pro Ala215 220 225ACA TTA CCA CAG TGT CAG GCA GCT AAC AAG ACA TGT CCA ACA AAC TAT 896Thr Leu Pro Gln Cys Gln Ala Ala Asn Lys Thr Cys Pro Thr Asn Tyr230 235 240GTG TGG AAT AAC TAC ATG TGC CGA TGC CTG GCT CAG CAG GAT TTT ATC 944Val Trp Asn Asn Tyr Met Cys Arg Cys Leu Ala Gln Gln Asp Phe Ile245 250 255TTT TAT TCA AAT GTT GAA GAT GAC TCA ACC AAT GGA TTC CAT GAT GTC 992Phe Tyr Ser Asn Val Glu Asp Asp Ser Thr Asn Gly Phe His Asp Val260 265 270 275TGT GGA CCC AAC AAG GAG CTG GAT GAA GAC ACC TGT CAG TGT GTC TGC 1040Cys Gly Pro Asn Lys Glu Leu Asp Glu Asp Thr Cys Gln Cys Val Cys280 285 290AAG GGG GGG CTT CGG CCA TCT AGT TGT GGA CCC CAC AAA GAA CTA GAT 1088Lys Gly Gly Leu Arg Pro Ser Ser Cys Gly Pro His Lys Glu Leu Asp295 300 305AGA GAC TCA TGT CAG TGT GTC TGT AAA AAC AAA CTT TTC CCT AAT TCA 1136Arg Asp Ser Cys Gln Cys Val Cys Lys Asn Lys Leu Phe Pro Asn Ser310 315 320TGT GGA GCC AAC AGG GAA TTT GAT GAG AAT ACA TGT CAG TGT GTA TGT 1184Cys Gly Ala Asn Arg Glu Phe Asp Glu Asn Thr Cys Gln Cys Val Cys325 330 335AAA AGA ACG TGT CCA AGA AAT CAG CCC CTG AAT CCT GGG AAA TGT GCC 1232Lys Arg Thr Cys Pro Arg Asn Gln Pro Leu Asn Pro Gly Lys Cys Ala340 345 350 355TGT GAA TGT ACA GAA AAC ACA CAG AAG TGC TTC CTT AAA GGG AAG AAG 1280Cys Glu Cys Thr Glu Asn Thr Gln Lys Cys Phe Leu Lys Gly Lys Lys360 365 370TTC CAC CAT CAA ACA TGC AGT TGT TAC AGA AGA CCG TGT GCG AAT CGA 1328Phe His His Gln Thr Cys Ser Cys Tyr Arg Arg Pro Cys Ala Asn Arg375 380 385CTG AAG CAT TGT GAT CCA GGA CTG TCC TTT AGT GAA GAA GTA TGC CGC 1376Leu Lys His Cys Asp Pro Gly Leu Ser Phe Ser Glu Glu Val Cys Arg390 395 400TGT GTC CCA TCG TAT TGG AAA AGG CCA CAT CTG AAC TAAGATCATA 1422Cys Val Pro Ser Tyr Trp Lys Arg Pro His Leu Asn405 410 415CCAGTTTTCA GTCAGTCACA GTCATTTACT CTCTTGAAGA CTGTTGGAAC AGCACTTAGC1482ACTGTCTATG CACAGAAAGA CTCTGTGGGA CCACATGGTA ACAGAGGCCC AAGTCTGTGT1542TTATTGAACC ATGTGGATTA CTGCGGGAGA GGACTGGCAC TCATGTGCAA AAAAAACCTC1602TTCAAAGACT GGTTTTCTGC CAGGGACCAG ACAGCTGAGG TTTTTCTCTT GTGATTTAAA1662AAAAGAATGA CTATATAATT TATTTCCACT AAAAATATTG TTCCTGCATT CATTTTTATA1722GCAATAACAA TTGGTAAAGC TCACTGTGAT CAGTATTTTT ATAACATGCA AAACTATGTT1782TAAAATAAAA TGAAAATTGT ATTATAAAAA AAAAAAAAAA AAAAAAAAAA GCTT 1836(2)序列41资料(i)序列特征(A)长度415个氨基酸(B)类型氨基酸(D)拓朴结构线性(ii)分子类型蛋白质(xi)序列描述序列41Met His Leu Leu Cys Phe Leu Ser Leu Ala Cys Ser Leu Leu Ala Ala1 5 10 15Ala Leu Ile Pro Ser Pro Arg Glu Ala Pro Ala Thr Val Ala Ala Phe20 25 30Glu Ser Gly Leu Gly Phe Ser Glu Ala Glu Pro Asp Gly Gly Glu Val35 40 45Lys Ala Phe Glu Gly Lys Asp Leu Glu Glu Gln Leu Arg Ser Val Ser50 55 60Ser Val Asp Glu Leu Met Ser Val Leu Tyr Pro Asp Tyr Trp Lys Met65 70 75 80Tyr Lys Cys Gln Leu Arg Lys Gly Gly Trp Gln Gln Pro Thr Leu Asn85 90 95Thr Arg Thr Gly Asp Ser Val Lys Phe Ala Ala Ala His Tyr Asn Thr100 105 110Glu Ile Leu Lys Ser Ile Asp Asn Glu Trp Arg Lys Thr Gln Cys Met115 120 125Pro Arg Glu Val Cys Ile Asp Val Gly Lys Glu Phe Gly Ala Ala Thr130 135 140Asn Thr Phe Phe Lys Pro Pro Cys Val Ser Val Tyr Arg Cys Gly Gly145 150 155 160Cys Cys Asn Arg Glu Gly Leu Gln Cys Met Asn Thr Ser Thr Gly Tyr165 170 175Leu Ser Lys Thr Leu Phe Glu Ile Thr Val Pro Leu Ser Gln Gly Pro180 185 190Lys Pro Val Thr Ile Ser Phe Ala Asn His Thr Ser Cys Arg Cys Met195 200 205Ser Lys Leu Asp Val Tyr Arg Gln Val His Ser Ile Ile Arg Arg Ser210 215 220Leu Pro Ala Thr Leu Pro Gln Cys Gln Ala Ala Asn Lys Thr Cys Pro225 230 235 240Thr Asn Tyr Val Trp Asn Asn Tyr Met Cys Arg Cys Leu Ala Gln Gln245 250 255Asp Phe Ile Phe Tyr Ser Asn Val Glu Asp Asp Ser Thr Asn Gly Phe260 265 270His Asp Val Cys Gly Pro Asn Lys Glu Leu Asp Glu Asp Thr Cys Gln275 280 285Cys Val Cys Lys Gly Gly Leu Arg Pro Ser Ser Cys Gly Pro His Lys290 295 300Glu Leu Asp Arg Asp Ser Cys Gln Cys Val Cys Lys Asn Lys Leu Phe305 310 315 320Pro Asn Ser Cys Gly Ala Asn Arg Glu Phe Asp Glu Asn Thr Cys Gln325 330 335Cys Val Cys Lys Arg Thr Cys Pro Arg Asn Gln Pro Leu Asn Pro Gly340 345 350Lys Cys Ala Cys Glu Cys Thr Glu Asn Thr Gln Lys Cys Phe Leu Lys355 360 365Gly Lys Lys Phe His His Gln Thr Cys Ser Cys Tyr Arg Arg Pro Cys370 375 380Ala Asn Arg Leu Lys His Cys Asp Pro Gly Leu Ser phe Ser Glu Glu385 390 395 400Val Cys Arg Cys Val Pro Ser Tyr Trp Lys Arg Pro His Leu Asn405 410 415(2)序列42资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列42TCTCTTCTGT GCTTGAGTTG AG 22(2)序列43资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列43TCTCTTCTGT CCCTGAGTTG AG 22(2)序列44资料(i)序列特征(A)长度65个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列44TGTGCTGCAG CAAATTTTAT AGTCTCTTCT GTGGCGGCGG CGGCGGCGGG CGCCTCGCGA60GGACC65(2)序列45资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列45CTGGCAGGGA ACTGCTAATA ATGGAATGAA 30(2)序列46资料(i)序列特征(A)长度84个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列46GGGCTCCGCG TCCGAGAGGT CGAGTCCGGA CTCGTGATGG TGATGGTGAT GGGCGGCGGC60GGCGGCGGGC GCCTCGCGAG GACC 84(2)序列47资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列47GTATTATAAT GTCCTCCACC AAATTTTATA G 31(2)序列48资料(i)序列特征(A)长度93个碱基对
(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列48GTTCGCTGCC TGACACTGTG GTAGTGTTGC TGGCGGCCGC TAGTGATGGT GATGGTGATG60AATAATGGAA TGAACTTGTC TGTAAACATC CAG 93(2)序列49资料(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列49CATGTACGAA CCGCCAGG 18(2)序列50资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型cDNA(xi)序列描述序列50AATGACCAGA GAGAGGCGAG20(2)序列51资料(i)序列特征(A)长度10个氨基酸(B)类型氨基酸(C)链型单链(D)拓朴结构线性
(ii)分子类型cDNA(xi)序列描述序列51Ala Val Val Met Thr Gln Thr pro Ala Ser1 5 10(2)序列52资料(i)序列特征(A)长度1741个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ix)特征(A)名称/索引CDS(B)位置453..1706(xi)序列描述序列52GCCCCCGCCG AGCGCTCCGC GCGCAGCCGC CGGGCCGGGC CGGCCCGCGG AGGGCGCGCT 60GCGAGCGGCC ACTGGGTCCT GCTTCCCTCC TTCCTCTCCC TCCTCCTCCT CCTCCTTCTC 120TCTGCGCTTT CCACCGCTCC CGAGCGAGCG CACGCTCGGA TGTCCGGTTT CCTGGTGGGT 180TTTTTACCTG GCAAAGTCCG GATAACTTCG GTGAGAATTT GCAAAGAGGC TGGGAGCTCC 240CCTGCAGGCG TCTGGGAGCT GCTGCCGCCG TCGCATCTTC TCCATCCCGC GGATTTTACT 300GCCTTGGATA TTGCGAGGGG AGGGAGGGGG GTGAGGACAG CAAAAAGAAA GGGGTGGGGG 360GGGGGAGAGA AAAGGAAAAG AAGGAGCCTC GGAATTGTGC CCGCATTCCT GCGCTGCCCC 420GCGGCCCCCC TCCGCTCTGC CATCTCCGCA CA ATG CAC TTG CTG GAG ATG CTC 473Met His Leu Leu Glu Met Leu1 5TCC CTG GGC TGC TGC CTC GCT GCT GGC GCC GTG CTC CTG GGA CCC CGG 521Ser Leu Gly Cys Cys Leu Ala Ala Gly Ala Val Leu Leu Gly Pro Arg10 15 20CAG CCG CCC GTC GCC GCC GCC TAC GAG TCC GGG CAC GGC TAC TAC GAG 569Gln Pro Pro Val Ala Ala Ala Tyr Glu Ser Gly His Gly Tyr Tyr Glu25 30 35GAG GAG CCC GGT GCC GGG GAA CCC AAG GCT CAT GCA AGC AAA GAC CTG 617Glu Glu Pro Gly Ala Gly Glu Pro Lys Ala His Ala Ser Lys Asp Leu40 45 50 55GAA GAG CAG TTG CGA TCT GTG TCC AGT GTG GAT GAA CTC ATG ACA GTA 665Glu Glu Gln Leu Arg Ser Val Ser Ser Val Asp Glu Leu Met Thr Val60 65 70CTT TAC CCA GAA TAC TGG AAA ATG TTC AAA TGT CAG TTG AGG AAA GGA 713Leu Tyr Pro Glu Tyr Trp Lys Met Phe Lys Cys Gln Leu Arg Lys Gly75 80 85GGT TGG CAA CAC AAC AGG GAA CAC TCC AGC TCT GAT ACA AGA TCA GAT 761Gly Trp Gln His Asn Arg Glu His Ser Ser Ser Asp Thr Arg Ser Asp90 95 100GAT TCA TTG AAA TTT GCC GCA GCA CAT TAT AAT GCA GAG ATC CTG AAA 809Asp Ser Leu Lys Phe Ala Ala Ala His Tyr Asn Ala Glu Ile Leu Lys105 110 115AGT ATT GAT ACT GAA TGG AGA AAA ACC CAG GGC ATG CCA CGT GAA GTG 857Ser Ile Asp Thr Glu Trp Arg Lys Thr Gln Gly Met Pro Arg Glu Val120 125 130 135TGT GTG GAT TTG GGG AAA GAG TTT GGA GCA ACT ACA AAC ACC TTC TTT 905Cys Val Asp Leu Gly Lys Glu Phe Gly Ala Thr Thr Asn Thr Phe Phe140 145 150AAA CCC CCG TGT GTA TCC ATC TAC AGA TGT GGA GGT TGC TGC AAT AGT 953Lys Pro Pro Cys Val Ser Ile Tyr Arg Cys Gly Gly Cys Cys Asn Ser155 160 165GAA GGA CTC CAG TGT ATG AAT ATC AGC ACA AAT TAC ATC AGC AAG ACA 1001Glu Gly Leu Gln Cys Met Asn Ile Ser Thr Asn Tyr Ile Ser Lys Thr170 175 180TTG TTT GAG ATT ACA GTG CCT CTC TCT CAT GGC CCC AAA CCT GTA ACA 1049Leu Phe Glu Ile Thr Val Pro Leu Ser His Gly Pro Lys Pro Val Thr185 190 195GTC AGT TTT GCC AAT CAC ACG TCC TGC CGA TGC ATG TCT AAG TTG GAT 1097Val Ser Phe Ala Asn His Thr Ser Cys Arg Cys Met Ser Lys Leu Asp200 205 210 215GTT TAC AGA CAA GTT CAT TCT ATC ATA AGA CGT TCC TTG CCA GCA ACA 1145Val Tyr Arg Gln Val His Ser Ile Ile Arg Arg Ser Leu Pro Ala Thr220 225 230CAA ACT CAG TGT CAT GTG GCA AAC AAG ACC TGT CCA AAA AAT CAT GTC 1193Gln Thr Gln Cys His Val Ala Asn Lys Thr Cys Pro Lys Asn His Val235 240 245TGG AAT AAT CAG ATT TGC AGA TGC TTA GCA CAG CAC GAT TTT GGT TTC 1241Trp Asn Asn Gln Ile Cys Arg Cys Leu Ala Gln His Asp Phe Gly Phe250 255 260TCT TCT CAC CTT GGA GAT TCT GAC ACA TCT GAA GGA TTC CAT ATT TGT 1289Ser Ser His Leu Gly Asp Ser Asp Thr Ser Glu Gly Phe His Ile Cys265 270 275GGG CCC AAC AAA GAG CTG GAT GAA GAA ACC TGT CAA TGC GTC TGC AAA 1337Gly Pro Asn Lys Glu Leu Asp Glu Glu Thr Cys Gln Cys Val Cys Lys280 285 290 295GGA GGT GTG CGG CCC ATA AGC TGT GGC CCT CAC AAA GAA CTA GAC AGG 1385Gly Gly Val Arg Pro Ile Ser Cys Gly Pro His Lys Glu Leu Asp Arg300 305 310GCA TCA TGT CAG TGC ATG TGC AAA AAC AAA CTG CTC CCC AGT TCC TGT 1433Ala Ser Cys Gln Cys Met Cys Lys Asn Lys Leu Leu Pro Ser Ser Cys315 320 325GGG CCT AAC AAA GAA TTT GAT GAA GAA AAG TGC CAG TGT GTA TGT AAA 1481Gly Pro Asn Lys Glu Phe Asp Glu Glu Lys Cys Gln Cys Val Cys Lys330 335 340AAG ACC TGT CCC AAA CAT CAT CCA CTA AAT CCT GCA AAA TGC ATC TGC 1529Lys Thr Cys Pro Lys His His Pro Leu Asn Pro Ala Lys Cys Ile Cys345 350 355GAA TGT ACA GAA TCT CCC AAT AAA TGT TTC TTA AAA GGA AAA AGA TTT 1577Glu Cys Thr Glu Ser Pro Asn Lys Cys Phe Leu Lys Gly Lys Arg Phe360 365 370 375CAT CAC CAG ACA TGC AGT TGT TAC AGA CCA CCA TGT ACA GTC CGA ACG 1625His His Gln Thr Cys Ser Cys Tyr Arg Pro Pro Cys Thr Val Arg Thr380 385 390AAA CGC TGT GAT GCT GGA TTT CTG TTA GCT GAA GAA GTG TGC CGC TGT 1673Lys Arg Cys Asp Ala Gly Phe Leu Leu Ala Glu Glu Val Cys Arg Cys395 400 405GTA CGC ACA TCT TGG AAA AGA CCA CTT ATG AAT TAAGCGAAGA AAGCACTACT1726Val Arg Thr Ser Trp Lys Arg Pro Leu Met Asn410 415CGCTATATAG TGTCG 1741(2)序列53资料(i)序列特征(A)长度418个氨基酸(B)类型氨基酸(D)拓朴结构线性(ii)分子类型蛋白质(xi)序列描述序列53Met His Leu Leu Glu Met Leu Ser Leu Gly Cys Cys Leu Ala Ala Gly1 5 10 15Ala Val Leu Leu Gly Pro Arg Gln Pro Pro Val Ala Ala Ala Tyr Glu20 25 30Ser Gly His Gly Tyr Tyr Glu Glu Glu Pro Gly Ala Gly Glu Pro Lys35 40 45Ala His Ala Ser Lys Asp Leu Glu Glu Gln Leu Arg Ser Val Ser Ser50 55 60Val Asp Glu Leu Met Thr Val Leu Tyr Pro Glu Tyr Trp Lys Met Phe65 70 75 80Lys Cys Gln Leu Arg Lys Gly Gly Trp Gln His Asn Arg Glu His Ser85 90 95Ser Ser Asp Thr Arg Ser Asp Asp Ser Leu Lys Phe Ala Ala Ala His100 105 110Tyr Asn Ala Glu Ile Leu Lys Ser Ile Asp Thr Glu Trp Arg Lys Thr115 120 125Gln Gly Met Pro Arg Glu Val Cys Val Asp Leu Gly Lys Glu Phe Gly130 135 140Ala Thr Thr Asn Thr Phe Phe Lys Pro Pro Cys Val Ser Ile Tyr Arg145 150 155 160Cys Gly Gly Cys Cys Asn Ser Glu Gly Leu Gln Cys Met Asn Ile Ser165 170 175Thr Asn Tyr Ile Ser Lys Thr Leu Phe Glu Ile Thr Val Pro Leu Ser180 185 190His Gly Pro Lys Pro Val Thr Val Ser Phe Ala Asn His Thr Ser Cys195 200 205Arg Cys Met Ser Lys Leu Asp Val Tyr Arg Gln Val His Ser Ile Ile210 215 220Arg Arg Ser Leu Pro Ala Thr Gln Thr Gln Cys His Val Ala Asn Lys225 230 235 240Thr Cys Pro Lys Asn His Val Trp Asn Asn Gln Ile Cys Arg Cys Leu245 250 255Ala Gln His Asp Phe Gly Phe Ser Ser His Leu Gly Asp Ser Asp Thr260 265 270Ser Glu Gly Phe His Ile Cys Gly Pro Asn Lys Glu Leu Asp Glu Glu275 280 285Thr Cys Gln Cys Val Cys Lys Gly Gly Val Arg Pro Ile Ser Cys Gly290 295 300Pro His Lys Glu Leu Asp Arg Ala Ser Cys Gln Cys Met Cys Lys Asn305 310 315 320Lys Leu Leu Pro Ser Ser Cys Gly Pro Asn Lys Glu Phe Asp Glu Glu325 330 335Lys Cys Gln Cys Val Cys Lys Lys Thr Cys Pro Lys His His Pro Leu340 345 350Asn Pro Ala Lys Cys Ile Cys Glu Cys Thr Glu Ser Pro Asn Lys Cys355 360 365Phe Leu Lys Gly Lys Arg Phe His His Gln Thr Cys Ser Cys Tyr Arg370 375 380Pro Pro Cys Thr Val Arg Thr Lys Arg Cys Asp Ala Gly Phe Leu Leu385 390 395 400Ala Glu Glu Val Cys Arg Cys Val Arg Thr Ser Trp Lys Arg Pro Leu405 410 415Met Asn(2)序列54资料(i)序列特征(A)长度1582个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(基因组)(xi)序列描述序列54CTAGAGTTGA ACCAGATAAG AAAGTCTCTT CTTCCGGTAA GATATTATGG ACCTATAACA 60TCTGTGTACT TAAAAGTAGA TTGGGAGTGA AAGGCAGACT TTTGATGTTC TGTACACTGT 120TGAAACCCCT TAGCGTGGTC CTCTGTAACC TGCTCACCCT GCCCCAAGGA GGCAGCTAGC 180CAATGCCACC AGCCCAACGG AAACCCCAGT GCTTTTCCAA TGGGGAAATG CAGTCACTTT 240TCTTTGGATG CTACACATCC TTTCTGGAAT ATGTCTCACA CACATCTCTC TTTATCACCC 300CCTTTTTCAA GTAAACCAAC TTCTTGCAGA AGCTGACAAT GTGTCTCTTT ACTCTCCACG 360AAGATTCTGG CCCTTCTCTT CACCTGTCAG AAGTTTAGGA TTCCAAAGGG ATCATTAGCA 420TCCATCCCAA CAGCCTGCAC TGCATCCTGA GAACTGCGGT TCTTGGATCA TCAGGCAACT 480TTCAACTACA CAGACCAAGG GAGAGAGGGG ACCCCTCCGA GGTCCCATAG GGTTCTCTGA 540CATAGTGATG ACCTTTTTCC AAACTTTGAG CAGGGCGCTG GGGGCCAGGC GTGCGGGAGG 600GAGGACAAGA ACTCGGGAGT GGCCGAGGAT AAAGCGGGGG CTCCCTCCAC CCCACGGTGC 660CCAGTTTCTC CCCGCTGCAC GTGGTCCAGG GTGGTCGCAT CACCTCTAAA GCCGGTCCCG 720CCAACCGCCA GCCCCGGGAC TGAACTTGCC CCTCCGGCCG CCCGCTCCCC GCAGGGGACA 780GGGGCGGGGA GGGAGAGATC CAGAGGGGGG CTGGGGGAGG TGGGNCCGCC GGGGAGGAGN 840CGAGGGAAAC GGGGAGCTCC AGGGAGACGG CTTCCGAGGG AGAGTGAGAG GGGAGGGCAG 900CCCGGGCTCG GCACGCTCCC TCCCTCGGCC GCTTTCTCTC ACATAAGCGC AGGCAGAGGG 960CGCGTCAGTC ATGCCCTGCC CCTGCGCCCG CCGCCGCCGC CGCCGCCGCT CAGCCCGGCG1020CGCTCTGGAG GATCCTGCGC CGCGGCGCTC CCGGGCCCCG CCGCCGCCAG CCGCCCCGGC1080GGCCCTCCTC CCGCCCCCGG CACCGCCGCC AGCGCCCCCG CCGCAGCGCC CGCGGCCCGG1140CTCCTCTCAC TTCGGGGAAG GGGAGGGAGG AGGGGGACGA GGGCTCTGGC GGGTTTGGAG1200GGGCTGAACA TCGCGGGGTG TTCTGGTGTC CCCCGCCCCG CCTCTCCAAA AAGCTACACC1260GACGCGGACC GCGGCGGCGT CCTCCCTCGC CCTCGCTTCA CCTCGCGGGC TCCGAATGCG1320GGGAGCTCGG ATGTCCGGTT TCCTGTGAGG CTTTTACCTG ACACCCGCCG CCTTTCCCCG1380GCACTGGCTG GGAGGGCGCC CTGCAAAGTT GGGAACGCGG AGCCCCGGAC CCGCTCCCGC1440CGCCTCCGGC TCGCCCAGGG GGGGTCGCCG GGAGGAGCCC GGGGGAGAGG GACCAGGAGG1500GGCCCGCGGC CTCGCAGGGG CGCCCGCGCC CCCACCCCTG CCCCCGCCAG CGGACCGGTC1560CCCCACCCCC GGTCCTTCCA CC 1582(2)序列55资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列55CACGGCTTAT GCAAGCAAAG 20(2)序列56资料(i)序列特征
(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列56AACACAGTTT TCCATAATAG 20(2)序列57资料(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列57GCCACGGTAG GTCTGCGT18(2)序列58资料(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列58TTTCTTTGAC AGGCTTAT18(2)序列59资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性
(ii)分子类型DNA(xi)序列描述序列59ATCTTGAAAA GTAAGTATGG G 21(2)序列60资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列60ATGACTTGAC AGGTATTGAT20(2)序列61资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列61AGCAAGACGG TGGGTATTGT20(2)序列62资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列62CCCTTCTTTG TAGTTATTTG AA 22(2)序列63资料
(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列63CCACAGTGAG TATGAATTAA20(2)序列64资料(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列64TTCTTCCAAA GGTGTCAG 18(2)序列65资料(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列65GGAGATGGTA GCAGAATG 18(2)序列66资料(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链
(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列66CTATTTGTCT AGACTCAACA GAT23(2)序列67资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列67CAAACATGCA GGTAAGAGAT CC 22(2)序列68资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列68TGTTCTCCTA GCTGTTACAG A 21(2)序列69资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列69GGCGAGGTCA AGGTAGGTGC AAGG 24(2)序列70资料(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列70ATTGTCTTTG ACAGGCTTTT TGAAGG 26(2)序列71资料(i)序列特征(A)长度21 bp(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列71GAGATCCTGA AAAGTAAGTA G 21(2)序列72资料(i)序列特征(A)长度24bp(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列72TGTGACTCGA CAGGTATTGA TAAT 24(2)序列73资料(i)序列特征(A)长度20bp(B)类型核酸
(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列73CTCAGCAAGA CGGTAGGTAT20(2)序列74资料(i)序列特征(A)长度25bp(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列74TTGTCCCTTG TAGTTGTTTG AAATT 25(2)序列75资料(i)序列特征(A)长度20bp(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列75ACATTACCAC AGTGAGTATG20(2)序列76资料(i)序列特征(A)长度26bp(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列76
(2)序列77资料(i)序列特征(A)长度23bp(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列77AATGTTGAAG ATGGTAAGTA AAA23(2)序列78资料(i)序列特征(A)长度16bp(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列78TCTAGACTCA ACCAAT16(2)序列79资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列79CAAACATGCA GGTAAGGAGT GT 22(2)序列80资料(i)序列特征(A)长度24个碱基对
(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列80TTTTCCCCTA GTTGTTACAG AAGA 24(2)序列81资料(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓朴结构线性(ii)分子类型DNA(xi)序列描述序列81Leu Ser Lys Thr Val Ser Gly Ser Glu Gln Asp Leu Pro H1s Glu Leu1 5 10 15His Val Glu
权利要求
1.一个能结合于Flt4受体酪氨酸激酶的纯化的和分离的多肽。
2.根据权利要求1的哺乳动物多肽。
3.根据权利要求1的人类多肽。
4.根据权利要求3的具有还原态下的SDS-PAGE测定的表观分子量约为32KD的多肽。
5.根据权利要求3的且基本上无其它的人类多肽的多肽。
6.按权利要求1的纯化和分离的多肽,所述多肽通过保藏为ATCC登记号97231的质粒pFLT4-L而编码。
7.根据权利要求1的且具有含序列33的一部分的氨基酸序列的多肽。
8.根据权利要求1的多肽,其包括如序列33所示的从序列33的约161位到约211位残基的氨基酸序列。
9.根据权利要求1的多肽,其包括如序列33所示的从序列33的约131位到约211位残基的氨基酸序列。
10.根据权利要求1的多肽,其包括序列33所示的从序列33的约113到213位残基的氨基酸序列。
11.根据权利要求1的多肽,其包括序列33所示的约从序列33的约113到227位残基的氨基酸序列。
12.根据权利要求1的多肽,其包括序列33的约103到217位氨基酸。
13.按权利要求1的多肽,其包括序列33的约103-225位氨基酸。
14.按权利要求1的多肽,其包括序列33的约103-227位氨基酸。
15.根据权利要求1的多肽,其包括序列33的约32-227位氨基酸。
16.根据权利要求1-15中任一项的多肽,其中所述多肽能刺激在表达该Flt4受体酪氨酸激酶的宿主细胞中的Flt4受体酪氨酸激酶的酪氨酸磷酸化。
17.按权利要求1所述的多肽,其具有序列33的约1到499位氨基酸残基。
18.按权利要求1-17中任一项的多肽,其进一步包括一个可检测的标记。
19.一个纯化的含有结合于第二个多肽的第一个多肽的蛋白质,其中该第一个多肽和第二个多肽的至少一个是根据权利要求1-17中任一项的多肽,而其中的蛋白能结合于Flt4受体酪氨酸激酶。
20.根据权利要求19的纯化蛋白,其中所述第一个多肽共价连接到所述的第二个多肽。
21.根据权利要求19的纯化蛋白,其中所述的第一个多肽和第二个多肽的每一个均是一个根据权利要求1-17中任一项的多肽。
22.一个纯化和分离的核酸,其包括编码按权利要求1-17中任一项的多肽的核苷酸序列。
23.按权利要求22的核酸,其包括编码由序列33的约113-213位氨基酸所组成的多肽的核苷酸序列。
24.按权利要求22的核酸,其包括编码由序列33的约103-217位氨基酸所组成的多肽的核苷酸序列。
25.按权利要求22的核酸,其具有序列32的约352到1608位核苷酸的核苷酸序列。
26.按权利要求22的核酸,其包括编码VEGF-C的以ATCC登记号97321保藏的质粒pFLT4-L的插入片段的VEGF-C。
27.包括根据权利要求22-26中任一项的核酸的载体。
28.用按权利要求22-26中任一项的核酸转化或转染的宿主细胞。
29.能特异性地和根据权利要求1-17中任一项的多肽反应的抗体。
30.一个按权利要求29的抗体,其为单克隆抗体。
31.一种在药学可接受的溶剂,佐剂,赋形剂,或载体中含有根据权利要求1-17中任一项的多肽的药用组合物。
32.制备能特异性地结合于Flt4受体酪氨酸激酶的多肽的方法,该方法包括步骤(a)在宿主细胞中表达按权利要求22-26任一的核酸;以及(b)从该宿主细胞或所述宿主细胞的生长培养基中纯化能特异性结合于Flt4受体酪氨酸激酶的多肽。
33.能特异性地结合于Flt4受体酪氨酸激酶的多肽,该多肽是通过根据权利要求32的方法生产的。
34.根据权利要求1的鼠多肽。
35.根据权利要求34的多肽,其包括序列41所示的氨基酸序列的一部分,该部分能特异性地结合于Flt4受体酪氨酸激酶。
36.纯化和分离编码按权利要求34或35的多肽的核酸。
37.纯化和分离至少具有大约16个核苷酸的核酸,该核酸能特异性地杂交到编码VEGF-C的人基因。
38.根据权利要求37的核酸,其杂交到编码VEGF-C的人基因上,杂交条件为其中核酸不能杂交于编码VEGF或VEGF-B的人基因,并且其中该核酸包括选择于序列32和互补于序列32的核苷酸序列的至少20个核苷酸的连续的核苷酸序列。
39.在生物组织中检测内皮细胞的方法,包括步骤将含有内皮的细胞生物组织暴露于按权利要求1-18中任一项的多肽,其是在该多肽能结合于内皮细胞的条件下;以及检测结合于所述生物组织中的内皮细胞的所述多肽,从而检测该内皮细胞。
40.根据权利要求39的方法,进一步包括洗涤该生物组织的步骤,该洗涤步骤在所述暴露步骤后并在检测步骤前进行。
41.调节哺乳动物内皮细胞生长的方法,包括步骤将哺乳动物内皮细胞暴露于以有效量存在的按权利要求1-17中任一项的多肽中以调节哺乳动物内皮细胞的生长。
42.纯化和分离的能结合于Kdr(VEGFR-2)的多肽,该多肽具有含序列33的一部分的氨基酸序列。
43.一种纯化的含有VEGF-C启动子的核酸。
44.按权利要求43的核酸,其包括序列54的一部分,而该部分能在VEGF-C表达于天然宿主细胞的条件下促进操作地与其连接的编码蛋白的基因的表达。
全文摘要
本发明提供了受体酪氨酸激酶,Flt4的多肽配体。也提供了编码该配体的cDNA和载体,含有该配体的药用组合物和诊断试剂,以及制备和使用这些配体的方法。
文档编号C07K16/24GK1242043SQ96197353
公开日2000年1月19日 申请日期1996年8月1日 优先权日1996年8月1日
发明者卡里·阿利塔罗, 弗拉迪米尔·乔科夫 申请人:赫尔辛基大学许可有限公司, 路德维格癌症研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1