一种前胶原c末端蛋白酶增强蛋白及编码它的多核苷酸序列的制作方法

文档序号:442836阅读:301来源:国知局
专利名称:一种前胶原c末端蛋白酶增强蛋白及编码它的多核苷酸序列的制作方法
技术领域
本发明公开了一种新的分离的前胶原C末端蛋白酶增强蛋白(前胶原C末端蛋白酶增强蛋白37,以下简称为PCOLCE37)基因的多核苷酸序列及其编码的多肽,以及制备这种多肽的方法。本发明也公开了将这种多肽用于多种疾病,如恶性肿瘤、免疫性疾病、Langer-Giedion综合症、Ehlers-Danlos综合症、生长发育障碍性疾病等的治疗方法。此外,本发明还公开了通过鉴别PCOLCE37的核酸序列中的突变和PCOLCE37水平改变,检测与该基因的核酸及其编码多肽异常有关的疾病的诊断方法。本发明还公开了利用本发明多肽筛选该多肽的拮抗剂、激动剂、抑制物的方法,以及制备针对本发明多肽的抗体的方法,也公开了利用本发明基因的多核苷酸序列和多肽及其拮抗剂、激动剂、抑制物和抗体治疗与该基因异常有关的疾病的用途和用于制备用于上述治疗的药物组合物的用途。
胶原是动物体含量最丰富的蛋白质,它广泛分布于体内各种器官和组织,是细胞外基质中的框架结构。目前已发现的各种类型胶原分子虽然结构不同,但其基本结构单位均为由3条肽链构成的3股螺旋结构。胶原基因翻译出的前α肽链借二硫键形成链间交联,使3条前α链“对齐”排列,然后从C端向N端形成三股螺旋结构。带有前肽的三股螺旋原分子称为前胶原。
前胶原从细胞内分泌到细胞外成为成熟的三螺旋胶原分子时,其两端非螺旋卷曲被相应的前胶原N、C末端蛋白酶剪切去除。在鼠类,原胶原C端蛋白酶增强蛋白有三种,分别为55KD的糖蛋白,和同一蛋白降解的小分子量的36KD、34KD蛋白。这三种增强蛋白都可提高一个数量级的C末端蛋白酶活性。研究表明36KD和55KD的N端相同,这是鼠和人增强蛋白最保守的区域,包含二个结构域,这二个结构域与许多蛋白酶和发育功能蛋白所特有的结构域同源,被认为具有调节蛋白质与蛋白质相互作用的功能。
Takahara等人从小鼠纤维母细胞培养基纯化了Ⅰ型前胶原C末端蛋白酶增强蛋白,这种糖蛋白可与Ⅰ型前胶原的C末端前肽相结合并发挥其C末端蛋白酶增强功能。从其cDNA序列推测该蛋白质由约468个氨基酸构成,分子量50KD。人cDNA则编码449个氨基酸。鼠增强蛋白RNA在胶原富裕组织,尤其肌腱中表现出高表达。PCOLCE染色体定位7q21.3-q22(Takahara,K.等人,生物化学杂志(J Biol Chem),1994;269(42):26280-5)。
人和鼠PCOLCE基因分别为6.0和6.5Kb,各含有保守的内含子/外含子结构,其中,外含子为9个。两种基因显著不同在于多重Alu序列直接插入人PCOLCE基因上游、下游和内部。在鼠发育过程中,PCPEmRNA的短暂表达具有C末端蛋白酶增强活性。在子宫纤维瘤中,PCOLCE表达水平较高,可能发挥一定的作用。(Scott IC等人,基因组学(Genomics)1999年1月15;55(2):229-34)。
如上所述前胶原C末端蛋白酶增强蛋白在调节细胞生长发育等机体重要功能中起重要作用,因而本领域中一直需要鉴定更多种类的参与这些过程的前胶原C末端蛋白酶增强蛋白,特别是鉴定这些前胶原C末端蛋白酶增强蛋白的氨基酸序列。本发明提供了一种新的前胶原C末端蛋白酶增强蛋白及其编码基因,为进一步明确该类蛋白质在健康和疾病状态下的作用提供了基础。这种蛋白可能构成开发疾病诊断和/或治疗药的基础,因此分离其编码DNA是非常重要的。可用于其相关疾病的诊断和治疗。
本发明的目的就是提供一种新的前胶原C末端蛋白酶增强蛋白及编码它的多核苷酸。本发明的多肽具有前胶原C末端蛋白酶增强蛋白基因的特征结构域,因而推断本发明的PCOLCE37是一种新的这类蛋白质。
本发明涉及一种分离的多肽,它包含具有SEQ ID No.2氨基酸序列的多肽、或其保守性变体、生物活性片段或衍生物。
本发明还涉及一种分离的多核苷酸,它包含选自下组的一种核苷酸序列或其变体
(a)编码具有SEQ ID No.2氨基酸序列的多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸;(c)与(a)或(b)的多核苷酸序列具有至少70%相同性的多核苷酸。特别地,所述多核苷酸序列选自(a)具有SEQ ID NO:1中128-1135位的序列;和(b)具有SEQ ID NO:1中1-1592位的序列。
本发明另外涉及一种含有本发明多核苷酸的载体,特别是表达载体;一种用该载体遗传工程化的宿主细胞,包括转化、转导或转染的宿主细胞;一种包括培养所述宿主细胞和回收表达产物的制备本发明多肽的方法。
本发明还涉及一种能与本发明多肽特异性结合的抗体。
本发明还涉及一种筛选的模拟、激活、拮抗或抑制该蛋白活性的化合物的方法,其包括利用本发明的多肽。本发明还涉及用该方法获得的化合物。
本发明还涉及一种体外检测与该前胶原C末端蛋白酶增强蛋白异常表达相关的疾病或疾病易感性的方法,包括检测生物样品中所述多肽或其编码多核苷酸序列中的突变,或者检测生物样品中本发明多肽的量或生物活性。
本发明也涉及一种药物组合物,它含有本发明多肽或其模拟物、激活剂、拮抗剂或抑制剂以及药学上可接受的载体。
本发明还涉及本发明的多肽和/或多核苷酸在制备用于治疗癌症、免疫性疾病如Langer-Giedion综合症,Ehlers-Danlos综合症、生长发育障碍性疾病或其它由于PCOLCE37表达异常所引起的疾病的药物中的用途。
本发明还涉及本发明多肽的拮抗剂或反义多核苷酸在制备用于治疗癌症、免疫性疾病如Langer-Giedion综合症,Ehlers-Danlos综合症、生长发育障碍性疾病或其它由于PCOLCE37表达异常所引起的疾病等药物中的用途。


图1是本发明PCOLCE37和人前胶原C末端蛋白酶增强蛋白2的氨基酸序列(共选择了266个氨基酸)同源性比较图。上方序列(Query)是PCOLCE37,下方序列(Sbjct)是人前胶原C末端蛋白酶增强蛋白2。相同氨基酸在两个序列间用单字符氨基酸表示,相似氨基酸用“+”表示。二者在所比较的266个氨基酸区域中相同性(266/266)为100%。
图2为分离的PCOLCE37的聚丙烯酰胺凝胶电泳图(SDS-PAGE)。其中泳道1为蛋白质分子量标准,泳道2、3为含有目标蛋白质的样品,泳道4为经纯化的目标蛋白质(箭头所指),分子量大小为37kDa。
本发明上述的和其它的方面对于本领域的技术人员来说,从本文以下的详细描述看应该是很清楚的。
本说明书和权利要求书中使用的下列术语除非特别说明具有如下的含义“核酸序列”是指寡核苷酸、核苷酸或多核苷酸及其片段或部分,也可以指基因组或合成的DNA或RNA,它们可以是单链或双链的,代表有义链或反义链。类似地,术语“氨基酸序列”是指寡肽、肽、多肽或蛋白质序列及其片段或部分。当本发明中的“氨基酸序列”涉及一种天然存在的蛋白质分子的氨基酸序列时,这种“多肽”或“蛋白质”不意味着将氨基酸序列限制为与所述蛋白质分子相关的完整的天然氨基酸。
蛋白质或多核苷酸“变体”是指一种具有一个或多个氨基酸或核苷酸改变的氨基酸序列或编码它的多核苷酸序列。所述改变可包括氨基酸序列或核苷酸序列中氨基酸或核苷酸的缺失、插入或替换。变体可具有“保守性”改变,其中替换的氨基酸具有与原氨基酸相类似的结构或化学性质,如用亮氨酸替换异亮氨酸。变体也可具有非保守性改变,如用色氨酸替换甘氨酸。
“缺失”是指在氨基酸序列或核苷酸序列中一个或多个氨基酸或核苷酸的缺失。
“插入”或“添加”是指在氨基酸序列或核苷酸序列中的改变导致与天然存在的分子相比,一个或多个氨基酸或核苷酸的增加。
“替换”是指由不同的氨基酸或核苷酸替换一个或多个氨基酸或核苷酸。
“生物活性”是指具有天然分子的结构、调控或生物化学功能的蛋白质。类似地,术语“免疫学活性”是指天然的、重组的或合成蛋白质及其片段在合适的动物或细胞中诱导特定免疫反应以及与特异性抗体结合的能力。
“激动剂”是指当与PCOLCE37结合时,一种可引起该蛋白质改变从而调节该蛋白质活性的分子。激动剂可以包括蛋白质、核酸、碳水化合物或任何其它可结合PCOLCE37的分子。
“拮抗剂”或“抑制物”是指当与PCOLCE37结合时,一种可封闭或调节PCOLCE37的生物学活性或免疫学活性的分子。拮抗剂和抑制物可以包括蛋白质、核酸、碳水化合物或任何其它可结合PCOLCE37的分子。
“调节”是指PCOLCE37的功能发生改变,包括蛋白质活性的升高或降低、结合特性的改变及PCOLCE37的任何其它生物学性质、功能或免疫性质的改变。
″基本上纯″是指基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化PCOLCE37。基本上纯的PCOLCE37在非还原性聚丙烯酰胺凝胶上能产生单一的主带。PCOLCE37多肽的纯度可用氨基酸序列分析。
“互补的”或“互补”是指在允许的盐浓度和温度条件下通过碱基配对的多核苷酸天然结合。例如,序列“C-T-G-A”可与互补的序列“G-A-C-T”结合。两个单链分子之间的互补可以是部分的或全部的。核酸链之间的互补程度对于核酸链之间杂交的效率及强度有明显影响。
“同源性”是指互补的程度,可以是部分同源或完全同源。“部分同源”是指一种部分互补的序列,其至少可部分抑制完全互补的序列与靶核酸的杂交。这种杂交的抑制可通过在严格性程度降低的条件下进行杂交(Southern印迹或Northern印迹等)来检测。基本上同源的序列或杂交探针可竞争和抑制完全同源的序列与靶序列在的严格性程度降低的条件下的结合。这并不意味严格性程度降低的条件允许非特异性结合,因为严格性程度降低的条件要求两条序列相互的结合为特异性或选择性相互作用。
“相同性百分率”是指在两种或多种氨基酸或核酸序列比较中序列相同或相似的百分率。可用电子方法测定相同性百分率,如通过MEGALIGN程序(Lasergene软件包,DNASTAR,Inc.,MadisonWis.)。MEGALIGN程序可根据不同的方法如Cluster法比较两种或多种序列(Higgins,D.G.和P.M.Sharp(1988),基因,73:237-244)。Cluster法通过检查所有配对之间的距离将各组序列排列成簇。然后将各簇以成对或成组分配。两个氨基酸序列如序列A和序列B之间的相同性百分率通过下式计算 也可以通过Cluster法或用本领域周知的方法如Jotun Hein测定核酸序列之间的相同性百分率(Hein J.,(1990)酶学方法(Methods inenzymology)183:625-645)。
“相似性”是指氨基酸序列之间排列对比时相应位置氨基酸残基的相同或保守性取代的程度。用于保守性取代的氨基酸例如,带负电荷的氨基酸可包括天冬氨酸和谷氨酸;带正电荷的氨基酸可包括赖氨酸和精氨酸;具有不带电荷的头部基团有相似亲水性的氨基酸可包括亮氨酸、异亮氨酸和缬氨酸;甘氨酸和丙氨酸;天冬酰胺和谷氨酰胺;丝氨酸和苏氨酸;苯丙氨酸和酪氨酸。
“反义”是指与特定的DNA或RNA序列互补的核苷酸序列。“反义链”是指与“有义链”互补的核酸链。
“衍生物”是指PCOLCE37或编码其的核酸的化学修饰物。这种化学修饰物可以是用烷基、酰基或氨基替换氢原子。核酸衍生物可编码保留天然分子的主要生物学特性的多肽。
“抗体”是指完整的抗体分子及其片段,如Fa、F(ab’)2及Fv,其能特异性结合PCOLCE37的抗原决定簇。
“分离的”一词指将物质从它原来的环境(例如,若是自然产生的就指其天然环境)之中移出。比如说,一个自然产生的多核苷酸或多肽存在于活动物中就是没有被分离出来,但同样的多核苷酸或多肽同一些或全部在自然系统中与之共存的物质分开就是分离的。这样的多核苷酸可能是某一载体的一部分,也可能这样的多核苷酸或多肽是某一组合物的一部分。既然载体或组合物不是它天然环境的成分,它们仍然是分离的。
本发明一方面提供了一种新的人前胶原C末端蛋白酶增强蛋白,及其具有生物活性的的片段、类似物和衍生物。本发明的另一方面,提供了编码这些多肽的分离的核酸分子,包括mRNA、DNA、cDNA和基因组DNA,及其具有生物活性的片段、类似物和衍生物。本发明的再一方面提供了核酸的探针,它包含足够长度的核酸分子以及与PCOLCE37基因序列进行特异性杂交的序列。
依据本发明的一方面,它提供了一种分离的多核苷酸,这些核苷酸编码具有SEQ ID No.2所示的推定的氨基酸序列的多肽。
编码PCOLCE37的多核苷酸可以从许多成人和胎儿的cDNA文库中分离,如人胎脑cDNA文库。SEQ ID No.1所示的多核苷酸序列全长为1592个碱基,其开放阅读框架(SEQ ID NO:1中128-1135)具有编码一个335个氨基酸残基的多肽。根据氨基酸序列同源比较发现,此多肽与人前胶原C末端蛋白酶增强蛋白2有266/266(100%)的相同性,推测此新多肽具有与人前胶原C末端蛋白酶增强蛋白2相似的功能。
本发明的多核苷酸可以RNA或DNA的形式存在,其中DNA包括cDNA、基因组DNA和合成的DNA。DNA可以是双链或者单链的,单链也可以是有义链或者反义链。编码多肽的多核苷酸序列可以与SEQ IDNo.1所示的多核苷酸序列相同,或者可以是一个由于遗传密码的冗余或简并性而不同的多核苷酸序列,但它与SEQ ID No.1编码相同的成熟多肽。
编码SEQ ID No.2的多肽的多核苷酸可以包括仅仅编码成熟多肽的多核苷酸序列(如SEQ ID No.1中128-1135位多核苷酸)、包含编码成熟多肽的多核苷酸序列和任选的其它编码序列或非编码序列(例如内含子或编码成熟多肽的多核苷酸序列5’端和/或3’端的非编码序列)的多核苷酸序列(如SEQ ID No.1中1-1592位多核苷酸)。
本发明进一步涉及上面所描述的多核苷酸的各种变体,它们编码含有SEQ ID No.2所示的推定的氨基酸序列多肽的片段、类似物和衍生物。这些多核苷酸变体可以是天然存在的等位基因变体或非天然存在的多核苷酸变体。
编码本发明多肽的多核苷酸也可能与特定的标记序列在同一读框中相融合,标记序列可帮助本发明多肽的纯化。标记序列在使用细菌宿主时可以是pQE载体的六聚组氨酸标记,以利于融合有标记的成熟多肽的纯化,或者当使用哺乳类宿主(如猴肾成纤维细胞的COS-7细胞系)时,标记序列可以是一种血细胞凝集素(HA)标记。此外,包含编码本发明多肽的多核苷酸序列还可包含同源或异源的特定信号肽序列,以帮助目的蛋白质分泌到原核细胞或真核细胞膜外。本领域普通技术人员知晓,上述标记序列和信号肽序列也可通过重组方法或化学法添加在用于表达本发明多肽的载体上。
本发明的多核苷酸序列也包括全长cDNA的片段,例如编码SEQ IDNo.2中至少20个,优选至少30个,更优选至少50个,最好至少80个氨基酸的多核苷酸片段。这些片段例如具有SEQID No.1所示序列中连续的至少10个,优选的至少20个核苷酸,更优选的至少50个核苷酸,特别是至少60、90、150或240个核苷酸。
本发明进一步涉及能与上述序列杂交的多核苷酸,这两个序列间至少有70%,较优选至少80%,优选至少90%,更优选至少95%的同源性。本发明特别涉及在严格条件下能与上述多核苷酸杂交的多核苷酸。这里所用的术语“严格条件”意味着两序列之间有95%,优选至少97%同源性才能发生杂交。在一优选的实施方案中,与上述多核苷酸互补链杂交的多核苷酸编码的多肽基本保持了与SEQ ID No.2所示多肽相同的生物功能或活性。
另外,本发明涉及可与本发明的多核苷酸杂交的多核苷酸,其至少含20个碱基,优选至少30个碱基,更优选至少50个碱基并且具有上面所描述的同源性,其可以保留或不保留活性。例如,这样的多核苷酸可以用作为检测SEQ ID No.1所示多核苷酸或其它来源的相似序列的探针;又如,其可以用于本发明多核苷酸的回收或者作为一种诊断探针或PCR引物。
本发明的DNA序列可用多种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于1)用探针与基因组或cDNA文库杂交以检出同源性多核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码PCOLCE37的特异DNA片段序列也能用下列方法获得1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞中分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是本领域技术人员周知的方法(Sambrook等人,分子克隆实验室手册(Molecular Cloning,a Laboratory Manual),冷泉港实验室,纽约,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的多核苷酸序列。这些方法包括但不限于(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定PCOLCE37的转录本的水平;(4)应用免疫学技术或测定生物学活性检测基因表达的蛋白产物。上述方法可单独使用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针可与本发明多核苷酸的任何一部分具有相同性,其长度至少是15个核苷酸,优选是20-30个核苷酸,更优选是50-60个核苷酸,最优选是100个核苷酸以上。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用做探针。DNA探针可用放射性同位素、荧光素或酶(如碱性磷酸酶)等标记。第(4)种方法中,检测PCOLCE37基因表达的蛋白产物可用免疫学技术如Western印迹、放射免疫沉淀法、酶联免疫吸附法(ELISA)等。
由于本申请提供了PCOLCE37的全长cDNA序列,应用PCR技术扩增DNA/RNA的方法(Saiki,等人,科学(Science)1985;230:1350-1354)优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE:cDNA末端快速扩增法),在上述PCR方面所用的引物根据本文所公开的本发明的序列信息可适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger等人,美国国家科学院院报,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,以拼接成全长的cDNA序列。
本发明的多核苷酸序列的全部或部分也可通过本领域周知的化学方法合成(Caruthers,M.H.等人,(1980)Nucl.Acids Res.Symp.Ser.215-223;Horn,T.等人,(1980)Nucl.Acid Res.Symp.Ser.225-232)。
本发明进一步涉及具有SEQ ID No.2所示推定氨基酸序列的多肽及其活性片段、类似物和衍生物。SEQ ID No.2所示推定氨基酸序列的多肽为一个含335个氨基酸残基的多肽。
SEQ ID No.2所示多肽的“片段”、“衍生物”和“类似物”指能基本保留该多肽的生物学功能或活性的多肽或无活性的前体。由此,本发明的多肽包括了其前原蛋白、前蛋白和蛋白原等形式,其经过加工后(如蛋白质水解或修饰)可被激活,产生一个有活性的成熟多肽。
本发明的多肽可以是重组多肽、天然存在的多肽或合成的多肽,优选为重组多肽。SEQ ID No.2所示的多肽的片段、衍生物和类似物可以是(ⅰ)一个或多个氨基酸残基被保守性或非保守性氨基酸残基所取代(优选是保守性氨基酸残基)的多肽,取代的氨基酸残基是或不是由遗传密码所编码的氨基酸。例如,可以通过氨基酸残基的插入、取代和/或删除,得到PCOLCE37的沉默突变体或功能等同物。可基于氨基酸残基之间在极性、电荷、溶解性、疏水性、亲水性和/或两亲性等方面的相似性进行保守性氨基酸取代,只要保留PCOLCE37的活性;或(ⅱ)一个或多个氨基酸残基带有取代基团的多肽;或(ⅲ)成熟多肽与其它功能性化合物,如提高多肽半寿期的化合物(例如聚乙二醇)融合在一起的多肽;或(ⅳ)成熟多肽与其它氨基酸序列相融合的多肽,其中所述其它氨基酸序列包括诸如帮助纯化成熟蛋白的氨基酸序列或蛋白原序列等。这些帮助纯化的结构域包括但不限于金属鳌合肽,如用于在固定化金属上纯化的组氨酸-色氨酸模块;用于在固定化免疫球蛋白上纯化的蛋白A结构域以及用于FLAGS延伸/亲和纯化系统的结构域(IMMUNEX公司,Seattle,Wash)。特异于因子XA或肠激酶的断裂接头序列也可用于帮助目的蛋白质的纯化(Porath,J.等人(1992),Prot.Exp.Purif.3:263-281)。从这些公开内容看,这样的片段、衍生物和类似物的应处于本领域技术人员的知识范围内。
本发明的多肽包括SEQ ID No.2所示的多肽(特别指成熟多肽),也包括与SEQ ID No.2多肽至少有70%相似性(优选是70%相同性)的多肽,优选至少有90%相似性(优选是90%的相同性)的多肽,更优选至少有95%相似性(优选是95%相同性)的多肽,也包括这些多肽的一些部分,通常这些多肽部分至少含有30个氨基酸、优选至少50个氨基酸。
本发明的多肽、其保守性变体和生物活性片段及衍生物可以用常规的肽合成的方法制备,例如固相肽合成(Merrifield J.(1963),美国化学会杂志(J.Am.Chem.Soc.)85:2149-2154;Roberge,J.Y.等人,(1995)科学,269:202-204)。蛋白质合成可以手工完成,也可利用肽自动合成仪如Applied Biosystems 431A肽合成仪进行(Perkin Elmer)。本发明多肽也可以从天然生物材料中经分离纯化得到,但优选利用本发明提供的多核苷酸用重组DNA技术制备。根据重组生产方法中所用的宿主不同,本发明中的多肽可能被糖基化或不被糖基化。该多肽也可能具有起始的甲硫氨酸残基。
根据普通的重组DNA技术,利用本发明的多核苷酸序列可表达或制备重组的PCOLCE37多肽(科学,1984;224:1431)。本发明因而涉及制备本发明PCOLCE37多肽的方法,一般包括以下步骤(1)用本发明编码PCOLCE37的多核苷酸(或变体)或含有该多核苷酸的重组表达载体转化合适的宿主细胞;(2)在合适的培养基中及适当的培养条件下培养宿主细胞;(3)从培养基或细胞中分离、纯化目的蛋白质。
本发明也涉及包含本发明多核苷酸的重组载体、带有本发明重组载体的遗传工程化宿主细胞和通过重组技术制备本发明多肽的方法。
本发明的多核苷酸可以用来经重组技术产生多肽。例如,该多核苷酸可以存在于选自多种用于表达多肽的表达载体中的任一载体上,这些载体包括染色体的、非染色体的及合成的DNA序列,例如,SV40的衍生物、细菌质粒、噬菌体DNA、酵母质粒、衍生于质粒和噬菌体DNA结合的载体、病毒DNA、杆状病毒、牛痘病毒、腺病毒、禽痘病毒及伪狂犬病毒,包括但不限于pQE系列(Qiagen)、pBS、pD10、phagescript、psiX174、pBluescript SK、pBSKS、pNH系列(Stratagene)、pTRC99a、pKK223-3、pDR540、pRIT5(Pharmacia);pWLNEO、pSV2CAT、pOG44、pXT1、pSG(Stratagene)、pSVK3、pBPV、pMSG、pSVL(Pharmacia)。不过,只要是能在宿主中复制和存活,其它质粒或载体也可应用。
本发明也包括含有本发明多核苷酸的重组构建体。该构建体包括载体,如上述质粒或病毒载体,其中可正向或反向插入本发明的多核苷酸序列。构建体中还包含调节序列,例如,有效地连接到本发明多核苷酸序列上的启动子(包括组成型和诱导型启动子),介导下游结构序列的转录。合适的启动子包括但不限于,λ噬菌体的PL启动子、杆状病毒多角体蛋白启动子;细菌启动子如;LacI、LacZ、T3、T7、gpt、λPR、PL和trp;真核启动子如CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、逆转录病毒的LTR和小鼠金属硫蛋白I启动子;还包括衍生自植物细胞基因组中的启动子,如热休克蛋白、RUBISCO启动子。
表达载体也包含翻译起始所需要的核糖体结合位点和转录终止子,其还可以具有增强表达的合适序列,如增强子。增强子是DNA的顺式作用因子,通常有大约10-300bp,作用于启动子,提高它的转录。例如,SV40中位于复制起点后侧100-270bp处的增强子,巨细胞病毒早期启动子增强子、位于复制起点后侧的多形瘤增强子及腺病毒增强子。此外,表达载体优选还包含能提供表型特征的一种或多种选择性基因、抗性基因和/或标记基因,以便于转化宿主细胞的筛选。选择性基因如帮助细胞利用吲哚或组氨醇的trpB、hisD(Hartman,S.C.和R.C.Mulligan(1988)美国国家科学院院报85:8047-51),用于tk-或aprt-细胞的肝疱疹病毒胸腺嘧啶激酶(Wigler,M.等人(1977)细胞,11:223-32)和腺嘌呤磷酸核糖转移酶(Lowy,I.等人(1980)细胞,22:817-23);抗性基因如赋予氨甲蝶呤抗性的二氢叶酸还原酶DHFR(Wigler,M等人(1989),美国国家科学院院报,77:3567-70)或赋予新霉素和G-418抗性的npt(Colbere-Garapin,F.等人(1981)分子生物学杂志,150:1-14),以及四环素或氨苄青霉素抗性基因。哺乳类表达载体一般包括复制起点、适当的启动子、增强子及任何必需的核糖体结合位点、多腺苷化位点、拼接供体和受体位点、转录终止序列和5’侧翼非转录序列。衍生于SV40拼接序列的DNA序列和多腺苷化位点可用于提供所需要的非转录遗传元件。此外,包含编码本发明多肽的核苷酸序列的载体还可包含同源或异源的特定信号肽序列,以帮助目的蛋白质分泌到原核细胞或真核细胞膜外。本领域普通技术人员知晓,上述表达载体及构建体中含有的标记序列和信号肽序列也可通过重组方法或化学法添加在编码本发明多肽的多核苷酸上。
合适载体和启动子的选择为本领域普通技术人员周知。细菌适用的有效表达载体可以这样来构建将编码目的蛋白的结构DNA序列随同适当的翻译起始和终止信号被插入到带有一个功能启动子的可操纵的阅读框中。本领域普通技术人员周知用于构建含有本发明核苷酸序列以及合适的转录及翻译调控元件的方法。这些方法包括体外重组DNA技术、合成技术以及体内遗传重组技术(Sambrook,J.(1989),《分子克隆,实验室手册》,Cold Spring Harbor Press;Plainview,N.Y.;Ausubel,F.M.(1989)现代分子生物学方法(Current Protocols in MolecularBiology),John Wiley & Sons,N.Y.)。
包含上述合适的DNA序列、合适的启动子或控制序列的载体可以用于转化合适的宿主,让宿主表达该蛋白。
本领域技术人员知晓,根据本发明DNA序列所插入的表达载体或构建体的种类和特性选择合适的宿主以表达目的蛋白质。适于表达本发明的多肽的宿主包括但不限于原核宿主,诸如大肠杆菌、芽孢杆菌属、链霉菌属等;真核宿主,诸如酵母属、曲霉属、昆虫细胞,诸如果蝇S2和草地夜蛾Sf9;动物细胞,如CHO、COS(猴肾成纤维细胞系,Gluzman,细胞,23:175,1981)及其它的能表达相容载体的细胞系,例如C127、3T3、CHO、HeLa、BHK、Bowes黑素瘤细胞;植物细胞以及腺病毒等等。各种哺乳动物细胞的培养系统也能用于表达重组蛋白。从这些讲授看,合适宿主的选择应该在本领域技术人员的知识范围内。
带有如上所述的含有本发明核苷酸序列之载体或构建体能够通过传统的方法导入合适的宿主细胞中以产生重组产物。将构建体导入上述宿主细胞的方法为本领域技术人员周知,包括但不限于氯化钙介导的转化、磷酸钙转染、DEAE-葡聚糖介导的转染、电穿孔、显微注射、粒子轰击法或基因枪方法(Sambrook,J.(1989),《分子克隆,实验室手册》,Cold Spring Harbor Press;Plainview,N.Y.;Ausubel,F.M.(1989)现代分子生物方法,John Wiley & Sons,N.Y.;Hobbs,S.等人,McGraw Hill科技年鉴(1992),McGraw Hill,N.Y.191-196;Engelhard,E.K.等人,美国国家科学院院报,91:3224-3227;Logan,J.等人,美国国家科学院院报,81:3655-3659)。
在适当的培养条件与培养基中培养经转化的宿主菌株或细胞,使其生长到恰当的细胞密度之后,用适当的方法(例如温度转变或化学药品诱导)诱导所选择的启动子,并将细胞再培养一段时间。针对不同的宿主菌株或细胞选择以及所表达的目的蛋白质的性质相应的培养条件和培养基在本领域技术人员知识范围之内。
在合适的启动子控制下可以在哺乳类细胞、酵母、细菌或其它细胞中表达成熟蛋白。利用由本发明的DNA构建体衍生的RNA,也可以用无细胞翻译体系产生这种蛋白质(Sambrook,J.(1989),《分子克隆,实验室手册》,第18章第4节,Cold Spring Harbor Press;Plainview,N.Y.)。
通常用离心的方法收获细胞或培养液。对于目的蛋白质保留在胞内的情况,一般可用任何便捷的物理、化学方法或酶法,包括冻融循环、超声波、机械破碎,或使用细胞溶解剂或特定的酶破碎细胞,将粗提物保留以进一步纯化。对于对于目的蛋白质分泌到胞外的情况,可直接回收培养上清液。这些方法都是本领域的技术人员熟知的。
多肽可以从重组细胞培养物中回收和纯化出来,回收和纯化的方法有硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、体积排阻层析、疏水相互作用层析、亲和层析、羟基磷灰石层析和植物凝集素层析。形成成熟蛋白的完整构象还需要蛋白质的重折叠步骤。通常高效液相层析(HPLC)或毛细管电泳可应用于最后的纯化步骤。
本发明中的多核苷酸和多肽可用作研究试剂和材料,以发现人类疾病的治疗和诊断方法。这种多核苷酸和其编码的多肽也可用于体外的相关科学研究、DNA合成和DNA载体的制备,还用于设计治疗和诊断人类疾病的方法。
全长PCOLCE37基因的片段可以用作cDNA文库的杂交探针,从而分离出全长基因和与之有高度序列相似性或相似生物学活性的其它基因。这种类型的探针一般至少有20个碱基。但是,这些探针优选至少有30个碱基并且一般不超过50个碱基,尽管它们可以具有更多的碱基。该探针也可以用于鉴定相应于全长转录物的cDNA克隆或具有完整基因,包括调节和启动子区域、外显子及内含子的基因组克隆。筛选的一种方法是,利用已知的DNA序列合成一个寡核苷酸探针,用它去分离出基因的编码区域。与本发明的多核苷酸序列互补的经标记的寡核苷酸可用于筛选人类cDNA文库、基因组文库、mRNA文库,以确定文库中哪些成员可与探针杂交。
可利用部分核苷酸序列及利用本领域已知方法延伸编码PCOLCE37的核酸序列,以检测其上游序列如启动子和调控元件。例如,可利用通用引物通过限制位点PCR(RESTRICTION-SITE PCR)以找回与已知基因座相邻的未知序列(Sarkar,G.(1993)PCR方法应用(PCRMethod Applic.)2:318-322)。基于已知区域利用不同的引物通过逆转录PCR扩增或延伸序列(Triglia,T.等人,(1988),核酸研究(Nucleic Acids Res.)16:8186)。其他可用的PCR方法包括捕获PCR(capture PCR),如用邻近人和酵母人工染色体DNA的DNA片段进行PCR扩增(Lagerstrom,M等人,(1991)PCR方法应用1:111-119)。此外,本领域技术人员也可通过PCR利用巢式引物(nested primer)及PromoterFinderTM文库进行基因组DNA步行(Clontech,Palo Alto,Calif.)。
本发明还涉及利用PCOLCE37基因产物检测与PCOLCE37的多核苷酸序列突变相关的疾病或对疾病的易感性的诊断方法。这些疾病与本发明的PCOLCE37基因的mRNA及编码的蛋白质表达异常有关,例如肿瘤、免疫性疾病及生长发育障碍性疾病等。
可以用各种技术在DNA的水平上检测出PCOLCE37基因突变的个体。用于诊断的核酸可以从病人的细胞中获得,例如血液、尿液、唾液、活组织检查和尸体解剖材料。基因组DNA可以直接用于检测,也可以在检测分析前用PCR进行酶法扩增(Saiki等人,自然324:163-166,1986)。RNA或cDNA也可用于同样目的。例如,与编码PCOLCE37基因的核酸互补的PCR引物可用来鉴定和分析PCOLCE37基因的突变。例如,从扩增产物的大小与正常基因型相比发生的变化中可以检出缺失和/或插入突变。将扩增的DNA与放射性标记的PCOLCE37 RNA杂交可检测点突变,或者使用放射性标记PCOLCE37反义DNA序列来进行杂交。用RNA酶A消化或从解链温度的不同或改变可以区分完全配对的序列与错配的双螺旋。
通过检测DNA片段在含有或不含有变性剂的凝胶中电泳迁移率的变化,可以进行基于DNA序列差异的遗传学测试。小序列的缺失和插入可以从高分辨率的凝胶电泳中看出。例如,不同大小的DNA片段可以在变性聚丙烯酰胺凝胶电泳(PAGE)中区别出来。含有点突变的DNA序列与正常的DNA序列分别变性后在不含变性剂的聚丙烯酰胺凝胶中可因构象的不同(泳动速度不同)而区别开来。
本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为基因芯片)上,用于分析组织中基因的差异表达分析和基因诊断。
核酸酶保护实验可以揭示特定位置的序列变化,比如RNA酶和S1酶保护法或者化学断裂法(Cotton等人,美国国家科学院院报85:4397-4401,1985)。
总之,特异DNA序列可以用下述方法检测杂交、RNA酶保护、化学断裂、直接DNA测序或使用限制性内切酶(例如,限制片段长度的多态性RFLP)及基因组DNA的Southern印迹技术。
除了较传统的凝胶电泳和DNA测序方法外,突变还可用原位分析检测出来。
本发明也涉及用于检测各种组织中PCOLCE37基因的mRNA表达异常的诊断方法。mRNA水平的变化可用逆转录PCR(RT-PCR)、Northern印迹、点杂交或RNA原位杂交等方法进行检测。这些方法对于本领域的技术人员来说是周知的。
本发明还涉及用于检测各种组织中PCOLCE37基因蛋白水平改变的诊断方法,与正常对照组织样品相比,PCOLCE37蛋白的减少可检测疾病或对疾病易感性的存在(如肿瘤、免疫性疾病及生长发育障碍性疾病等)。测定宿主样品中PCOLCE37基因蛋白水平的方法是本领域技术人员熟知的,包括放射性免疫测定法、竞争性结合测定法、Western印迹分析、酶联免疫吸附法和夹心测定法。酶联免疫吸附法(ELISA)(Coligan等人,现代免疫学方法(Current Protocols in Immunology)卷1,No.2,第6章,1991)要预先准备针对PCOLCE37抗原的特异性抗体,优选是单克隆抗体。另外,还要准备抗单克隆抗体的报告抗体。报告抗体上连有一个可检测的试剂,诸如放射性同位素、荧光或辣根过氧化物酶等标记。例如,从宿主取得样品并在一个固相载体上温育,例如聚苯乙烯反应板,它能吸附样品中的蛋白。然后用一种非特异性蛋白如牛血清白蛋白(BSA)温育,覆盖板上任何游离的蛋白结合位点。第二步,加入单克隆抗体在板中温育,这时,单克隆抗体与附着在聚苯乙烯反应板上的PCOLCE37基因蛋白结合。所有未结合上的单克隆抗体用缓冲液洗去。与辣根过氧化物酶相连的报告抗体此时加入板中,结果报告抗体就与结合在PCOLCE37抗原上的单克隆抗体相结合。未结合上的报告抗体也被洗掉。然后加入过氧化物酶的底物,在一定的时间内所形成的颜色的深浅与标准曲线作比较,就能测出一定体积的病人样品中PCOLCE37基因蛋白的含量。
竞争测定法也可用于这项检测。将PCOLCE37抗原的特异性抗体连到一个固相载体上,然后让标记的PCOLCE37和从宿主获得的样品一起通过固相载体并检测标记物的数量,例如用液相闪烁计数器。标记物的数量与样品中的PCOLCE37的数量相关。夹心测定法类似于酶联免疫吸附法,包括双抗原夹心法和双抗体夹心法。在双抗体夹心测定法中,PCOLCE37通过固体载体,与吸附在固相载体上的抗体结合。第二种抗体又结合到PCOLCE37上。第三种抗体是被标记的并对第二种抗体有特异性,当它通过固相载体时就结合到第二种抗体上,然后检测它的数量。
利用标记的PCOLCE37在受体结合实验中可以检测表达PCOLCE37受体的细胞。可以根据PCOLCE37受体的存在与否和其密度区分细胞,从而提供预测这种细胞对PCOLCE37活性之敏感性的基础。
本发明PCOLCE37作为一种前胶原C末端蛋白酶增强蛋白,直接施用治疗有效剂量的本发明多肽PCOLCE37、其生物活性衍生物或激动剂,拮抗剂、抑制剂可治疗、缓解和/或预防例如,恶性肿瘤、免疫性疾病、生长发育障碍性疾病等。这些疾病包括但不限于
各种组织的肿瘤皮肤黑色素瘤、胃癌、肝癌、肺癌、食管癌、乳腺癌、白血病、淋巴瘤、甲状腺肿瘤、子宫肌瘤、成神经细胞瘤、星形细胞瘤、室管膜瘤、胶质细胞瘤、结肠癌、恶性组织细胞病、黑色素瘤、畸胎瘤、肉瘤、肾上腺癌、膀胱癌、骨癌、骨肉瘤、骨髓瘤、骨髓癌、脑癌、子宫癌、子宫内膜癌、胆囊癌、结肠癌、胸腺肿瘤鼻腔及鼻窦肿瘤、鼻咽癌、喉癌、气管肿瘤、胸膜间皮瘤、纤维瘤、纤维肉瘤、脂肪瘤、脂肪肉瘤、平滑肌瘤;免疫性疾病Langer-Giedion综合症、Ehlers-Danlos综合症;生长发育障碍性疾病精神发育迟缓、脑性瘫痪、脑发育障碍、智力障碍、家族性脑神经核发育不全综合症、斜视、皮肤或脂肪和肌肉发育不良性疾病(如先天性皮肤松弛症)、早老症、先天性角化不良、各种代谢缺陷病(如各种氨基酸代谢缺陷症)、呆小症、侏儒症、性发育迟缓症。
PCOLCE37多肽及其具有生物活性的片段、类似物和衍生物可以与药学可接受载体一起在组合物中使用,这样的组合物中包括有效治疗剂量的多肽和药学可接受的载体或赋形剂。这样的载体包括但并不限制于盐水、缓冲盐水、右旋糖、水、甘油、乙醇及其组合。配制品应该适合给药方式。
本发明的药物组合物还包括利用本发明的多肽制备的疫苗,其包括本发明的多肽或其具有生物学活性或免疫学活性的片段,其中任选地还含有弗氏完全佐剂、弗氏不完全佐剂以及其它药学可接受的载体。
本发明也提供了一种药物包装或试剂盒,包括一个或多个装有一种或多种本发明的药物组合物的成分的容器。另外,这些多肽及其具有生物活性的片段、类似物和衍生物也可与其它的治疗化合物组合使用。
这些药物组合物可用一种方便的方式给药,诸如表皮、静脉内、腹膜内、肌肉内、肿瘤内、皮下、鼻内或真皮内途径。这些药物组合物以治疗和/或预防具体适应症的有效剂量使用。
本发明的PCOLCE37多核苷酸可用于基因治疗,经体内表达PCOLCE37或利用反义技术而达到治疗目的。
基因治疗方法例如包括将病人的细胞在离体情况下用编码PCOLCE37多肽的多核苷酸(DNA或RNA)工程化,再将工程化的细胞供给待治疗的病人。这样的方法是本领域中大家所熟悉的。例如,可以用包含编码本发明PCOLCE37多肽的RNA的逆转录病毒颗粒进行细胞工程化。
同样,用本领域所知的方法可以在体内工程化细胞以体内表达多肽。如本领域中所知,用于产生含有编码本发明多肽的RNA的逆转录病毒颗粒的生产细胞可以注入病人体内,使体内细胞工程化并在体内表达该多肽。从本发明的讲授看,这些以及其它的多肽给药方式对于本领域技术人员是很清楚的。例如除了逆转录病毒外,还有别的用于工程化细胞的表达载体,例如腺病毒,把它与一个合适的运输载体结合后可在体内工程化细胞。
可以衍生出上述逆转录病毒质粒载体的逆转录病毒包括但不限于Moloney鼠白血病病毒、脾坏死病毒、劳斯氏肉瘤病毒、Harvey肉瘤病毒、禽白血病病毒、长臂猿白血病病毒、人免疫缺陷病毒、腺病毒、骨髓增生性肉瘤病毒和哺乳动物肿瘤病毒。
上述载体中可包含一个或多个启动子。可使用的合适启动子包括但不限于逆转录病毒的LTR、SV40启动子、人巨细胞病毒(CMY)启动子(Miller生物技术(Biotechniques),卷7,No.9,980-990页,1989)或其它启动子(例如,真核细胞启动子包括但不限制于组蛋白、polⅢ、β-肌动蛋白启动子)。其它可用的病毒启动子包括但不限于腺病毒启动子、胸苷激酶(TK)启动子和B19细小病毒启动子。从这里的讲授,合适启动子的选择在本领域技术人员知识范围之内。
编码本发明多肽的多核苷酸序列应在合适启动子的控制之下。合适的启动子包括但不限于,腺病毒的启动子,比如腺病毒主要晚期启动子;或异源启动子,比如巨细胞病毒(CMY)启动子;呼吸道合胞体病毒(RSV)启动子;可诱导的启动子,比如MMT启动子、金属硫蛋白启动子;热休克启动子;白蛋白启动子;ApoAI启动子;人珠蛋白启动子;病毒胸苷激酶启动子,比如单纯性疱疹胸苷激酶启动子;逆转录病毒的LTR(包括上面所描述的修饰的逆转录病毒的LTR);β-肌动蛋白启动子;及人生长激素启动子。也可以是控制编码该多肽的基因的自身启动子。
用逆转录病毒质粒载体转导包装细胞系而形成生产细胞系。用于转染的包装细胞包括,但不限制于,PE501、PA317、ψ-2、ψ-AM、PA12、T19-14X、VT-19-17-H2、ψCRE、ψCRIP、GP+E-86、GP+envAM12和DNA细胞系,如Miller所描述(人类基因治疗(Human GeneTherapy),卷1,5-14页,1990),此处全文引入作为参考。可用本领域的已知方法用载体转导包装细胞系。这些方法包括但不限于,电穿孔、使用脂质体和磷酸钙沉淀。一种可选择的方法是将逆转录质粒载体包裹进脂质体中或与脂类偶联,然后注入宿主中。
生产细胞系产生具感染性的逆转录病毒颗粒,此病毒颗粒中包含编码这些多肽的核酸序列。这样的逆转录病毒载体颗粒可用于体外或体内转染真核细胞。被转染的真核细胞将表达编码多肽的核酸序列。可用于转染的真核细胞包括但不限于,胚胎干细胞、胚胎癌细胞、造血干细胞、肝细胞、成纤维细胞、成肌细胞、角质细胞、内皮细胞和支气管上皮细胞。
另一方面,利用反义技术可以改变本发明多肽的体内表达也以治疗与多肽表达相关的的疾病。可以利用PCOLCE37基因编码区、控制或调节区的反义分子(DNA、RNA或肽核酸(PNA))。最近,文献中报道了利用三螺旋DNA在治疗中的应用(Gee,J.E.等人,(1994)in Huber,B.E.与B.I.Carr,分子及免疫学方法(Molecular and ImmunologicApproaches),Futura Publishing Co.,Mt.Kisco,N.Y.,163-177页)。互补序列或反义分子也可通过防止转录本与核糖体的结合以阻止mRNA的翻译。
“肽核酸”是指一种反义分子或反基因物,其包含与以赖氨酸结尾的氨基酸残基之肽骨架连接的寡核苷酸,寡核苷酸的长度至少为5个核苷酸。末端的赖氨酸赋予对组合物的溶解性。肽核酸优先结合互补性单链DNA或RNA,终止转录的延伸,也可延长其在细胞中的半寿期(Nielsen,P.E.等人,(1993)抗肿瘤药物研究(Anticancer DrugRes.),8:53-63)。
多肽及其片段、衍生物或类似物或表达它们的细胞可用作免疫原以产生其抗体。这些抗体可以是多克隆或单克隆抗体。本发明也包含了嵌和的、单链的和人源化的抗体以及Fab片段、或Fab表达文库的产物。本领域已知的各种方法可用于这样的抗体和片段的产生。
所产生的针对本发明多肽的抗体可通过直接将本发明的多肽注射给动物或将其导入动物(最好不是人)而获得。所得到的抗体可与多肽本身结合。用这种方法,甚至用只编码本发明多肽的片段序列也能获得结合整个天然多肽的抗体。然后,抗体可用来把多肽从表达它的组织中分离出来。
制备单克隆抗体可以用连续细胞系培养产生抗体的技术。例如,用杂交瘤技术(Kohle & Milstein自然256:495-497,1975)、Trioma技术、人B细胞杂交瘤技术(Kozbor等人,今日免疫学(ImmunologyToday)4:72,1983)和EBV一杂交瘤技术产生人的单克隆抗体(Cole等人,单克隆抗体和癌症治疗(Monoclonal Antibodies and CancerTherapy),Alan R.Liss,Inc.,77-96,1985)。
单链抗体产生技术(美国专利4,946,778)适用于产生本发明的免疫原性多肽产物的单链抗体。转基因动物也可用来表达本发明的免疫原性多肽产物的人源化抗体。
PCOLCE37特异性抗体可用于相关疾病的诊断和治疗。这些抗体结合并灭活PCOLCE37。
本发明还涉及一种筛选PCOLCE37的激动剂、拮抗剂及抑制剂的方法,包括使用本发明的多肽或其片段筛选多肽库或药物候选物文库用于寻找有治疗价值的能抑制或刺激PCOLCE37功能的分子。本发明多肽的激动剂、拮抗剂以及抑制剂的筛选可利用本领域普通技术人员周知的方法进行。本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)PCOLCE37活性的药物的方法。激动剂提高PCOLCE37参与包括信号转导、细胞通讯、生长发育、免疫应答等的许多病理和生理过程的活性,而拮抗剂阻止和治疗与上述病理或生理过程失调有关的疾病如肌肉组织肿瘤及瘤样病变。例如,哺乳动物细胞或表达PCOLCE37的膜制剂能在药物的存在下与标记的PCOLCE37一起培养。然后测定药物提高或阻遏此相互作用的能力。PCOLCE37蛋白的拮抗剂可以与人PCOLCE37蛋白结合并消除其功能,或是抑制人PCOLCE37蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。在筛选化合物作为拮抗剂时,可以将此种新的人PCOLCE37蛋白加入生物分析测定中,通过测定此种新的人PCOLCE37蛋白此种新的人PCOLCE37蛋白化合物影响和其受体之间的相互作用来确定化合物是否是拮抗剂。以上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的分子。这些通过本发明方法获得的PCOLCE37或其片段的激动剂、拮抗剂及抑制剂可如上所述配制成药物组合物用于上述疾病的治疗。
本发明将在下面的实施例中进一步描述。但是本发明并不局限于这些实施例。所有的份和量,除非另有说明都按重量计。
DNA的“消化”指用限制酶对DNA进行催化性切割,限制酶只作用于DNA序列的特定位点。这里所用的各种限制酶可从商业获得,它们的反应条件、辅助因子和其它的要求按照一般技术人员所知的应用。为了分析需要,通常在大约20μl的缓冲溶液中加入1μg质粒或DNA片段和大约2个单位的酶。为了分离DNA片段用于质粒构建,通常在一个较大的的体积中用20到250个单位的酶消化5到50μg的DNA。生产厂家会指明对特异限制酶合适的缓冲液和底物的量。通常所用的温育时间大约是37℃一个小时,但根据厂家的指示可以有所改变。限制性消化之后直接在聚丙烯酰胺胶上进行电泳,分离出想要的片段。
根据所切割成的片段大小进行分离可用8%的聚丙烯酰胺凝胶(Goedde等人,核酸研究8:4057,1980)。
“连接”指在两个双链核酸片段间形成磷酸二酯键的过程。除非提供了别的方法,连接可以在已知的缓冲液和条件下进行,即每0.5mg约等摩尔量的用于连接的DNA片段加10个单位的T4 DNA连接酶(“连接酶”)。
除非另有说明,转化均用Graham & Van der Eb病毒学(Virology)52:456-457,1973中所描述的方法进行。实施例1PCOLCE37的克隆用异硫氰酸胍/酚/氯仿一步法提取人胎脑总RNA。用Quik mRNAIsolation Kit(Qiegene公司产品)从总RNA中分离poly(A)mRNA。2ug poly(A)mRNA经逆转录形成cDNA。用Smart cDNA克隆试剂盒(购自Clontech)将cDNA片段定向插入到pBSK(+)载体(Clontech公司产品)的多克隆位点上,转化DH5α,细菌形成cDNA文库。用染料末端循环反应测序试剂盒(Perkin-Elmer公司产品)和ABI 377自动测序仪(Perkin-Elmer公司)测定所有克隆的5′和3′末端的序列。将测定的cDNA序列与已有的公共DNA序列数据库(Genebank)进行比较,结果发现其中一个克隆0154e06的cDNA序列为新的DNA。通过合成一系列引物对该克隆所含的插入cDNA片段进行双向测定。结果表明,0154e06克隆所含的全长cDNA为1592bp(如SEQ ID NO:1所示),从第128bp至1135bp有一个1008bp的开放阅读框架(ORF),编码一个新的蛋白质(如SEQ IDNO:2所示)。我们将此克隆命名为pBS-0154e06,编码的蛋白质命名为PCOLCE37。实施例2cDNA克隆的同源检索将本发明的PCOLCE37的序列及其编码的蛋白序列,用Blast程序(Basiclocal Alignment search tool)[Altschul,SF等人,生物化学杂志,1990;215:403-10],在Genbank、Swissport等数据库进行同源检索。与本发明的PCOLCE37同源性最高的基因是一种已知的人前胶原蛋白C末端蛋白酶增强蛋白2,其编码的蛋白在Genbank的准入号为AF098269。蛋白质同源结果示于
图1,两者在所比较的266个氨基酸1区域中高度同源,其相同性为266/266(100%)。实施例3用RT-PCR方法克隆编码PCOLCE37的基因用胎脑细胞总RNA为模板,以oligo-dT为引物进行逆转录反应合成cDNA,用Qiagene的试剂盒纯化后,用下列引物进行PCR扩增引物1:5’-TCTCTATGATTTTTTGAGCCTGCAAGC-3’(SEQID NO:3)引物2:5’-TTAAAAATATTTTATTAACGATTGATTTAGAAAACGCA-3’(SEQ ID NO:4)引物1为位于SEQ ID NO:1的5’端的第1bp开始的正向序列;引物2为SEQ ID NO:1的中的3’端反向序列。
扩增反应的条件在50μl的反应体积中含有50mmol/LKCl,10mmol/L Tris-Cl,(pH8.5),1.5mmol/L MgCl2,200μmol/L dNTP,10pmol引物,1U的Taq DNA聚合酶(Clontech公司产品)。在PE9600型DNA热循环仪(Perkin-Elmer公司)上按下列条件反应25个周期94℃ 30秒;55℃ 30秒;72℃ 2分钟。在RT-PCR时同时设β-肌动蛋白为阳性对照和模板空白为阴性对照。扩增产物用QIAGEN公司的试剂盒纯化,用TA克隆试剂盒连接到pCR载体上(Invitrogen公司产品)。DNA序列分析结果表明PCR产物的DNA序列与SEQ ID NO:1所示的1-1592bp完全相同。实施例4:Northern印迹法分析PCOLCE37基因的表达用一步法提取总RNA[分析生物化学(Anal.Biochem)1987,162,156-159]。该法包括酸性硫氰酸胍苯酚-氯仿抽提。即用4M异硫氰酸胍-25mM柠檬酸钠,0.2M乙酸钠(pH4.0)对组织进行匀浆,加入1倍体积的苯酚和1/5体积的氯仿-异戊醇(49∶1),混合后离心。吸出水相层,加入异丙醇(0.8体积)并将混合物离心得到RNA沉淀。将得到的RNA沉淀用70%乙醇洗涤,干燥并溶于水中。用20μg RNA,在含20mM 3-(N-吗啉代)丙磺酸(pH7.0)-5mM乙酸钠-1mM EDTA-2.2M甲醛的1.2%琼脂糖凝胶上进行电泳。然后转移至硝酸纤维素膜上。用α-32P dATP通过随机引物法制备32P-标记的DNA探针。所用的DNA探针为SEQ ID NO:1所示的PCR扩增的PCOLCE37编码区序列(128bp至1135bp)或其一部分。将32p-标记的探针(约2×106cpm/ml)与转移了RNA的硝酸纤维素膜在如下溶液中于42℃杂交过夜,该溶液包含50%甲酰胺-25mM KH2PO4(pH7.4)-5×SSC-5×Denhardt’s溶液和200μg/ml鲑精DNA。杂交之后,将滤膜在1×SSC-0.1%SDS中于55℃洗30分钟。然后,用磷成像仪进行分析和定量。实施例5重组PCOLCE37的体外表达、分离和纯化根据SEQ ID NO:1所示的编码区序列,设计出一对特异性扩增引物,序列如下TGTTAACAGTG1141AACTGTGTCCA引物3:5’-GCTAGCATGCTATGTCAGGTAACAAAG-3’(Seq ID No:5)引物4:5’-GGATCCTGGACACAGTTCACTGTTAACA-3’(Seq ID No:6)此两段引物的5’端分别含有NdeⅠ和BamHⅠ酶切位点,其后分别为目的基因5’端和3’端的编码序列,NdeⅠ和BamHⅠ酶切位点相应于表达载体质粒pET-28b(+)(Novagen公司产品,Cat.No.69865.3)上的选择性内切酶位点。以含有全长目的基因的pBS-0154e06质粒为模板,进行PCR反应。PCR反应条件为总体积50μl中含pBS-0154e06质粒10pg、引物-3和引物-4分别为10pmol、Advantage polymerase Mix(Clontech公司产品)1μl。循环参数94℃ 20秒,60℃ 30秒,68℃ 2分钟,共25个循环。用NdeⅠ和BamHⅠ分别对扩增产物和质粒pET-28(+)进行双酶切,分别回收大片段,并用T4连接酶连接。连接产物转化用氯化钙法转化大肠杆细菌DH5α,在含卡那霉素(终浓度30μg/ml)的LB平板培养过夜后,用菌落PCR方法筛选阳性克隆,并进行测序。挑选序列正确的阳性克隆(pET-0154e06)用氯化钙法将重组质粒转化大肠杆菌BL21(DE3)plySs(Novagen公司产品)。在含卡那霉素(终浓度30μg/ml)的LB液体培养基中,宿主菌BL21(pET-0154e06)在37℃培养至对数生长期,加入IPTG至终浓度1mmol/L,继续培养5小时。离心收集菌体,经超声波破菌,离心收集上清,用能与6个组氨酸(6His-Tag)结合的亲和层析柱His.Bind Quick Cartridge(Novagen公司产品)进行层析,得到了纯化的目的蛋白PCOLCE37。经SDS-PAGE电泳,在37kDa处得到单一的条带(图2)。将该条带转移至PVDF膜上用Edams水解法进行N-端氨基酸序列分析,结果N-端15个氨基酸与SEQ ID NO:2所示的N-端15个氨基酸残基完全相同。实施例6抗PCOLCE37抗体的产生用多肽合成仪(PE公司产品)合成下述PCOLCE37特异性的多肽NH2-Met-Leu-Cys-Gln-Val-Thr-Lys-Ile-Ile-His-Cys-Val-Cys-Trp-Gly-OH(SEQ ID NO:7)。将该多肽分别与血蓝蛋白和牛血清白蛋白耦合形成复合,方法参见Avrameas,等人,免疫化学(Immunochemistry),1969;6:43。用4mg上述血蓝蛋白多肽复合物加上完全弗氏佐剂免疫家兔,15天后再用血蓝蛋白多肽复合物加不完全弗氏佐剂加强免疫一次。采用经15μg/ml牛血清白蛋白多肽复合物包被的滴定板做ELISA测定兔血清中抗体的滴度。用蛋白A-Sepharose从抗体阳性的家兔血清中分离总IgG。将多肽结合于溴化氰活化的Sepharose4B柱上,用亲和层析法从总IgG中分离抗多肽抗体。免疫沉淀法证明纯化的抗体可特异性地与PCOLCE37结合。实施例7:PCOLCE37的反义寡核苷酸抑制HL-60细胞的增殖采用392型DNA合成仪自动合成PCOLCE37的反义寡核苷酸(AS-ODN)和正义寡核苷酸(S-ODN),并以二硫四乙秋姆(TETD)进行化学修饰而成为AS-PS-ODN和S-PS-ODN,其碱基序列为AS-PS-ODN:5’-GATCTTTGTTACCTGACATAGCATAGC-3’(SEQ ID NO:8)S-PS-ODN:5’-GCTATGCTATGTCAGGTAACAAAGATC-3’(SEQ ID NO:9)将浓度为5×105子宫纤维瘤细胞分为3组在37.5%CO2培养箱中培养(1)对照组为单纯HL-60细胞;(2)HL-60细胞+AS-PS-ODN(3)HL-60细胞+S-PS-ODN。AS-PS-ODN或AS-PS-ODN的终浓度为20μg/ml。细胞培养24小时后用台酚蓝染色检测细胞的死亡率。结果表明,AS-PS-ODN组细胞死亡率为92.5%,而对照组和S-PS-ODN组死亡率为5%。表明PCOLCE37基因的反义寡核苷酸能有效地抑制HL-60细胞的增殖。
序列表(1)一般信息(ⅰ)申请人(A)姓名上海生元基因开发有限公司(B)街道北京东路668号610室(C)城市上海(D)国家中国(E)邮政编码200001(ⅱ)发明名称一种前胶原C末端蛋白酶增强蛋白及编码它的多核苷酸序列(ⅲ)序列数目9(2)SEQ ID NO:1的信息(ⅰ)序列特征(A)长度1592bp(B)类型核酸(C)链性双链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:1:1 TCTCTATGATTTTTTGAGCCTGCAAGCTTTCTGAGTGAGTGCATATTCAAATGCTTTGTC61 TTCCTTGTCTAAGGAAAAAAAAAAGAAAAGAGGCCCTGAGTCCACTTCTCCCCTCTCTCG121 TGTTGCTATGCTATGTCAGGTAACAAAGATCATTCATTGTGTGTGTTGGGGGGTTATGTA181 TGTAACCATATGTTTAAGAGAAAATGTAAGCGCTTCTGCTGTTGCCTTTATTTACTGTAC241 TCTCACCAAAGATCCCACATTCCTAATCTCCACATGGTTGTATTGCTGTAACCTACATAA301 ACTTGTGGGCTTTTTTCCTTGTTTAATACTTGAAGGGGATCAGTATTGTGGAGGACTCCT361 TGACAGACCTTCCGGCTCTTTTAAAACCCCCAACTGGCCAGACCGGGATTACCCTGCAGG421 AGTCACTTGTGTGTGGCACATTGTAGCCCCAAAGAATCAGCTTATAGAATTAAAGTTTGA481 GAAGTTTGATGTGGAGCGAGATAACTACTGCCGATATGATTATGTGGCTGTGTTTAATGG541 CGGGGAAGTCAACGATGCTAGAAGAATTGGAAAGTATTGTGGTGATAGTCCACCTGCGCC601 AATTGTGTCTGAGAGAAATGAACTTCTTATTCAGTTTTTATCAGACTTAAGTTTAACTGC661 AGATGGGTTTATTGGTCACTACATATTCAGGCCAAAAAAACTGCCTACAACTACAGAACA721 GCCTGTCACCACCACATTCCCTGTAACCACGGGTTTAAAACCCACCGTGGCCTTGTGTCA781 ACAAAAGTGTAGACGGACGGGGACTCTGGAGGGCAATTATTATTCAAGTGACTTTGTATT841 AGCCGGCACTGTTATCACAACCATCACTCGCGATGGGAGTTTGCACGCCACAGTCTCGAT901 CATCAACATCTACAAAGAGGGAAATTTGGCGATTCAGCAGGCGGGCAAGAACATGAGTGC961 CAGGCTGACTGTCGTCTGCAAGCAGTGCCCTCTCCTCAGAAGAGGTCTAAATTACATTAT1021 TATGGGCCAAGTAGGTGAAGATGGGCGAGGCAAAATCATGCCAAACAGCTTTATCATGAT1081 GTTCAAGACCAAGAATCAGAAGCTCCTGGATGCCTTAAAAAATAAGCAATGTTAACAGTG1141 AACTGTGTCCATTTAAGCTGTATTCTGCCATTGCCTTTGAAAGATCTATGTTCTCTCAGT1201 AGAAAAAAAAATACTTATAAAATTACATATTCTGAAAGAGGATTCCGAAAGATGGGACTG1261 GTTGACTCTTCACATGATGGAGGTATGAGGCCTCCGAGATAGCTGAGGGAAGTTCTTTGC1321 CTGCTGTCAGAGGAGCAGCTATCTGATTGGAAACCTGCCGACTTAGTGCGGTGATAGGAA1381 GCTAAAAGTGTCAAGCGTTGACAGCTTGGAAGCGTTTATTTATACATCTCTGTAAAAGGA1441 TATTTTAGAATTGAGTTGTGTGAAGATGTCAAAAAAAGATTTTAGAAGTGCAATATTTAT1501 AGTGTTATTTGTTTCACCTTCAAGCCTTTGCCCTGAGGTGTTACAATCTTGTCTTGCGTT1561 TTCTAAATCAATGCTTAATAAAATATTTTTAA(3)SEQ ID NO:2的信息(ⅰ)序列特征(A)长度335个氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO:2:1 Met Leu Cys Gln Val Thr Lys Ile Ile His Cys Val Cys Trp Gly16 Val Met Tyr Val Thr Ile Cys Leu Arg Glu Asn Val Ser Ala Ser31 Ala Val Ala Phe Ile Tyr Cys Thr Leu Thr Lys Asp Pro Thr Phe46 Leu Ile Ser Thr Trp Leu Tyr Cys Cys Asn Leu His Lys Leu Val61 Gly Phe Phe Pro Cys Leu Ile Leu Glu Gly Asp Gln Tyr Cys Gly76 Gly Leu Leu Asp Arg Pro Ser Gly Ser Phe Lys Thr Pro Asn Trp91 Pro Asp Arg Asp Tyr Pro Ala Gly Val Thr Cys Val Trp His Ile106 Val Ala Pro Lys Asn Gln Leu Ile Glu Leu Lys Phe Glu Lys Phe121 Asp Val Glu Arg Asp Asn Tyr Cys Arg Tyr Asp Tyr Val Ala Val136 Phe Asn Gly Gly Glu Val Asn Asp Ala Arg Arg Ile Gly Lys Tyr151 Cys Gly Asp Ser Pro Pro Ala Pro Ile Val Ser Glu Arg Asn Glu166 Leu Leu Ile Gln Phe Leu Ser Asp Leu Ser Leu Thr Ala Asp Gly181 Phe Ile Gly His Tyr Ile Phe Arg Pro Lys Lys Leu Pro Thr Thr196 Thr Glu Gln Pro Val Thr Thr Thr Phe Pro Val Thr Thr Gly Leu211 Lys Pro Thr Val Ala Leu Cys Gln Gln Lys Cys Arg Arg Thr Gly226 Thr Leu Glu Gly Asn Tyr Tyr Ser Ser Asp Phe Val Leu Ala Gly241 Thr Val Ile Thr Thr Ile Thr Arg Asp Gly Ser Leu His Ala Thr256 Val Ser Ile Ile Asn Ile Tyr Lys Glu Gly Asn Leu Ala Ile Gln271 Gln Ala Gly Lys Asn Met Ser Ala Arg Leu Thr Val Val Cys Lys286 Gln Cys Pro Leu Leu Arg Arg Gly Leu Asn Tyr Ile Ile Met Gly301 Gln Val Gly Glu Asp Gly Arg Gly Lys Ile Met Pro Asn Ser Phe316 Ile Met Met Phe Lys Thr Lys Asn Gln Lys Leu Leu Asp Ala Leu331 Lys Asn Lys Gln Cys(4)SEQ ID NO:3的信息(ⅰ)序列特征(A)长度27碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO:3:TCTCTATGATTTTTTGAGCCTGCAAGC 27(5)SEQ ID NO:4的信息(ⅰ)序列特征(A)长度38碱基(B)类型核酸(C)链性单链(D)拓扑结构线性
(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO:4:TTAAAAATATTTTATTAACGATTGATTTAGAAAACGCA 38(6)SEQ ID NO:5的信息(ⅰ)序列特征(A)长度27碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO:5:GCTAGCATGCTATGTCAGGTAACAAAG 27(7)SEQ ID NO:6的信息(ⅰ)序列特征(A)长度27碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO:6:GGATCCTGGACACAGTTCACTGTTAACA 27(8)SEQ ID NO:7的信息(ⅰ)序列特征(A)长度15个氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO:7:Met-Leu-Cys-Gln-Val-Thr-Lys-Ile-Ile-His-Cys-Val-Cys-Trp-Gly15(9)SEQ ID NO:8的信息(ⅰ)序列特征(A)长度27碱基
(B)类型核酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO:8:GATCTTTGTTACCTGACATAGCATAGC27(10)SEQ ID NO:9的信息(ⅰ)序列特征(A)长度27碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO:9:GCTATGCTATGTCAGGTAACAAAGATC 2权利要求
1.一种分离的新的人前胶原C末端蛋白酶增强蛋白,其包含具有SEQID No.2氨基酸序列的多肽、或其保守性变体或其活性片段或衍生物。
2.如权利要求1所述的多肽,其是具有SEQ ID No.2氨基酸序列的多肽。
3.一种分离的多核苷酸,其包含选自下组的一种核苷酸序列或其变体(a)编码如权利要求1或2所述多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸;(c)与(a)或(b)的多核苷酸序列具有至少70%相同性的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码具有SEQ ID No.2所示氨基酸序列的多肽。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组的一种(a)具有SEQ ID No.1中128-1135位的序列;(b)具有SEQ IDNo.1中1-1592位的序列。
6.一种含有权利要求3所述的多核苷酸的重组载体。
7.一种用权利要求3所述的多核苷酸或权利要求6所述的重组载体转化、转导或转染的宿主细胞。
8.一种具有权利要求1所述多肽活性的多肽的制备方法,该方法包括(a)在适合表达权利要求1所述多肽的条件下,培养权利要求7所述的宿主细胞;(b)从培养物中分离出具有权利要求1所述多肽活性的多肽。
9.一种能与权利要求1所述多肽特异性结合的抗体。
10.一种筛选模拟、促进、拮抗或抑制权利要求1所述多肽活性的化合物的方法,其包括利用权利要求1的多肽或其活性片段。
11.一种体外检测与权利要求1所述多肽异常表达相关的疾病或疾病的易感性的方法,包括检测生物样品中权利要求1所述多肽或其编码多核苷酸序列的突变。
12.根据权利要求11的方法,其中所述多核苷酸是DNA或mRNA。
13.一种体外检测与权利要求1所述多肽异常表达相关的疾病或疾病的易感性的方法,包括检测生物样品中权利要求1所述多肽的含量或生物活性。
14.一种药物组合物,它含有权利要求1所述的多肽或其模拟物、激活剂、拮抗剂或抑制剂或以上各个组分的组合,其还包括药学上可接受的载体。
15.权利要求1的多肽或权利要求3的多核苷酸在制备用于治疗多种疾病尤其是恶性肿瘤、免疫性疾病、生长发育障碍性疾病等疾病的药物中的用途。
16.权利要求1所述多肽的拮抗剂或权利要求1所述多肽编码序列的反义多核苷酸在制备用于治疗恶性肿瘤、免疫性疾病、生长发育障碍性等疾病的药物中的用途。
全文摘要
本发明公开了一种新的分离的人前胶原C末端蛋白酶增强蛋白基因的多核苷酸序列及其编码的多肽,以及制备这种多肽的方法。本发明也公开了将这种多肽用于相关疾病诊断、预防和/或治疗的方法。本发明还公开了利用本发明多肽筛选其拮抗剂、激动剂、抑制物和制备针对本发明多肽的抗体的方法,也公开了利用本发明基因的多核苷酸序列和多肽及其拮抗剂、激动剂、抑制物和抗体治疗与该基因异常有关的疾病的用途和用于制备用于上述治疗的药物组合物的用途。
文档编号C12N15/63GK1318549SQ0010683
公开日2001年10月24日 申请日期2000年4月19日 优先权日2000年4月19日
发明者毛裕民, 谢毅 申请人:上海生元基因开发有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1