脂肪细胞特异性蛋白质同系物的制作方法

文档序号:452885阅读:1244来源:国知局
专利名称:脂肪细胞特异性蛋白质同系物的制作方法
背景技术
能量平衡(包括能量代谢、营养状态、脂类贮藏等等)是健康的一个重要准则。此能量的稳态包括食物吸收及碳水化合物和脂类的代谢以产生自觉和不自觉活动所必需的能量。蛋白质的代谢会导致能量产生,但优选导致肌肉形成或恢复。除了其它后果之外,缺乏能量稳态还会导致脂肪组织过多或过少的形成。
脂肪的形成和贮藏是胰岛素调节的。例如,胰岛素刺激葡萄糖转运进入细胞,在其中它将被代谢为可用于脂肪酸酯化以允许其作为甘油三酯贮存的α-磷酸甘油。此外,脂肪细胞表达一种特异的转运蛋白质,可增强自由脂肪酸进入脂肪细胞的转移作用。
脂肪细胞还分泌几种被认为可调节葡萄糖和脂类代谢之稳态控制的蛋白质。这些附加脂肪细胞分泌蛋白质包括adipsin、补体因子C3和B、肿瘤坏死因子α、ob基因产物和Acrp30。还有证据显示脂肪细胞中存在胰岛素调节的分泌途径。Scherer等人,生物化学杂志,270(45)26746-9,1995。在某种程度上受脂肪组织过多或过少形成所影响的这些部分过高或过低的分泌会导致与肥胖症或厌食直接或间接相关的病理状态。
Acrp30是仅由脂肪细胞表达的247个氨基酸长的多肽。Acrp30多肽由氨基末端信号序列、未知同源性之27个氨基酸长的一段序列、22个完全Gly-Xaa-Pro或不完全Gly-Xaa-Xaa胶原蛋白重复序列及羧基末端球形结构域组成。参阅Scherer等人如上所述的文献及国际专利申请WO96/39429。Acrp30是由胰岛素调节、含量丰富的一种人血清蛋白质,它与补体因子Clq和冬眠性的西伯利亚花栗鼠的夏季血清蛋白质(Hib27)具结构相似性,尤其是在羧基末端球形结构域处。在脂肪细胞分化期间,Acrp30的表达被诱导超过100倍。Acrp30被建议用于调节能量平衡及鉴别试验样品中的脂肪细胞。
显示完全产生于脂肪细胞中的另一种分泌蛋白质是apM1,其在例如Maeda等人,Biochem.Biophys.Res.Comm.221286-9,1996中有述。其一个4517bp长的克隆具有244个氨基酸的开放阅读框架和长的3′非翻译区。该蛋白质包括信号序列、氨基末端非胶原蛋白序列、22个胶原蛋白重复序列(Gly-XAA-Pro或Gly-Xaa-Xaa)、及与胶原蛋白X、胶原蛋白VIII和补体蛋白质Clq同源的羧基末端区域。
补体因子Clq由6拷贝的三个相关多肽(A、B和C链)组成,每个多肽约225个氨基酸长并有一近氨基末端的胶原蛋白结构域和一羧基末端球形结构域。由6个A、6个B、6个C链的胶原蛋白结构域形成6个三重螺旋区,从而形成一中心区及6个柄。由1个A、1个B和1个C链的球形羧基末端结构域联合形成球状头部。因此Clq由通过6个类胶原蛋白柄与中心轴丝区域连接的6个球形头组成。Sellar等人,生化杂志,274481-90,1991。这个结构通常被称为花束。Acrp30具有由单一类型多肽链形成的类似花束结构。
人们一直寻找能调节能量稳态的分子,以研究此现象并预防或治疗不平衡病症。此外,还寻找能调节脂肪细胞分泌途径的分子作为间接能量稳态调节子和研究试剂。
本发明为本文所述用途及其它用途提供了这样的多肽,所说的其它用途对本领域技术熟练人员是显而易见的。
发明概述本发明一方面提供了所含一段氨基酸残基序列与SEQ ID NO2第26-281位氨基酸序列至少具75%同一性的分离多肽,其中所说的序列包含形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复,其中Xaa可为任何氨基酸;以及一羧基末端球形部分。在一实施方案中,该多肽的氨基酸序列与SEQ ID NO2之第26-281位残基至少有90%的同一性。在相关方面,该多肽的氨基酸序列与SEQ ID NO2之第22-281位残基至少有90%的同一性。在另一实施方案中,该多肽含SEQID NO2或SEQ ID NO44的第1-281位残基。在又一实施方案中,多肽在氨基末端或羧基末端共价连接了亲和标记、毒素、放射性核苷酸、酶或荧光团类的一部分。在一相关实施方案中,还在所说氨基酸残基序列和所说亲和标记之间进一步提供了蛋白水解断裂位点。
另一方面,本发明提供了选自下组的分离多肽a)所具有的氨基酸序列与SEQ ID NO2第99-140位氨基酸残基的序列具75%同一性的多肽;b)所具有的氨基酸序列与SEQ ID NO2第140或141-281位氨基酸残基的序列具75%同一性的多肽;及c)所具有的氨基酸序列与SEQ ID NO2第99-281位氨基酸残基序列具75%同一性的多肽。
在另一方面,本发明提供了基本上由肽键连接的第一和第二部分组成的融合蛋白质,所说的第一部分包含选自下组的多肽a)所含氨基酸残基序列与SEQ ID NO2之第26-281位氨基酸残基序列具至少75%同一性的多肽;b)包含如SEQ ID NO2第1、22或26-281位残基所示氨基酸残基序列的多肽;c)包含如SEQ ID NO44第1、22或26-281位残基所示氨基酸残基序列的多肽;d)如SEQ ID NO2或SEQ ID NO44中所示zsig37多肽的一部分,该部分包含类胶原蛋白结构域或能二聚体化或多聚体化的类胶原蛋白结构域一部分;e)如SEQ ID NO2或SEQ ID NO44中所示的zsig37多肽一部分,其中含有类球形结构域或类球形结构域的活性部分;或f)如SEQ ID NO2或SEQ ID NO44中所示包括类胶原蛋白结构域和球形结构域的zsig37多肽的一部分;而所说的第二部分包含另外的多肽。在一实施方案中,第一部分选自下组a)具有SEQ ID NO2或SEQ ID NO44第99-140位氨基酸残基序列的多肽;b)具有SEQ ID NO2或SEQID NO44之第140或141-281位氨基酸残基序列的多肽;c)具有SEQID NO2或SEQ ID NO44之第99-281位氨基酸残基序列的多肽。
本发明的另一方面提供了包含分泌信号序列的融合蛋白质,其中所说的分泌信号序列具有SEQ ID NO2或SEQ ID NO44之第1-21位或1-25位氨基酸残基序列并与一附加多肽可操作连接。
本发明的进一步方面提供了含以下可操作连接元件的表达载体转录启动子;编码氨基酸序列与SEQ ID NO2第26-281位残基具至少75%同一性的多肽的DNA区段,其中所说的序列包含形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中的Xaa可为任何氨基酸;及一羧基末端球形部分;以及转录终止子。在一实施方案中,该DNA区段编码氨基酸序列与SEQ ID NO2之第26-281位残基具至少90%同一性的多肽。在另一实施方案中,DNA区段编码氨基酸序列与SEQ ID NO2之第22-281位残基具至少90%同一性的多肽。在又一实施方案中,DNA区段编码含有SEQ ID NO2或SEQ ID NO44之1-281位残基的多肽。在另外的实施方案中,DNA区段编码与亲和标记在氨基末端或羧基末端共价连接的多肽。在又一实施方案中,DNA区段还编码与所说多肽可操作连接的分泌信号序列。在又一实施方案中,该分泌信号序列包含SEQ ID NO2或SEQ ID NO44之第1-21或1-25位残基。
本发明的又一方面提供了已引入含以下可操作连接元件之表达载体的培养细胞转录启动子;编码所含氨基酸序列与SEQ ID NO2第26-281位残基具至少75%同一性的多肽的DNA区段,其中所说的序列包含形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中的Xaa可为任何氨基酸;及羧基末端球形部分;以及转录终止子,其中所说的细胞表达由所述DNA区段编码的所说多肽。
本发明还有一方面是提供产生多肽的方法,该方法包括培养已引入表达载体的细胞,从而所述细胞表达由所说DNA区段编码的所述多肽;该表达载体包括以下可操作连接元件转录启动子;编码所含氨基酸序列与SEQ ID NO2第26-281位残基具至少75%同一性的多肽的DNA区段,其中所说序列包含形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列(其中的Xaa可为任何氨基酸)及羧基末端球形部分;以及转录终止子及回收所说的表达多肽。
本发明的再一方面提供了含多肽及药学上可接受载体的药用组合物,所说多肽包含与SEQ ID NO2第26-281位残基具至少75%同一性的氨基酸残基序列,该序列包含形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中Xaa可为任何氨基酸;及羧基末端球形部分。
在另一方面,本发明提供了能与多肽表位特异结合的抗体,该多肽包含与SEQ ID NO2之第26-281位残基具至少75%同一性的氨基酸残基序列,该序列包括形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro(其中的Xaa是任何氨基酸)以及羧基末端球形部分。
本发明另一方面提供了能与多肽表位特异结合的结合蛋白质,该多肽包含与SEQ ID NO2之第26-281位氨基酸残基具至少75%同一性的氨基酸序列,该序列包括形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列(其中的Xaa是任何氨基酸)以及羧基末端球形部分。
本发明的再一方面提供了编码多肽的分离多核苷酸,该多肽含有与SEQ ID NO2之第26-281位氨基酸残基具至少75%同一性的氨基酸序列,该序列包括形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列(其中的Xaa是任何氨基酸)以及羧基末端球形部分。在一实施方案中,该多肽与SEQ ID NO2第26-281位残基具至少90%的氨基酸序列同一性。在另一实施方案中,该多肽与SEQ ID NO2之第22-281位残基具至少90%的氨基酸序列同一性。在又一实施方案中,该多肽包含SEQ ID NO2或SEQ ID NO44的第1-281位残基。在又一实施方案中,该多核苷酸是DNA。
本发明的又一方面提供了选自下组的分离多核苷酸a)SEQ IDNO1第465-688位核苷酸序列;b)SEQ ID NO1第688-1016位核苷酸序列;c)SEQ ID NO1第691-1016位核苷酸序列;d)SEQ ID NO1第465-1016位核苷酸序列;e)SEQ ID NO43第364-490位核苷酸序列;f)SEQ ID NO43第490-912位核苷酸序列;g)SEQ ID NO43第364-912位核苷酸序列;h)SEQ ID NO43第364-490位核苷酸序列;i)编码氨基酸序列与SEQ ID NO2第99、140或141至281位氨基酸残基具至少75%同一性的多肽的多核苷酸;j)编码氨基酸序列与SEQ ID NO2之第99-140位氨基酸残基具至少75%同一性的多肽的多核苷酸;k)与a)、b)、c)、d)、e)、f)、g)、h)、i)或j)互补的核苷酸序列;及l)a)、b)、c)、d)、e)、f)、g)、h)、i)、j)或k)的简并核苷酸序列。
在又一方面,本发明提供了编码基本上由通过肽键连接在一起的第一部分和第二部分组成之融合蛋白的分离多核苷酸,所说的第一部分选自下组a)所含氨基酸残基序列与SEQ ID NO2第26-281位氨基酸残基序列具至少75%同一性的多肽;b)包含如SEQ ID NO2第1、22或26位至281位氨基酸残基所示氨基酸残基序列的多肽;c)含有如SEQ ID NO44第1、22或26位至281位氨基酸残基所示氨基酸序列的多肽;d)如SEQ ID NO2或SEQ ID NO44中所示zsig37多肽的包含类胶原蛋白结构域或能二聚体化或多聚体化的类胶原蛋白结构域一部分的部分;e)如SEQ ID NO2或SEQ ID NO44中所示zsig37多肽的含有类球形结构域或类球形结构域活性部分的部分;或f)如SEQ ID NO2或SEQ ID NO44中所示zsig37多肽的包括类胶原蛋白结构域及球形结构域的部分;而所说的第二部分包含另外的多肽。
本发明另一方面提供了编码含分泌信号序列之融合蛋白的分离多肽,所说的分泌信号序列具有SEQ ID NO2或SEQ ID NO44之第1-21或1-25位氨基酸残基序列,并与附加多肽可操作连接。
本发明另一方面提供了含有SEQ ID NO23多核苷酸或与SEQ IDNO23互补的序列中至少14个连续核苷酸的寡核苷酸探针或引物。
附图简述

图1阐明了本发明的zsig37多肽与HUMUPST 2_1(Maeda等人,Biochem.Biophys.Res.Comm.221(2)286-9,1996);ClQA_HUMAN(Sellar等人,生化杂志,274481-90,1991;Reid,生化杂志,179367-71,1979;及Reid等人,生化杂志,203559-69,1982);HP25_TAMAS(Takamatsu等人,分子细胞生物学,131516-21,1993和Kondo &Kondo,生物化学杂志,267473-8,1992);HP27_TAMAS(上面提到的Takamatsu等人及Kondo & Kondo的文献);和CERL_RAT(Wada &Ohtani,Brain Res.Mol.Brain Res.971-7,1991)的多重对比。
图2是与图1多重对比所示6个蛋白质的比较中氨基酸同一性百分率的矩阵。
发明详述在详述本发明之前,先解释以下术语会有助于对本发明的理解。
本文所用术语“亲和标记”表示能附着于多肽上以供其纯化或检测所用或为多肽附着到底物上提供位点的肽片段。原则上,可获得其抗体或其它特异结合剂的任何肽或蛋白质均可用作亲和标记。亲和标记包括多组氨酸束、蛋白A(Nilsson等人,EMBO J.41075,1985;Nilsson等人,酶学方法,1983,1991)、谷胱甘肽S-转移酶(Smith和Johnson,基因6731,1988)、P物质、FlagTM肽(Hopp等人,生物技术学61204-1210,1988;可获自Eastman Kodak Co.,New Haven,CT)、链霉亲和素结合肽或其它抗原性表位或结合结构域。大体上参阅,Ford等人,蛋白质表达和纯化295-107,1991。编码亲和标记的DNA可获自商品供应商(如Pharmacia Biotech,Piscataway,NJ)。
术语“等位变体”是指一个基因占据相同染色体位置的两种或多种选择形式中的任一种。等位变异通过突变自然发生,并可能导致种群内的表型多态性。基因突变可以是沉默的(所编码多肽无变化)或可能编码具有改变氨基酸序列的多肽。术语等位变体也用于本文以表示由基因的等位变体编码的蛋白质。
本文所用术语“氨基末端”和“羧基末端”是指在多肽和蛋白质中的位置。在上下文允许处,这些术语是参照多肽或蛋白质的特定序列或部分而使用的,以指示近似或相对位置。例如,位于蛋白质中参照序列羧基末端的某序列是位于接近参照序列的羧基末端,但不一定是在整个蛋白质的羧基末端。
术语“互补物/抗互补物对”表示在适当条件下形成非共价结合的稳定对的非相同部分。例如,生物素和抗生物素蛋白(或链霉亲和素)是互补物/抗互补物对的典型成员。其它典型的互补物/抗互补物对包括受体/配体对、抗体/抗原(或半抗原或表位)对、有义/反义多核苷酸对,等等。当需要互补物/抗互补物对随后解离时,优选互补物/抗互补物对的结合亲和力小于109M-1。
术语“多核苷酸分子的互补物”是与参照序列相比具互补碱基序列并反向的多核苷酸分子。例如,序列5′ATGCACGGG 3′与5′CCCGTGCAT 3′互补。
术语“毗连序列”表示具有与另一核苷酸完全相同或互补的一段连续序列的多核苷酸。连续序列被称为与多核苷酸序列的一段完全重叠,或与多核苷酸的一部分重叠。例如,多核苷酸序列5′-ATGGCTTAGCTT-3′具代表性的毗连序列是5′-TAGCTTgagtct-3′和3′-gtcgacTACCGA-5′。
术语“简并核苷酸序列”表示包括一个或多个简并密码子(与编码多肽的参照多核苷酸分子相比)的核苷酸序列。简并密码子含不同的核苷酸三联体,但编码相同的氨基酸残基(即,GAU和GAC三联体均编码Asp)。
术语“表达载体”表示线性或环状的DNA分子,它包含与供其转录之附加区段可操作连接的编码目的多肽的区段。这样的附加区段可包括启动子和终止子序列,也可任选地包括一个或多个复制起点、一个或多个选择标记、增强子、聚腺苷酸化信号,等等。表达载体通常来自质粒或病毒DNA,或可包括它们二者的元件在内。
当用于多核苷酸时,术语“分离的”表示多核苷酸已分离自其天然遗传环境并因此无其它外来的或不希望有的编码序列,且为适用于基因工程蛋白质生产系统的形式。这些分离分子是脱离自其天然环境的分子,包括cDNA和基因组克隆。本发明的分离DNA分子没有通常与之相关的其它基因,但可包括诸如启动子和终止子之类天然存在的5′和3′非翻译区。相关区域的鉴定对本领域普通技术人员来说将是明显的(见示例,Dynan和Tijan,自然316774-78,1985)。
“分离的”多肽或蛋白质是发现于其自然环境之外的条件中的多肽或蛋白质,诸如脱离血液和动物组织。在一优选形式中,分离多肽基本上无其它多肽,尤其是动物来源的其它多肽。优选提供高度纯化形式的多肽,即,纯度超过95%的,更优选纯度高于99%的。用于本文中时,术语“分离的”不排除以不同物理形式存在的相同多肽,诸如二聚体或糖基化或衍生形式。
当用于指DNA区段时,术语“可操作连接”表示这些区段的排列方式使其功能与预期目的一致,例如,转录起始于启动子并通过编码部分进行至终止子。
术语“正同系物(ortholog)”表示获自一物种的多肽或蛋白质,它是来自不同物种之多肽或蛋白质的功能性对应物。正同系物中序列的差异是物种形成的结果。
“副同系物(paralog)”是由某生物体产生的截然不同但结构相关的蛋白质。副同系物被认为是通过基因复制产生的。例如,α-珠蛋白、β-珠蛋白和肌红蛋白互为副同系物。
术语“多核苷酸”表示从5′向3′末端阅读的脱氧核糖核苷酸或核糖核苷酸之单链或双链多聚体。多核苷酸包括RNA和DNA,可分离自天然来源、合成于体外或制备自天然及合成分子的联合体。多核苷酸的大小表示为碱基对(编写为“bp”)、核苷酸(“nt”)或千碱基(“kb”)。在上下文允许处,后两个词可描述单链或双链多核苷酸。当该词用于双链分子时,表示的是全长分子,应理解为与“碱基对”一词相当。本领域技术熟练人员将认识到,双链多核苷酸的两条链在长度上可能有微小的差别,并且由于酶促断裂的结果,它们的末端可以是错开的;因此在双链多核苷酸分子内的所有核苷酸可能不是全部配对的。这样的不配对末端大体上不超过20nt长。
“多肽”是天然或合成产生的由肽键连接的氨基酸残基多聚体。少于约10个氨基酸残基的多肽通常被称为“肽”。
本文所用的“探针和/或引物”可以是RNA或DNA。DNA可或者为cDNA或者为基因组DNA。多核苷酸探针和引物是单链或双链DNA或RNA,通常是合成的寡核苷酸,但也可由克隆cDNA或基因组序列或其互补物产生。尽管可使用稍短的探针(14-17个核苷酸),但分析用探针通常是至少20个核苷酸长。PCR引物长度至少为5个核苷酸,优选15个或更多个核苷酸,更优选20-30个核苷酸。在定向分析小区域基因时,可用短多核苷酸。为了进行大体的基因分析,多核苷酸探针可包含一个或多个完整的外显子。可以用本领域众所周知的技术标记探针以提供可检测信号,例如用酶、生物素、放射性核素、荧光团、化学发光剂、顺磁颗粒等等标记,它们可购自许多来源,如MolecularProbe Inc.,Eugene,OR和Amersham Crop.,Arlington Heights,IL。
术语“启动子”表示基因中含有可供RNA聚合酶结合并起始转录之DNA序列的一部分。启动子序列通常,但并非总是存在于基因的5′非编码区。
术语“受体”表示可与生物活性分子(即配基)结合并介导配基在细胞上作用的细胞伴随蛋白质。膜结合受体的特征在于具有多结构域结构,其中含胞外配基结合结构域及通常参与信号转导的胞内效应子结构域。配基和受体的结合导致受体构象改变,从而引起效应子结构域和细胞内其它分子间的相互作用。该相互作用再引起细胞代谢的变化。与受体-配基相互作用有关的代谢活动包括基因转录,磷酸化作用,去磷酸化作用,环AMP产量的提高,细胞钙转移,膜脂转移,细胞粘附,肌醇脂水解和磷脂的水解。大部分核受体也呈现多结构域结构,包括氨基末端的反式激活结构域、DNA结合结构域和配基结合结构域。一般来说,受体可以是膜结合的、胞质的或核的;单体的(如,促甲状腺激素受体、β-肾上腺素能受体)或多聚体的(如PDGF受体、生长激素受体、IL-3受体、GM-CSF受体、G-CSF受体、促红细胞生成素受体和IL-6受体)。
术语“分泌信号序列”表示编码作为较大多肽的组分而指导该较大多肽穿过其合成细胞的分泌途径之多肽(“信号肽”)的DNA序列。在通过分泌途径转运过程中该较大肽通常断裂以去除分泌肽。
“可溶性受体”是不结合于细胞膜上的受体多肽。可溶性受体大部分通常为缺少跨膜和胞质结构域的配基结合受体多肽。可溶性受体可包含附加氨基酸残基,诸如供多肽纯化所用或为多肽与底物的附着提供位点的亲和标记,或免疫球蛋白的恒定区序列。许多细胞表面受体具有天然存在的可溶性对应物,它们是通过蛋白水解产生的,或翻译自以其它方式剪接的mRNA。在缺少分别供膜锚定或信号转导的足够部分区段时,受体多肽被认为基本上无跨膜和胞内多肽区段。
本文所用术语“剪接变体”表示转录自一个基因的两种或多种可选择RNA形式。剪接变异通过使用转录RNA分子内的、或较少见地在独立转录RNA分子间的可选择性剪接位点而自然产生,可导致由相同基因转录不同mRNA。剪接变体可编码具改变氨基酸序列的多肽。术语剪接变体用于本文中也表示由转录自基因的mRNA剪接变体编码的蛋白质。
用不精确的分析方法(如凝胶电泳)确定的多聚体分子量和长度应理解为是近似值。当这样的值被表达为“大约”X或“近似”X时,所提到的X值应理解为精确至±10%。
此处所引用的所有文献均全文收入作为参考。
本发明是部分基于所编码多肽与脂肪细胞补体相关蛋白质(Acrp30)同源之新DNA序列的发现。如,参阅,Scherer等,生物化学杂志270(45)26746-9,1995。多肽Acrp30见SEQ ID NO3中。Acrp30显示与人apM1(图1和2中的HUMUPST2_1)高度相关,最主要的差异存在于分泌序列中。
该新DNA序列编码的多肽具氨基末端信号序列、邻近的无同源性N-末端区、由Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列组成的截短的胶原蛋白结构域和羧基末端球形部分。新的多核苷酸序列还包含一长的3′非翻译区。除了其中每种蛋白质的类胶原蛋白结构域比zsig37多肽的长以外,Acrp30和HUMUPST2_1共有上述一般性多肽结构。此外,HUMUPST2_1 DNA序列的特征在于具有一长的3′非翻译区。而且,除CERL_RAT之外,Acrp30和图1所列所有序列都共有zsig37多肽第187位的保守半胱氨酸残基(如图1和SEQ ID NO2所示)。在所列蛋白质的羧基末端球形部分可找到其它同源区,在本文中它们被确定为是寻找其它家族成员的有用引物。例如,用这些引物寻找可鉴定到Acrp30。此外,本发明的zsig37多肽包括位于SEQ ID NO2第93位氨基酸(Asn)处的假定N-连接糖基化位点。
用一个30碱基的探针(SEQ ID NO4)进行相应于此新DNA之mRNA的组织分布分析,显示在Northern印迹中表达量最高的是心脏和胎盘,在肾、卵巢、肾上腺和骨骼肌中信号强度相对较低,在多种其它组织中信号更弱。此多肽已被命名为zsig37多肽。
本发明之新zsig37多肽最早是通过查询EST数据库中分泌信号序列(特征在于有一上游甲硫氨酸起始位点、约13个氨基酸的疏水性区域及一个裂解位点)以选择分泌蛋白质而鉴定到的。将相应于符合那些寻找标准的EST的多肽与已知序列比较,以鉴别与已知配基同源的分泌蛋白质。发现了一段EST序列,预计是分泌蛋白质。由全长cDNA编码的新多肽使得能够鉴别它与脂肪细胞补体相关蛋白质Acrp30(SEQID NO3)和脂肪细胞分泌蛋白质apM1(图1和2中的HUMUPST2_1)的同系物关系。如图1和2中所示,还鉴别出与补体组分ClQ A链、冬眠西伯利亚旱獭活性状态下观察到的两种因子(HP 25_TAMAS和HP27_TAMAS)及大鼠脑蛋白质(CERL_RAT)具有较远一些的同源性。
从被认为含有它的单个克隆中得到zsig37多肽全序列,其中该克隆获自脑肿瘤组织文库。也可在包括心脏、胎盘、肾、卵巢、肾上腺、骨骼肌、脂肪组织等在内的其它文库中寻找这样的克隆。
N-末端EST的核苷酸序列见SEQ ID NO1所述,而其推断的氨基酸序列如SEQ ID NO2所述。如上一般性所述,zsig37多肽包括从氨基酸1(Met)至氨基酸21(Gly)的信号序列。一可选择信号序列是从氨基酸1(Met)至氨基酸25(Ser)。因此成熟多肽是从氨基酸22(Leu)或26(Arg)至氨基酸281(Pro)。在成熟多肽中发现了未知同源物的N-末端区域,是从氨基酸22(Leu)至98(Lys)。此外,在氨基酸99(Gly)和140(Arg)之间发现了截短的胶原蛋白结构域。在此截短的胶原蛋白结构域中可观察到1个完全匹配的Gly-Xaa-Pro和13个不完全匹配的Gly-Xaa-Xaa重复序列。与之形成对照的是,Acrp30含22个完全或不完全匹配的重复序列。zsig37多肽还包括约从氨基酸141(Cys)-281(Pro)的羧基末端球形结构域。zsig37多肽、HUMUPST2_1和Acrp30似乎在胶原蛋白结构域和球形结构域中是同源的,而在成熟多肽的N-末端部分无同源性。
本发明的另一方面包括zsig37多肽片段。优选片段包括SEQ IDNO2氨基酸99(Gly)-140(Arg)的zsig37多肽类胶原蛋白结构域,zsig37多肽的含类胶原蛋白结构域或能二聚体化或多聚体化的类胶原蛋白结构域部分的部分。这些片段在胶原蛋白二聚体化或多聚体化的研究中或如下详述之融合蛋白质形成中尤其有用。编码这些片段的多核苷酸也包括于本发明中,包括由下述组成之组(a)含如SEQ ID NO1中核苷酸1、171、234、246或465至核苷酸589所示核苷酸序列的多核苷酸分子;(b)编码与SEQ ID NO2氨基酸残基99(Gly)-140(Arg)氨基酸序列具至少80%同一性的zsig37多肽片段的多核苷酸分子;(c)与(a)或(b)互补的分子;及(d)编码zsig37多肽类胶原蛋白结构域片段的简并核苷酸序列。
其它优选片段包括SEQ ID NO2中氨基酸残基140(Arg)或141(Cys)至281(Pro)的zsig多肽球形结构域,含类球形结构域或类球形结构域活性部分的zsig37多肽部分。这些片段在能量平衡或神经传递,尤其是饮食或压力相关的神经传递的研究或调节中特别有用。这些片段还可能有抗微生物活性。本发明还包含编码这些片段的多核苷酸,包括由下述组成之组(a)含SEQ ID NO1中核苷酸587或590至1016所示核苷酸序列的多核苷酸分子;(b)编码与SEQ ID NO2中氨基酸残基141(Cys)-281(Pro)所示氨基酸序列具至少80%同一性的zsig37多肽片段的多核苷酸分子;(c)与(a)或(b)互补的分子;及(d)编码zsig37多肽球形结构域片段的简并核苷酸序列。
本发明的另一zsig37多肽片段包括SEQ ID NO2中氨基酸残基99(Gly)-281(Pro)的类胶原蛋白结构域和球形结构域。本发明也包含编码这样的片段的多核苷酸,包括由下述组成之组(a)含SEQ ID NO1第465-1016位核苷酸所示核苷酸序列的多核苷酸分子;(b)编码与SEQ ID NO2第99(Gly)-281(Pro)位氨基酸残基的氨基酸序列具至少80%同一性的zsig37多肽片段的多核苷酸分子;(c)与(a)或(b)互补的分子;及(d)编码zsig37多肽类胶原蛋白结构域-球形结构域片段的简并核苷酸序列。
本发明还包括基于上述多核苷酸的简并探针。也包括相应于上文所示多核苷酸的互补物的探针。
本发明还提供编码本文所公开之zsig37多肽的多核苷酸分子,包括DNA和RNA分子。鉴于遗传密码的简并性,本领域技术人员应很容易认识到在这些多核苷酸分子中可以有相当多的序列变异。SEQ IDNO23是包含编码SEQ ID NO2之zsig37多肽的所有DNA的简并DNA序列。本领域技术人员将认识到,通过用U(尿嘧啶)取代T(胸腺嘧啶),SEQ ID NO23的简并序列还可提供编码SEQ ID NO2的所有RNA序列。因此,本发明还包括含SEQ ID NO23第1-842位核苷酸的zsig37多肽编码多核苷酸及其RNA对应物。表1列出SEQ ID NO23中所用单字母密码以表示简并核苷酸位置。“解析”是用字母符号表示的核苷酸。“互补物”显示互补核苷酸的符号。例如,符号Y表示或为C(胞嘧啶)或为T,而它的互补物R表示A(腺嘌呤)或G(鸟嘌呤),A与T互补,而G与C互补。
表1核苷酸 解析 互补物 解析A A TTC C GGG G CCT T AARA|G Y C|TYC|T R A|GMA|C K G|TKG|T M A|CSC|G S C|GWA|T W A|TH A|C|T D A|G|TB C|G|T V A|C|GV A|C|G B C|G|TD A|G|T H A|C|TN A|C|G|TN A|C|G|T表2中给出了SEQ ID NO23中所用的简并密码子,包括给定氨基酸的所有可能密码子。
表2氨基酸单字母密码子 简并符号 密码子Cys C TGC TGT TGYSer S AGC AGT TCA TCC TCG TCT WSNThr T ACA ACC ACG ACT ACNPro P CCA CCC CCG CCT CCNAla A GCA GCC GCG GCT GCNGly G GGA GGC GGG GGT GGNAsn N AAC AAT AAYAsp D GAC GAT GAYGlu E GAA GAG GARGln Q CAA CAG CARHis H CAC CAT CAYArg R AGA AGG CGA CGC CGG CGT MGNLys K AAA AAG AARMet M ATG ATGIle I ATA ATC ATT ATHLeu L CTA CTC CTG CTT TTA TTG YTNVal V GTA GTC GTG GTT GTNPhe F TTC TTT TTYTyr Y TAC TAT TAYTrp W TGG TGGTer . TAA TAG TGA TRRAsn|Asp B RAYGlu|Gln Z SARAny X NNN
本领域常规技术人员将懂得在测定简并密码子、编码每个氨基酸的所有可能密码子的代表中引入一些模糊用法。例如,在某些情况下,丝氨酸简并密码子(WSN)可编码精氨酸(AGR),而精氨酸的简并密码子(MGN)在某些情况下可编码丝氨酸(AGY)。在编码苯丙氨酸和亮氨酸的密码子之间存在相似关系。因而,含简并序列的一些多核苷酸可编码不同的氨基酸序列,但本领域常规技术人员可以SEQ ID NO2氨基酸序列为参照方便地识别这样的变异序列。按照本文所述,可以很容易地检验变异序列的功能性。
本领域常规技术人员也将意识到不同物种可能有“偏好性密码子用法”。大体上参阅Grantham等人,核酸研究81893-912,1980;Haas等人,Curr.Biol.6315-24,1996;Wain-Hobson等人,基因13355-64,1981;Grosjean和Fiers,基因18199-209,1982;Holm,核酸研究143075-87,1986;Ikemura,分子生物学杂志158573-97,1982。此处所用术语“偏好性密码子用法”或“偏好密码子”是本领域中的一个术语,表示某物种细胞中最常用的蛋白质翻译密码子,它们偏爱编码每个氨基酸的可能密码子中的一个或一些代表(见表2)。例如,苏氨酸(Thr)可由ACA、ACC、ACG或ACT编码,但在哺乳动物细胞中ACC是最常用密码子;在其它物种中,例如,昆虫细胞、酵母、病毒或细菌中,可能偏好不同的Thr密码子。可通过本领域已知的各种方法将特殊物种的偏好密码子引入本发明多核苷酸中。例如,将偏好密码子序列引入重组DNA中,可通过使特殊细胞类型或物种中的蛋白质翻译更有效而加强蛋白质的生产。因此,公开于SEQ ID NO23中的简并密码子序列为用作模板,优化本领域常用和本文所公开的多种细胞类型和物种中多核苷酸的表达。可按本文公开内容,检验多种物种中含偏好密码子的序列的表达并使其最优化,以及检测其功能性。
关于zsig37片段的抗微生物特性可按本领域已知步骤进行评估。参阅,例如,Barsum等人,Eur.Respir.J.815)709-14,1995;Sandovsky-Losica等人,J.Med.Vet.Mycol(England)28(4)279-87,1990;Mehentee等人,J.Gen.Microbiol(England)135(Pt.8)2181-8,1989;Segal和Savage,内科和兽医真菌学杂志24477-479,1986,等等。如果合乎需要,可将zsig37多肽片段这方面的特性与已知在这方面有功能的蛋白质比较,如富含脯氨酸的蛋白质、溶菌酶、histatins、乳过氧化物酶等等。此外,可以结合一种或多种抗微生物剂评估zsig37多肽片段,以鉴定协同作用。本领域常规技术人员可认识到,zsig37多肽、融合蛋白、激动剂、拮抗剂和抗体的抗微生物特性可相似地进行评估。
作为神经递质或神经传递调节子,本发明的zsig37多肽片段及zsig37多肽、融合蛋白质、激动剂、拮抗剂或抗体也可调节钙离子浓度、肌肉收缩、激素分泌、DNA合成或细胞生长、肌醇磷酸代谢、花生四烯酸(arachidonate)释放、磷脂酶C激活或ADCC接受力、超氧化物阴离子产生等等。可用如本文所述的已知技术进行这些特性的评估。
可以用本领域已知方法,如Dobrzanski等人,调节肽45341-52,1993,等等描述的技术,评估zsig37多肽、片段、融合体、激动剂或拮抗剂对胞内钙水平的影响。可以用本领域已知方法,如Smits &Lebebvre,J.Auton.Pharmacol.14383-92,1994,Belloli等人,J.Vet.Pharmacol.Therap.17379-83,1994,Maggi等人,调节肽53259-74,1994,等等描述的方法,评估zsig37多肽、片段、融合体、激动剂或拮抗剂对肌肉收缩的影响。可以用本领域已知技术,如Henriksen等人,受体&信号转导研究杂志15(1-4)529-41,1995所述对促乳素释放影响的评估方法,等等,评估zsig37多肽、片段、融合体、激动剂或拮抗剂对激素分泌的影响。可以用本领域已知方法评估zsig37多肽、片段、融合体、激动剂或拮抗剂对DNA合成或细胞生长的影响,如Dobrzanski等人,调节肽45341-52,1993,等等所述的方法。可以用本领域已知方法评估zsig37多肽、片段、融合蛋白、激动剂或拮抗剂对肌醇磷酸代谢的影响,如Dobrzanski等人,调节肽45341-52,1993,等等所述的方法。
此外,可以用本领域已知方法评估zsig37多肽、片段、融合蛋白、激动剂或拮抗剂对花生四烯酸释放的影响,如Dobrzanski等人,调节肽45341-52,1993,等等所述的方法。可以用本领域已知方法评估zsig37多肽、片段、融合蛋白、激动剂或拮抗剂对磷脂酶C激活的影响,如Dobrzanski等人,调节肽45341-52,1993,等等所述的方法。可以用本领域已知方法评估zsig37多肽、片段、融合蛋白、激动剂或拮抗剂对胃排空的影响,如Varga等人,欧洲药学杂志286109-112,1995,等等所述的方法。可以用本领域已知方法评估zsig37多肽、片段、融合蛋白、激动剂或拮抗剂对人嗜中性粒细胞激活作用和ADCC接受力的影响,如Wozniak等人,免疫学78629-34,1993,等等所述的方法。可以用本领域已知方法评估zsig37多肽、片段、融合蛋白、激动剂或拮抗剂对过氧化物阴离子生产的影响,如Wozniak等人,免疫学78629-34,1993,等等所述的方法。
本发明还提供了zsig37融合蛋白质。例如,本发明融合蛋白质包含(1)选自下组的多肽(a)含SEQ ID NO2第1(Met)、22(Leu)或26(Arg)至281(Pro)位氨基酸残基的氨基酸序列的多肽分子;(b)SEQID NO2第99(Gly)-140(Arg)位氨基酸的多肽分子,即含胶原蛋白结构域或者能二聚体化或多聚体化的类胶原蛋白结构域部分的zsig37多肽部分;(c)SEQ ID NO2氨基酸第140(Arg)或141(Cys)位至281(Pro)位的多肽分子,即含类球形结构域或类球形结构域活性部分的zsig37多肽部分;或(d)氨基酸99(Gly)-281(Pro)的多肽分子,即包括类胶原蛋白结构域和球形结构域的zsig37多肽部分;以及(2)另一种多肽。该另一种多肽可以是可选择或附加的球形结构域、可选择或附加的类胶原蛋白结构域、便于融合蛋白质分泌的信号肽,等等。补体的球形结构域结合IgG,因此zsig37多肽、片段或融合蛋白的球形结构域可能具有相似的作用。
氨基酸1(Met)至氨基酸281(Pro)的zsig37多肽;氨基酸22(Leu)或氨基酸26(Arg)至氨基酸281(Pro)的可选择性成熟zsig37多肽;或氨基酸1(Met)至氨基酸21(Gly)或氨基酸25(Ser)的可选择性分泌指导片段可用于细胞分泌蛋白质的研究。在本发明此方面的优选实施例中,成熟多肽与推定分泌信号序列形成为融合蛋白质;将带有能指导融合蛋白质表达的调节区之质粒引入检测细胞;并检验成熟蛋白质的分泌。在本发明此方面的其它优选实施例中,可选择分泌前导片段与为分泌所选择的其它蛋白质形成融合蛋白质;将带可指导融合蛋白表达之调节区的质粒引入检测细胞;并检验蛋白质的分泌。可以用诸如HPLC等本领域已知技术进行检验。
高度保守氨基酸,尤其是在zsig37多肽羧基末端球形结构域中的高保守氨基酸可用作鉴定新家族成员的工具。例如,用逆转录聚合酶链式反应(RT-PCR)可从获自各种组织来源的RNA扩增编码保守基元的序列。具体地说,可以用设计自保守序列的高度简并引物达到此目的。特别是,以下引物对此目的是有用的1)SEQ ID NO2的氨基酸269-274(相应于SEQ ID NO1的核苷酸975-992);2)SEQ ID NO2的氨基酸191-196(相应于SEQ ID NO1的核苷酸741-758);3)SEQ ID NO2的氨基酸163-168(相应于SEQ ID NO1的核苷酸657-674);4)SEQ ID NO2的氨基酸173-178(相应于SEQ ID NO1的核苷酸687-704);及5)SEQ ID NO2的氨基酸243-248(相应于SEQ ID NO1的核苷酸897-914)。
本发明还包括基于上述多核苷酸的简并探针。也包括相应于上述多核苷酸互补物的探针。
在本发明优选实施例中,分离多核苷酸在严谨条件下可与SEQ IDNO2,SEQ ID NO4,SEQ ID NO5,SEQ ID NO6,SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11,SEQ ID NO12,SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17,SEQ ID NO18,SEQ ID NO19,SEQ ID NO20或其互补序列的相似大小区域杂交。一般地,所选择的严谨条件是在确定离子强度和pH时比特异序列的溶解温度(Tm)低约5℃。Tm是50%的目标序列与完全区配探针杂交的温度(在确定的离子强度和pH条件下)。典型的严谨条件是在pH7时盐浓度高达约0.03M且温度至少约60℃的条件。
本发明的另一方面提供了含有纯化zsig37多肽及药学上可接受载体的药用组合物。此药用组合物将用于调节哺乳动物中的能量平衡或保护内皮细胞免受伤害。
关于调节能量平衡,zsig37多肽可调节细胞代谢反应。这样的代谢反应包括脂肪生成、葡糖异生、糖酵解、脂肪生成、葡萄糖摄取、蛋白质合成、产热、氧利用等等。zsig37多肽的表达模式表明了在内皮细胞组织中的表达。关于内皮细胞的保护,zsig37多肽可用于器官保存中,进冷藏、外科预处理以避免因局部缺血和/或炎症所致的损伤,或者用于类似步骤中。zsig37多肽在心脏中的表达暗示了该蛋白质可调节乙酰胆碱和/或去甲肾上腺素的释放。正如zsig37多肽在交感或副交感神经系统相关组织中的表达所表明的那样,该多肽或许可用作神经递质或神经传递调节子。从这点上说,zsig37多肽也许可用于调节营养吸收,例如脑中2-脱氧葡萄糖的吸收等。
除了本领域已知或本文所述的其它方法外,还可通过检验一种或多种以下代谢功能评估哺乳动物能量平衡脂肪生成、葡糖异生、糖酵解、脂类生成、葡萄糖吸收、蛋白质合成、产热、氧利用等。可用本领域常规技术人员已知技术(检验或动物模型)检测这些代谢功能,下面将作更完整说明。例如,胰岛素的葡糖调节作用主要发生在肝、骨骼肌和脂肪组织中。胰岛素与这三种组织中的其细胞受体结合,起始组织特异性活动,导致例如抑制葡萄糖产生和刺激葡萄糖利用。在肝中,胰岛素刺激葡萄糖摄取并抑制葡糖异生和糖酵解。在骨骼肌和脂肪组织中,胰岛素刺激葡萄糖的摄取、贮存和利用。
对于上述所有代谢功能的检验本领域都存在公认的方法。因而,本领域常规技术人员能评估zsig37多肽、片段、融合蛋白质、抗体、激动剂和拮抗剂的代谢调节功能。典型的调节技术如下所述。
脂肪生成、葡糖异生和糖酵解是哺乳动物能量平衡的相关成分,可以通过已知技术,用例如ob/ob小鼠或db/db小鼠进行评估。ob/ob小鼠是ob(肥胖)基因座位上一个失活突变纯合的近交小鼠。这样的ob/ob小鼠表现多食和代谢减退症状,并被认为在循环OB蛋白质的产生中是缺陷的。db/db小鼠是db(糖尿病)基因座位上一个失活突变纯合的近交小鼠。除了db/db小鼠还显示糖尿病表型外,db/db小鼠显示与ob/ob小鼠相似的表型。这样的db/db小鼠被认为对循环OB蛋白质的作用具耐受性。评估这些参数的多种体外方法在本领域中也是已知的。
例如,通过核查掺入甘油三酯的14C-乙酸量(Mackall等人,生物化学杂志2516462-6464,1976)或甘油三酯的累积(Kletzien等人,分子药学41393-398,1992),可检验胰岛素刺激的脂肪生成。
可在例如分析胰岛素刺激葡萄糖转运的试验中评估葡萄糖的摄取。将未转染的分化L6肌管(保持在缺乏G418条件中)放入含1g/l葡萄糖、0.5或1.0%BSA、20mM Hepes及2mM谷氨酰胺的DMEM中。培养2-5小时后,用含0.5或1.0%BSA、20mM Hepes、1mM丙酮酸盐和2mM谷氨酰胺的新鲜无葡萄糖DMEM替换原培养基。加入合适浓度的胰岛素或IGF-1或连续稀释度的测试物质,并将细胞温育20-30分钟。加入3H或14C标记的脱氧葡萄糖至终浓度约501M,将细胞温育约10-30分钟。然后用冷缓冲液(如PBS)快速漂洗细胞,之后用合适的裂解试剂(如1%SDS或1N NaOH)将细胞溶解。随后通过闪烁计数器计数估计细胞裂解物。细胞相关的放射活性减去非特异结合(通过将细胞与葡萄糖转运抑制剂cytocholasin b共保温测定)后可作为葡萄糖转运的衡量尺度。还有其它方法可供使用,包括例如Manchester等人,Am.J.Physiol.266(Endocrinol.Metab.29)E326-E333,1994(胰岛素刺激的葡萄糖转运)所述的方法。
通过例如将待测细胞分别与35S-甲硫氨酸及35S-甲硫氨酸和公认的蛋白质合成调节子共保温后比较35S-甲硫氨酸标记蛋白质的沉淀,可评估蛋白质的合成。
可用如下文献所述方法估计产热量B.Stanley,神经肽Y及相关肽的生物学,W.Colmers和C.Wahlestedt(编辑),Humana出版社,Ottawa,1993,pp.457-509;C.Billington等,Am.J.Physiol.260R321,1991;N.Zarjevski等人,内分泌学1331753,1993;C.Billington等人,Am.J.Physiol.266R1765,1994;Heller等人,Am.J.Physiol.252(4 Pt 2)R661-7,1987;及Heller等人,Am.J.Physiol.245(3)R321-8,1983。此外,可用各种技术测量的代谢速率是对产热量的一种间接测量。
可按文献Heller等人,Pflugers Arch 369(1)55-9,1977所述评估耗氧量。此方法还包括下丘脑温度和代谢热量产生的分析。也可如文献Haskell等人,J.Appl.Physiol.51(4)948-54,1981所述对人体中的氧利用和热调节进行评估。
除了本领域已知或本文所述的其它方法之外,还可通过检验内皮组织的功能来评估哺乳动物内皮细胞组织的保护作用。例如,可以通过检验乙酰胆碱的释放、去甲肾上腺素释放或类似参数而评估心脏(主动脉)的功能。可以用本领域常规技术人员已知的技术(试验或动物模型)检验这些参数,下文将更完整地描述。
可以用HPLC检测乙酰胆碱和去甲肾上腺素的释放量。文献Levy,窦房和房室结的电生理学,Alan R.Liss,Inc.,187-197,1998描述了在冠状窦流出物中去甲肾上腺素的测量方法。此外,可电刺激动物,并如Elsner,欧洲心脏杂志16(增刊N)(52-8,1995,和Reiffel和Kuehnert,PACE 17(第1部分)349-65,1994所述检测结果。
除了本领域已知或本文所述的其它方法外,还可通过检测大脑中2-脱氧葡萄糖的吸收评估神经传递功能。可以用本领域常规技术人员已知的技术(检验或动物模型)检测此参数,例如放射自显影。有用的检测技术描述于例如,Kilduff等人,神经科学杂志(J.Neurosci.)10,2463-75,1990中,以及用于评估“冬眠心脏”的相关技术,例如Gerber等人,循环94(4)651-8,1996,和Fallavollita等人,循环95(7)1900-1909,1997所述。
此外,zsig37多肽、片段、及其融合蛋白、激动剂或拮抗剂在治疗上可用于抗微生物或神经递质调节的应用中。例如,补体组分Clq在宿主防御诸如细菌和病毒之类物质侵染中起作用。已知Clq有数种特化功能。例如,Clq通过与结合抗体或C活性蛋白质(CRP)的相互作用引发补体级联反应。此外,Clq直接与某些细菌、RNA病毒、支原体、尿酸晶体、细菌内毒素的脂质A组分和某些胞内细胞器膜相互作用。与Clq受体结合的Clq被认为可促进吞噬作用。Clq还表现出增强宿主防御系统的抗体形成方面。参阅,例如,Johnston,Pediatr.Infect.Dis.J.12(11)933-41,1993。因而,可溶性类Clq分子可作为抗微生物剂,促进侵染物质的裂解或吞噬作用。
本发明的zsig37多肽还与被认为可调节神经传递的部分具同源性。如图1所示,zsig37多肽与以下蛋白质是同源的HP25_TAMAS(Takamatsu等人,分子细胞生物学131516-21,1993和Kondo &Kondo,生物化学杂志267473-8,1992);HP27_TAMAS(上面所提的Takamatsu等人,和Kondo & Kondo)和CERL_RAT(Wada & Ohtani,Brain Res.Mol.Brain Res.971-7,1991)。HP25和HP27是发现于冬眠西伯利亚旱獭的活性(夏季)血清中的多肽。CERL存在于大鼠小脑中的。因此,zsig37多肽、片段、融合蛋白、激动剂或抗体例如可用来通过例如与神经递质或其受体结合而调节神经传递。
放射杂交作图是为构建高分辨率的哺乳动物染色体连续图谱而发展的体细胞遗传学技术(Cox等人,科学250245-250,1990)。利用部分或全部已知的基因序列可设计适于与染色体放射杂交作图板一起使用的PCR引物。有诸如Stanford G3 RH板和GeneBridge 4 RH板(Research Genetics Inc.,Huntsville,AL)之类的覆盖整个人类基因组的市售放射杂交作图板可供使用。利用这些板可以快速地基于PCR进行染色体定位,以及基因、序列标记位点(STS)和其它非多态和多态标记在目的区域内的排列。这包括在新发现的目的基因和事先作图的标记之间建立起成正比例的物理距离。精确了解基因位置在许多方面是有用的,包括1)确定一段序列是否为已有毗连区的一部分,并得到各种形式的周围其它基因序列,如YAC、BAC或cDNA克隆之类,2)为显示与相同染色体区域连锁的遗传疾病提供可能的候选基因,及3)用于交叉参照模型生物,如小鼠,它们在帮助测定某特殊基因有何功能时可能有益。
用NIGMS Human/Rodent Somatic Cell Hybrid Mappsing PanelNumber 2(国家普通医学研究所,Coriell Institute of MedicalResearch)进行PCR,结果显示编码zsig37多肽的基因在图谱上定位于人第17号染色体,区域17q25.2。
本发明还提供了可用于诊断的试剂。例如,zsig37基因、含zsig37DNA或RNA的探针或者它们的亚序列可用于测定zsig37基因是否存在于17号染色体上或是否发生了突变。在zsig37基因座位上可检测的染色体畸变包括,但不局限于非整倍性、基因拷贝数改变、插入、缺失、限制酶切位点改变和重排。这些畸变可发生在编码序列、内含子或侧翼序列内,包括上游启动子和调节区,并可表现为编码序列内的物理改变或基因表达水平上的改变。
大体上,这些诊断方法含以下步骤(a)从病人处获取遗传样品;(b)将此遗传样品与上述多核苷酸探针或引物共温育,所用的温育条件为多核苷酸将与互补多核苷酸序列杂交,从而产生第一反应产物;及(c)比较第一反应产物和对照反应产物。第一反应产物和对照反应产物间的差异是病人遗传异常的指示。本发明中可用的遗传样品包括基因组DNA、cDNA和RNA。多核苷酸探针或引物可以是RNA或DNA,可包括SEQ ID NO1的一部分、SEQ ID NO1的互补物或它们的RNA对应物。在这方面合适的检测方法包括本领域人员已知的分子遗传技术,如限制性片段长度多态性(RFLP)分析、应用PCR技术的短串联重复区(STR)分析、连接链式反应(Barany,PCR方法和应用15-16,1991)、核糖核酸酶保护试验,及其它本领域已知的遗传连锁分析技术(Sambrook等人,同上;Ausubel等人,同上;Marian,Chest 108255-65,1995)。核糖核酸酶保护试验(见如Ausubel等人,同上,第4章)包括RNA探针与病人RNA样品的杂交,之后将反应产物(RNA-RNA杂合物)暴露于RNase中。RNA的杂交区受保护而不被消化。在PCR试验中,将病人的遗传样品与一对多核苷酸引物温育,扩增引物间的区域并回收。回收产物的大小或量的改变指示了病人中突变的存在。另一基于PCR的可应用技术是单链构象多态性(SSCP)分析(Hayashi,PCR方法和应用134-8,1991)。
与17q25.2相关的一种疾病是糖原贮藏疾病II。因而,zsig37多肽可用于此疾病的研究、预防或治疗(如基因治疗)中。若哺乳动物突变或缺失zsig37基因,则可将zsig37基因引入该哺乳动物的细胞中。在一实施例中,将编码zsig37多肽的基因通过病毒载体引入体内。这样的载体包括减毒或缺陷型DNA病毒,例如但不局限于单纯疱疹病毒(HSV)、乳头瘤病毒、非洲淋巴瘤病毒(EBV)、腺病毒、腺伴随病毒(AAV),等等。优选完全或几乎完全缺乏病毒基因的缺陷病毒。缺陷病毒在引入细胞后无感染性。使用缺陷型病毒载体能够施用于特定的局部区域内的细胞,而不用担心载体会侵染其它细胞。具体载体的例子包括,但不局限于,缺陷型疱疹病毒1(HSV1)载体(Kaplitt等人,分子细胞神经科学,2320-330(1991)),减毒腺病毒载体,如Stratford-Perricaudet等人在临床研究杂志(J.Clin.Invest.)90626-630(1992)中所述的载体,及缺陷型腺伴随病毒载体(Samulski等人,病毒学杂志,613096-3101(1987);Samulski等人,病毒学杂志,633822-3828(1989))。
在另一实施例中,可以在逆转录病毒载体中引入基因,例如,如下文献所述;Anderson等人,美国专利号5,399,346;Mann等人,细胞,33153(1983);Temin等人,美国专利号4,650,764;Temin等人,美国专利号4,980,289;Markowitz等人,病毒学杂志621120(1988);Temin等人,美国专利号5,124,263;国际专利申请文件号WO95/07358,1995年3月16日由Dougherty等人公开;和血液,82845(1993)。
或者,可以用脂质体通过体内脂转染法引入载体。合成的阳离子脂类可用于制备脂质体以体内转染编码标志的基因(Felgner等人,美国国家科学院院报,847413-7417(1987);参阅Mackey等人,美国国家科学院院报,858027-8031(1988))。应用脂转染法将外源基因引入体内特定器官具有一定的实用优点。脂质体向特定细胞的分子定向作用是好处之一。很显然,定向转染于特殊细胞代表了好处的一方面。很明显,在具细胞异质性的组织中,如胰、肝、肾和脑中,定向转染至特定细胞类型是尤其有益的。为了定向的目的,可将脂类与其它分子化学偶联。可将靶向肽,如激素或神经递质,和抗体之类的蛋白质,或非肽分子化学偶联至脂质体上。
从身体中分离细胞,并将载体作为裸露DNA质粒引入,然后重植此转化细胞入体内,这是可能的。可以用本领域已知方法将用于基因治疗的裸DNA载体引入目的宿主细胞中,可用技术例如有转染、电穿孔、显微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、基因枪的使用或DNA载体转运蛋白的使用。参阅,如,Wu等人,生物化学杂志267963-967(1992);Wu等人,生物化学杂志26314621-14624(1988);和Johnston和Tang,细胞生物学方法43353-65(1994)。
本发明的另一方面涉及与SEQ ID NO1中所列多核苷酸的一个区段互补的反义多核苷酸组合物。这样的合成反义寡核苷酸被设计成能与编码zsig37多肽的mRNA结合并抑制这些mRNA的翻译。这样的反义寡核苷酸可用于抑制细胞培养物或受试者内zsig37多肽编码基因的表达。
zsig37多肽可用于哺乳动物能量效率的分析中。存在于血清或组织样品中的zsig37多肽可能是哺乳动物贮存食物能力的指示,具较高效率的哺乳动物倾向患肥胖症。更具体地说,本发明涵盖用于检测zsig37多肽的方法,该方法包括将可能含zsig37多肽的样品暴露于附着在固体支持物上的抗体中,其中所说抗体能与zsig37多肽的表位结合;清洗所说的固定化抗体-多肽以去除未结合的污染物;将固定的抗体-多肽暴露于针对zsig37多肽第二表位的二抗中,其中的二抗带有可检测标记;并检测该可检测标记。测试样品中zsig37多肽的浓度看来是哺乳动物能量效率的指示。此信息可有助于哺乳动物的营养分析。此信息或许还可用于鉴定和/或定向到能量缺陷组织。
本发明的另外方面提供了能与上述zsig37多肽特异结合的抗体。除了本文所述的其它用途之外,这样的抗体还可用于制备抗独特型抗体。本发明的另外方面提供了鉴定上述zsig37多肽的激动剂或拮抗剂的方法,如本文进一步讨论的,该激动剂或拮抗剂可具有有用的特性。在一实施例中提供了鉴定zsig37多肽激动剂的方法,包括提供对其有反应性的细胞,在测试复合物存在下培养该细胞,并与在zsig37多肽存在下培养的细胞比较其细胞反应,再选择细胞反应为相同类型的测试复合物。
在另一实施例中提供了鉴定zsig37多肽的拮抗剂的方法,包括提供对zsig37多肽有反应性的细胞,在存在zsig37多肽的条件中培养该细胞的第一部分,在zsig37多肽和测试复合物存在的条件下培养该细胞的第二部分,并检验第二部分细胞与第一部分细胞相比其细胞反应的降低。除了本文所公开的那些试验外,还可在为检验受体结合或zsig37依赖型细胞反应的刺激作用/抑制作用而设计的各种试验中检验样品对zsig37活性的抑制作用。例如,可用对zsig37刺激的细胞途径有反应的报道基因构建体转染zsig37反应性细胞系。此类型报告基因构建体在本领域中是已知的,其中通常包含与编码可检测蛋白质,如萤光素酶的基因可操作连接的zsig37-DNA效应元件。DNA效应元件可包括,但不局限于,环AMP效应元件(CRE)、激素效应元件(HRE)、胰岛素效应元件(IRE)(Nasrin等人,美国国家科学院院报875273-7,1990)和血清效应元件(SRE)(Shaw等人,细胞56563-72,1989)。环AMP效应元件综述于Roestler等人,生物化学杂志,263(19)9063-6,1988和Habener,分子内分泌学4(8)1087-94,1990。激素效应元件综述于Beato,细胞56335-44,1989。检测候选化合物、溶液、混合物或提取物抑制靶细胞上zsig37活性的能力(由zsig37刺激的报告基因表达的降低可评估)。此类试验能检验出直接阻断zsig37与细胞表面受体的结合的化合物,以及阻断受体-配体结合后细胞途径中各个过程的化合物。或者,可以用标记了可检测标志(如,125I、生物素、辣根过氧化物酶、FITC,等等)的zsig37检测化合物或其它样品对zsig37与受体结合的直接阻断作用。在此类试验中,测试样品抑制标记zsig37与受体结合的能力是抑制活性的指示,它可通过二级试验证实。结合试验中所用受体可以是细胞受体或分离的固定化受体。
本发明的进一步方面提供了研究胰岛素的方法。本发明的此类方法包括在含zsig37多肽、其单克隆抗体、激动剂或拮抗剂±胰岛素的培养基中温育脂肪细胞,并观察脂肪细胞蛋白质分泌或分化的变化。
抗微生物防护剂可直接或间接作用。通过膜结合或孔形成作用机制发挥功能的此类试剂直接附着到侵犯微生物上。抗微生物试剂也可通过酶促机制作用,分解微生物保护物质或其细胞壁/膜。能通过上述两种机制之一抑制微生物的增殖或作用或者能破坏微生物完整性的抗微生物剂可用于预防细胞培养物受对该抗微生物活性敏感的微生物污染的方法中。这样的技术包括在有效量的zsig37多肽或其激动剂或拮抗剂存在时培养细胞。
此外,在外源微生物感染,如细菌、病毒或真菌感染的体外研究中,zsig37多肽或其激动剂可用作细胞培养试剂。这样的部分也可用于感染的体内动物模型中。
本发明还提供了研究哺乳动物细胞代谢的方法。本发明这样的方法包括将待研究细胞(例如人血管内皮细胞)±zsig37多肽、其单克隆抗体、激动剂或拮抗剂一起温育,并且观察其在脂肪生成、葡糖异生、糖酵解、脂生成、葡萄糖吸收或其它方面的变化。
本发明的另外方面提供了研究二聚体化或多聚体化的方法。本发明这样的方法包括将zsig37多肽或者它的含类胶原蛋白结构域的片段或融合蛋白单独温育或者与其它带类胶原蛋白结构域的多肽混合温育,并观察类胶原蛋白结构域之间形成的结合。由HPLC、圆二色性或类似方法可指示这样的结合。
如前面所提到,本发明的分离多核苷酸包括DNA和RNA。分离DNA和RNA的方法在本领域是众所周知的。一般优选从脑肿瘤、心脏、胎盘、脂肪组织等等中分离RNA,而DNA也可用来自其它组织的RNA制备或作为基因组DNA分离。总RNA可通过盐酸胍提取、然后用氯化铯梯度离心分离而制备(Chirgwin等人,生物化学1852-94,1979)。poly(A)+RNA可用Aviv和Leder的方法制备自总RNA(美国国家科学院院报691408-1412,1972)。可以用已知技术从poly(A)+RNA制备互补DNA(cDNA)。然后可以用例如杂交或PCR方法鉴定和分离编码zsig37多肽的多核苷酸。
本发明进一步提供了来自其它物种的相应多肽和多核苷酸(正同系物或副同系物)。这些物种包括,但不局限于哺乳动物、鸟类、两栖类、爬行类、鱼类、昆虫和其它脊椎动物和无脊椎动物物种。尤其令人感兴趣的是来自其它哺乳动物物种的zsig37多肽,包括小鼠、大鼠、猪、绵羊、牛、犬、猫、马和其它灵长类蛋白质。将本发明提供的信息和复合物与传统克隆技术相结合可克隆人蛋白质的正同系物。例如,用获自表达该蛋白质之组织或细胞类型的mRNA可克隆cDNA。用设计自本文公开序列的探针通过探测Northern印迹可鉴定mRNA的合适来源。再从阳性组织或细胞系的mRNA制备文库。然后可以用各种方法,诸如用完全或部分人cDNA或用基于公开序列的一套或多套简并探针进行探测,分离zsig37多肽编码cDNA。也可以用设计自本文公开序列的引物,通过聚合酶链式反应或PCR(Mullis,美国专利4,683,202)克隆cDNA。在又一种方法中,可以用cDNA文库转化或转染宿主细胞,再用抗zsig37多肽的抗体检测目的cDNA的表达。相似技术也可应用于基因组克隆的分离。用本文提供的序列,通过筛选物种特异性EST数据库也可鉴定正同系物。如下文详述,通过筛选小鼠EST数据库发现了编码鼠zsig37正同系物的EST。小鼠正同系物(SEQ ID NO43)与人序列在核苷酸水平和氨基酸水平上均具77%的同一性。
本领域技术熟练人员将认识到,公开于SEQ ID NO1和SEQ ID NO2中的序列代表了人zsig37 DNA和蛋白质的一个等位基因,并且预期会发生等位变异和其它剪接方式。按标准步骤,探查来自不同个体的cDNA或基因组文库,可克隆此序列的等位变体。SEQ ID NO1中所示DNA序列的等位变体,包括那些含沉默突变的变体和突变导致氨基酸序列改变的变体,均在本发明范围内,SEQ ID NO2等位变体的蛋白质也是如此。产生自其它方式剪接的mRNA、并保留了zsig37多肽特性的cDNA包括在本发明范围内,由这些cDNA和mRNA编码的多肽也是如此。按本领域已知标准步骤,通过探查来自不同个体或组织的cDNA或基因组文库,可克隆这些序列的等位变体和剪接变体。
本发明还提供了与SEQ ID NO2之多肽及它们的物种同系物/正同系物基本同源的分离zsig37多肽。此处所用术语“基本同源”表示多肽与SEQ ID NO2中所示序列或它们的正同系物或副同系物具50%、优选60%、更优选至少80%的序列同一性。这样的多肽将更优选与SEQID NO2或者其正同系物或副同系物具至少90%的同一性,最优选有95%或更多的同一性。可以用传统方法测定序列相同百分率。参阅,如,Altschul等人,Bull.Math.Bio.48603-616,1986和Henikoff和Henikoff,美国国家科学院院报8910915-10919,1992。简短地说,用缺口开放罚分为10,缺口延伸罚分为1,以及表3所示的Henikoff和Henikoff(同上)之“blosum 62”评分矩阵(用标准单字母密码表示氨基酸)对比两氨基酸序列,以使对比评分最优。然后按下式计算同一性百分率
表3A R N D C Q E G H I L K M F P S T W Y VA 4R -1 5N -2 0 6D -2 -2 1 6C 0 -3 -3 -3 9Q -1 1 0 0 -3 5E -1 0 0 2 -4 2 5G 0 -2 0 -1 -3 -2 -2 6H -2 0 1 -1 -3 0 0 -2 8I -1 -3 -3 -3 -1 -3 -3 -4 -3 4L -1 -2 -3 -4 -1 -2 -3 -4 -3 2 4K -1 2 0 -1 -3 1 1 -2 -1 -3 -2 5M -1 -1 -2 -3 -1 0 -2 -3 -2 1 2 -1 5F -2 -3 -3 -3 -2 -3 -3 -3 -1 0 0 -3 0 6P -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4 7S 1 -1 1 0 -1 0 0 0 -1 -2 -2 0 -1 -2 -1 4T 0 -1 0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1 1 5W -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1 1 -4 -3 -2 11Y -2 -2 -2 -3 -2 -1 -2 -3 2 -1 -1 -2 -1 3 -3 -2 -2 2 7V 0 -3 -3 -3 -1 -2 -2 -3 -3 3 1 -2 1 -1 -2 -2 0 -3 -1 4
用上述比率通过相似方法测定多核苷酸分子的序列同一性。
基本同源的蛋白质和多肽的特征在于具有一个或多个氨基酸的取代、删除或添加。这些改变优选是微小性质的改变,即为保守氨基酸取代(见表4)和其它不会严重影响蛋白质或多肽折叠或活性的取代;小的删除,一般约为1-30个氨基酸;及小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基,多达约20-25个残基的小连接肽,或亲和标志。含亲和标记的多肽中可在zsig37多肽和亲和标签之间进一步包括一个蛋白水解断裂位点。优选包括凝血酶裂解位点和因子Xa裂解位点在内的这些位点。
表4保守氨基酸取代碱性氨基酸 精氨酸赖氨酸组氨酸酸性氨基酸 谷氨酸天冬氨酸极性氨基酸 谷氨酰胺天冬酰胺疏水氨基酸 亮氨酸异亮氨酸缬氨酸芳香族氨基酸 苯丙氨酸色氨酸酪氨酸小氨基酸甘氨酸丙氨酸丝氨酸苏氨酸甲硫氨酸本发明的蛋白质也可包含非天然存在的氨基酸残基。非天然存在的氨基酸包括,但不限于,反式-3-甲基脯氨酸、2,4-甲烷脯氨酸、顺式-4-羟脯氨酸、反式-4-羟脯氨酸、N-甲基甘氨酸、别苏氨酸、甲基苏氨酸、羟乙基半胱氨酸、羟乙基同型半胱氨酸、硝基谷氨酰胺、同型谷氨酰胺、六氢吡啶羧基、四氢噻唑羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸、3,3-二甲基脯氨酸、叔亮氨酸、正缬氨酸、2-氮杂苯丙氨酸、3-氮杂苯丙氨酸、4-氮杂苯丙氨酸,和4-氟苯丙氨酸。本领域已知几种将非天然存在的氨基酸残基掺入蛋白质的方法。例如,可使用体外系统,其中用化学氨酰化抑制子tRNA抑制无义突变。合成氨基酸和氨酰化tRNA的方法在本领域中是已知的。可以在包含大肠杆菌S30提取液和市售酶和其它试剂的无细胞体系中进行含无义突变之质粒的转录和翻译。用层析法纯化蛋白质。(参阅,例如,Robertson等人,J.Am.Chem.Soc.1132722,1991;Ellman等人,酶学方法,202301,1991;Chung等人,科学259806-9,1993;和Chung等人,美国国家科学院院报9010145-9,1993)。在第二种方法中,通过显微注射突变mRNA和化学氨酰化抑制子tRNA,可以在非洲爪蟾卵母细胞内进行翻译(Turcatti等人,生物化学杂志27119991-8,1996)。在第三种方法中,于在缺乏欲被替代的天然氨基酸(如苯丙氨酸)而存在所需的非天然氨基酸(如2-氮杂苯丙氨酸、3-氮杂苯丙氨酸、4-氮杂苯丙氨酸或4-氟苯丙氨酸)的条件下培养大肠杆菌细胞。非天然氨基酸将代替其天然相应物掺入细胞中。参阅,Koide等人,生物化学337470-6,1994。用体外化学修饰法可将天然存在的氨基酸残基转变为非天然存在的种类。可以将化学修饰法与定位诱变结合起来,以进一步拓宽取代的范围(Wynn和Richards,蛋白质科学2395-403,1993)。
可以用有限数目的非保守氨基酸、不由遗传密码编码的氨基酸、非天然存在的氨基酸及非天然氨基酸取代zsig37氨基酸残基。
可以按本领域已知步骤,如定位诱变或丙氨酸扫描诱变,鉴定本发明多肽中的必需氨基酸(Cunningham和Wells,科学2441081-5,1989;Bass等人,美国国家科学院院报884498-502,1991)。在后一种技术中,在分子内每一残基处引入单个丙氨酸突变,如下文所述检验所得突变分子的生物学活性(如调节能量平衡的能力)以鉴定对分子活性起关键作用的氨基酸残基。也参阅,Hilton等人,生物化学杂志2714699-708,1996。也可用诸如结构的物理分析也可通过对由诸如核磁共振、晶体学、电子衍射或光亲和标记之类技术确定的结构进行物理分析,结合潜在接触位点氨基酸的突变,而确定配基-受体或其它生物学相互作用的位点。参阅,例如,de Vos等人,科学255306-12,1992;Smith等人,分子生物学杂志224899-904,1992;Wlodaver等人,FEBS Lett.30959-64,1992。也可从与相关多肽的同源性分析推断哪些是必需氨基酸。
用已知的诱变和筛选方法,如Reidhaar-Olson和Sauer(科学24153-7,1988)或Bowie和Sauer(美国国家科学院院报862152-6,1989)所公开的方法,可造出多氨基酸替换并进行检验。简短地说,这些作者公开了使多肽中两个或多个位置同时随机化、选择功能多肽,然后测定诱变多肽的序列以确定每一位置处可允许取代的范围的方法。其它可用的方法包括噬菌体展示(如,Lowman等人,生物化学3010832-7,1991;Ladner等人,美国专利号5,223,409;Huse,WIPO申请文件WO92/06204)和定位诱变(Derbyshire等人,基因46145,1986;Ner等人,DNA 7127,1988)。
如Stemmer,自然370389-91,1994;Stemmer,美国国家科学院院报9110747-51,1994和WIPO公开文件WO97/20078所述,通过DNA重排可产生已公开的zsig37 DNA和多肽的变体。简短地说,通过亲代DNA随机断裂后经PCR重新装配的体外同源重组导致随机引入点突变,可产生变体DNA。用亲代DNA家族,如等位变体或来自不同物种的DNA而在此过程中引入更多变异性,可改进该技术。选择或筛选合乎需要的活性,再反复进行诱变和检测,即可通过选择合乎要求的突变并同时抛弃有害基因改变而使序列快速“进化”。
如上所公开的诱变方法可与高容量的自动筛选方法结合,以检测宿主细胞中克隆的诱变多肽的活性。编码活性多肽的诱变DNA分子(如,调节能量平衡的能力)可回收自宿主细胞并用现代化装置快速测序。这些方法可快速确定目的多肽中各个氨基酸残基的重要性,并可应用于未知结构的多肽。
本领域普通技术人员用上述方法可鉴定和/或制备与SEQ ID NO2第22-281位残基或其等位变体基本同源并保留野生型蛋白质之能量平衡调节或其它特性的多种多肽。这样的多肽可包括诸如Gly-Xaa-Pro或Gly-Xaa-Xaa型附加胶原蛋白重复序列之类的附加氨基酸。这样的多肽还可包括如上文一般性公开的附加多肽部分。
可按常规技术在基因工程化宿主细胞中生产本发明的多肽,包括全长蛋白质、其片段及融合蛋白。合适的宿主细胞是能用外源DNA转化或转染并可在培养中生长的那些细胞类型,包括细菌、真菌细胞和人工培养的高等真核细胞。优选真核细胞,尤其是多细胞生物的培养细胞。操作克隆DNA分子和将外源DNA引入各种宿主细胞的技术公开于如下文献Sambrook等人,分子克隆实验室手册,第二版,冷泉港实验室出版社;冷泉港,纽约,1989,和Ausubel等人(编辑),分子生物学最新方法,John Wiley和Son s,Inc.,纽约,1987。
一般地,将编码本发明zsig37多肽的DNA序列与其表达所需的其它遗传元件可操作连接,通常包括表达载体内的转录启动子和终止子。载体通常还含一个或多个可选择标记和一个或多个复制起点,尽管本领域技术熟练人员将认识到,在某些系统中选择标记可提供于不同载体上,且可通过整合入宿主细胞基因组而提供外源DNA的复制。启动子、终止子、可选择标记、载体和其它元件的选择是本领域普通技术水平上的常规设计问题。许多这样的元件被描述于文献中并可获自商品供应者。
为了指导zsig37多肽进入宿主细胞的分泌途径,可在表达载体中提供分泌信号序列(也已知为前导序列、信号序列、前原序列或前序列)。分泌信号序列可以是zsig37多肽本身的,或可来自另一种分泌蛋白质(如,t-PA)或从新合成的。以正确的阅读框架将分泌信号序列与zsig37多肽DNA序列连接。尽管某些信号序列可以置于目的DNA序列中的其它位置,但分泌信号序列通常是位于编码目的多肽之DNA序列的5′端(参阅,如,Welch等人,美国专利号5,037,743;Holland等人,美国专利号5,143,830)。相反地,zsig37多肽的信号序列部分(SEQ ID NO2之氨基酸1-21或1-25)可通过类似方法用于指导其它蛋白质的分泌。
本发明多肽中所含的分泌信号序列可用于指导其它多肽进入分泌途径。本发明也提供这样的融合多肽。用本领域已知和本文公开的方法,可制备信号融合多肽,其中来自SEQ ID NO2之氨基酸残基1-22或1-25的分泌信号序列与另一多肽可操作连接。本发明融合多肽中所含分泌信号序列优选在氨基末端与附加肽融合以指导该附加肽进入分泌途径。已知这样的构建体在本领域中有许多应用。例如,这些新分泌信号序列融合构建体能指导诸如受体之类通常为非分泌蛋白质的活性组分的分泌。这样的融合体可用于体内或体外,以指导肽通过分泌途径。
在本发明中,人工培养的哺乳动物细胞也是合适的宿主。将外源DNA引入哺乳动物宿主细胞的方法包括磷酸钙介导的转染(Wigler等人,细胞14725,1978;Corsaro和Pearson,体细胞遗传学7603,1981;Graham和Van der Eb,病毒学52456,1973)、电穿孔(Neumann等,EMBO J.,1841-845,1982)、DEAE-葡聚糖介导的转染(Ausubel等人,编辑,分子生物学最新方法,John Wiley和Sons,Inc.,纽约,1987)、脂质体介导的转染(Hawley-Nelson等人,焦点1573,1993;Ciccarone等人,焦点1580,1993)及病毒载体(A.Miller和G.Rosman,生物技术7980-90,1989;Q.Wang和M.Finer,Nature Med.2714-16,1996)。在人工培养哺乳动物细胞中生产重组多肽的方法公开于例如下述文献中Levinson等人,美国专利号4,713,339;Hagen等人,美国专利号4,784,950;Palmiter等人,美国专利号4,579,821;和Ringold,美国专利号4,656,134。优选的人工培养哺乳动物细胞包括COS-1(ATCC No.CRL 1650)、COS-7(ATCC No.CRL1651)、BHK570(ATCC No.CRL 10314)、293(ATCC No.CRL 1573;Graham等人,普通病毒学杂志3659-72,1977)和中国仓鼠卵巢细胞系(如CHO-Kl;ATCC No.CCL61)。另外的合适细胞系在本领域中是已知的,并可获自诸如美国典型培养物保藏中心,Rockville,马里兰之类的公共保藏机构。一般地,优选强转录启动子,如来自SV40或巨细胞病毒的启动子。参阅如美国专利号4,956,288。其它合适启动子包括来自金属硫蛋白基因的启动子(美国专利号4,579,821和4,601,978)和腺病毒主要晚期启动子。
药物选择通常用于选择已插入外源DNA的人工培养哺乳动物细胞。这样的细胞通常被称为“转染子”。已在选择剂中培养并能将目的基因传给子代的细胞称为“稳定的转染子”。优选的选择标记是编码对抗生素新霉素的抗性的基因。在新霉素型药物,如G-418或类似药物存在时进行选择。选择系统也可用于提高目的基因的表达水平,此过程被称为“扩增”。通过在低水平选择剂中培养转染子和随后逐步提高选择剂量来选择高水平生产引入基因的产物的细胞,以进行扩增。优选的可扩增选择标记是二氢叶酸还原酶,它赋于氨甲喋呤抗性。也可使用其它药物抗性基因(如潮霉素抗性、多抗病性、嘌呤霉素乙酰转移酶)。引入改变表型的其它标记,如绿色萤光蛋白,或者CD4、CD8、I类MHC之类的细胞表面蛋白,胎盘碱性磷酸酶,均可用来通过FACS分拣术或磁珠分离技术之类的方式从未转染细胞中挑选转染细胞。
其它较高等真核细胞也可用作宿主,包括植物细胞、昆虫细胞和禽类细胞。用毛根农杆菌作为植物细胞中表达基因的载体已由Sinkar等人综述于生物科学杂志(Bangalore)1147-58,1987中。昆虫细胞的转化及其中外源多肽的产生公开于Guarino等人的美国专利号5,162,222和WIPO公开文件WO94/06463中。可以用通常来自苜蓿银纹夜蛾核型多角体病毒(AcNPV)的重组杆状病毒感染昆虫细胞。参阅King和Possee,杆状病毒表达系统实验室指导手册,伦敦,Chapman和Hall;O’Reilly等人,杆状病毒表达载体实验室手册,纽约,牛津大学出版社,1994;和Richardson,C.D.,编辑,杆状病毒表达方案,分子生物学方法。Totowa,NJ,Humana Press,1995。制备重组zsig37杆状病毒的另一种方法利用了Luckow所述的基于转座子的系统(Luckow等人,病毒学杂志674566-79,1993)。利用转移载体的该系统以Bac-to-BacTM试剂盒(Life Technologies,Rockville,MD)形式有售。该系统利用转移载体,即含Tn7转座子的pFastBaclTM(LifeTechnologies)将编码zsig37多肽的DNA移入作为一大质粒(称之为“杆粒”)保持于大肠杆菌中的标状病毒基因组内。参阅,Hill-Perkins和Possee,普通病毒学杂志71971-6,1990;Bonning等人,普通病毒学杂志751551-6,1994;和Chazenbalk和Rapoport,生物化学杂志2701543-9,1995。此外,转移载体可包括编码表位标签(例如Glu-Glu表位标签)的DNA在所表达zsig37多肽C-或N-末端的框架内融合体(Grussenmeyer等人,国家科学院院报827952-4,1985)。用本领域已知技术将含zsig37的转移载体转化入大肠杆菌,并筛选含断裂lac Z基因、指示是重组杆状病毒的杆粒。用常规技术分离含重组杆状病毒基因组的杆粒DNA,并将其用于转染秋粘虫细胞,如Sf9细胞。随后产生表达zsig37的重组病毒。用本领域常用方法制备重组病毒原种。
利用重组病毒侵染宿主细胞,一般为来自秋粘虫,即草地夜蛾的细胞系。大体上参阅Glick和Pasternak,分子生物工程学重组DNA的原理和应用,ASM Press,Washington D.C.,1994。另一合适细胞系是来自粉纹夜蛾(美国专利#5,300,435)的High Five OTM细胞系(Invitrogen)。用可购买到的无血清培养基培养和维持此细胞。对Sf9细胞来说合适的培养基是Sf900 IITM(Life Technologies)或ESF921TM(表达系统);对粉纹夜蛾细胞来说合适的培养基是Ex-Cell 0405TM(JRH Biosciences,Lenexa,KS)或Express Five OTM(LifeTechnologies)。细胞从约2-5×105个细胞的接种密度生长起来至1-2×106个细胞的密度,此时以0.1-10、通常为接近3的感染复数(MOI)加入重组病毒原种。所用步骤总述于可获得的实验室手册(King和Possee,同上;O’Reilly等人,同上;Richardson,同上)。用本文所述方法可完成zsig37多肽从上清中的后续纯化。
真菌细胞,包括酵母细胞,也可用于本发明中。在此方面特别让人感兴趣的酵母种类包括酿酒酵母、巴斯德毕赤酵母和Pichiamethanolica。用外源DNA转化酿酒酵母细胞并从中产生重组多肽的方法公开于例如下述文献中Kawasaki,美国专利号4,599,311;Kawasaki等人,美国专利号4,931,373;Brake,美国专利号4,870,008;Welch等人,美国专利号5,037,743和Murray等人,美国专利号4,845,075。用由选择标记确定的表型,通常是药物抗性或在特殊营养成分(如亮氨酸)缺乏时生长的能力选择转化细胞。用于酿酒酵母的优选载体系统是由Kawasaki等人公开的POT1载体系统(美国专利号4,931,373),它可通过在含葡萄糖的培养基中的生长来选择转化细胞。酵母中适用的启动子和终止子包括那些来自糖酵解酶基因(参阅,如Kawasaki,美国专利号4,599,311;Kingsman等人,美国专利号4,615,974;和Bitter,美国专利号4,977,092)和乙醇脱氢酶基因的启动子和终止子。也参阅美国专利号4,990,446;5,063,154;5,139,936和4,661,454。本领域已知用于其它酵母的转化系统,包括多形汉森酵母、非洲粟酒裂殖酵母、乳酸克鲁维酵母、脆壁克鲁维酵母、玉蜀黍黑粉菌、巴斯德毕赤酵母、Pichiamethanolica、季也蒙毕赤酵母和Candida maltosa。参阅例如Gleeson等人,普通微生物学杂志1323459-65,1986和Cregg,美国专利号4,882,279。可按McKnight等人,美国专利号4,935,349的方法利用曲霉属细胞。转化Acremonium chrysogenum的方法公开于Sumino等人的美国专利号5,162,228中。转化链孢菌属细胞的方法公开于Lambowitz的美国专利号4,486,533中。
WIPO公开文件WO97/17450、WO97/17451、WO98/02536和WO98/02565中公开了利用Pichia methanolica作为宿主生产重组蛋白质的方法。用于转化P.methanolica的DNA分子通常被制备成双链环状质粒,优选在转化前将其线性化。为了在P.methanolica中生产多肽,优选质粒中的启动子和终止子是P.methanolica的,如P.methanolica醇利用基因(AUG1或AUG2)的。其它的有用启动子包括二羟丙酮合成酶(DHAS)、甲酸脱氢酶(FMD)和过氧化氢酶(CAT)基因的启动子。为了便于DNA整合进入宿主染色体,优选质粒完整表达区段的侧翼两端为宿主DNA序列。P.methanolica中可用的优选选择标记是P.methanolica ADE2基因,它编码使ade2宿主细胞在缺乏腺嘌呤时仍可生长的磷酸核糖基-5-氨基咪唑羧化酶(AIRC;EC4.1.1.21)。进行大规模工业生产时,理想的是将甲醇使用量减到最小的,因此优选使用甲醇利用基因(AUG1和AUG2)均被删除的宿主细胞。生产分泌蛋白质时,优选液泡蛋白酶基因(PEP4和PRB1)缺陷的宿主细胞。可使用电穿孔法促进将带编码目的多肽之DNA的质粒引入P.methanolica细胞。优选用指数衰减的脉冲电场通过电穿孔转化P.methanolica细胞,其中场强为2.5-4.5kV/cm,优选约3.75kV/cm,时间常数(τ)为1-40毫秒,最优选为20毫秒。
在本发明中,包括大肠杆菌、芽孢杆菌和其它属菌株在内的原核宿主细胞也可用作宿主细胞。转化这些宿主并表达克隆于其中的外源DNA序列的技术在本领域是众所周知的(参阅如Sambrook等人,同上)。在诸如大肠杆菌之类的细菌中表达zsig37多肽时,多肽可能保留在细胞质中,一般是作为不溶性颗粒体,或可能通过细菌分泌序列导入周质间隙。在前一种情况中,溶解细胞,并用例如异硫氰酸胍或尿素将颗粒体回收和变性。然后通过稀释变性剂,如通过对尿素溶液透析及联合使用还原型和氧化型谷胱甘肽,随后对缓冲盐溶液透析,使变性多肽重折迭或二聚体化。在后一种情况中,通过破裂细胞(用,例如,超声处理或渗透压休克)释放周质间隙内容物并回收蛋白质的方法将多肽以可溶及有功能形式自周质间隙回收,这样不需要变性和再折迭。
在含所选宿主细胞生长需要的养分和其它组分的培养基中按常规步骤培养转化或转染的宿主细胞。包括合成培养基和复合培养基在内的各种合适培养基在本领域中是已知的,通常包括碳源、氮源、基本氨基酸、维生素和矿物质。如果需要,培养基也可含诸如生长因子或血清之类的组分。生长培养基通常可通过例如药物选择或基本养分的缺乏(通过在表达载体上携带的或共转染入宿主细胞的选择标记可补充所缺乏的基本养分)选择含外源加入DNA的细胞。
用分级分离和/或常规纯化方法和介质可纯化所表达的重组zsig37多肽(或嵌合zsig37多肽)。硫酸铵沉淀和酸或离液剂抽提可用于样品的分级分离。典型的纯化步骤可包括羟基磷灰石层析、大小排阻层析、FPLC和反相高效液相层析。合适的层析介质包括衍生化葡聚糖、琼脂糖、纤维素、聚丙烯酰胺、特化硅胶,等等。优选PEI、DEAE、QAE和Q衍生物。典型的层析介质包括那些带苯基、丁基或辛基基团的介质衍生物,如Phenyl-Sepharose FF(Pharmacia)、Toyopearl butyl 650(Toso Haas,Montgomeryville,PA)、Octyl-Sepharose(Pharmacia)等等;或聚丙烯树脂,如Amberchrom CG71(Toso Haas)等等。合适的固相支持物包括玻璃珠、硅基树脂、纤维素树脂、琼脂糖珠、交联琼脂糖珠、聚苯乙烯珠、交联聚丙烯酰胺树脂等等,它们在将要使用的条件中是不溶的。这些支持物可用允许蛋白质通过氨基、羧基、巯基、羟基和/或碳水化合物部分附着其上的反应基团改性。偶联化学法的例子包括溴化氰活化、N-羟基琥珀酰亚胺活化、环氧化物活化、巯基活化、肼活化和用于碳二亚胺偶联化学法的羧基和氨基衍生物。这些和其它固相介质在本领域里是众所周知并广泛应用的,可购自商品供应者处。将受体多肽结合到支持介质上的方法在本领域中是已知的。具体方法的选择是常规设计的问题,部分由所选支持物的特性确定。参阅,如,亲和层析原理和方法,Pharmacia LKB Biotechnology,Uppsala,Sweden,1988。
通过利用其结构和结合特性可分离本发明多肽。例如,固定化金属离子吸附(IMAC)层析可用于纯化富含组氨酸的蛋白质或具组氨酸标签的蛋白质。简短地说,首先用二价金属离子使凝胶带电,以形成螯合物(E.Sulkowski,生化动态31-7,1985)。取决于所用金属离子,富含组氨酸的蛋白质将以不同的亲和力吸附于此基质上,并通过竞争性洗脱液降低pH或用强螯合剂将其洗脱。其它的纯化方法包括用凝集素亲和层析和离子交换层析纯化糖基化蛋白质(酶学方法,Vol.182,“蛋白质纯化指南”,M.Deutscher,(编辑),Acad.Press,圣地哥,1990,pp.529-39)。在本发明的其它优选实施方案中,如以下实施例部分详述的,可构建目的多肽与亲和标签(如麦芽糖结合蛋白质、FLAG、Glu-Glu、免疫球蛋白结构域)的融合体以便于纯化。
可有利地利用蛋白质重折迭(及任选地,重氧化)步骤。优选纯化蛋白质至纯度大于80%,更优选大于90%的纯度,还更优选大于95%,尤其优选的是药学纯状态,即对于污染的大分子,尤其是其它蛋白质和核酸而言,纯度高于99.9%,且无侵染性和热原介质。优选地,纯化蛋白质基本上无其它蛋白质,尤其是动物来源的其它蛋白质。
也可通过化学合成制备zsig37多肽或其片段。这样的zsig37多肽可以是单体或多聚体;糖基化或未糖基化;PEG化或未PEG化;并且可以包括或不包括起始甲硫氨酸残基。
诸如zsig37多肽结合多肽之类的配体结合多肽也可用于配体的纯化。将多肽固定于固相支持物上,如琼脂糖珠、交联琼脂糖、玻璃、纤维素树脂、硅基树脂、聚苯乙烯、交联聚丙烯酰胺,或在使用条件下稳定的类似材料。将多肽连接于固相支持物上的方法是本领域所已知的,包括胺化学法、溴化氢活化、N-羟基琥珀酰亚胺活化、环氧化物活化、巯基活化及肼活化。产生的介质通常制成柱子形式,并将含配基的液体通过此柱一次或多次以使配基与配基结合多肽结合。然后通过改变盐浓度、使用离液剂(盐酸胍)或pH来破坏配基-受体结合,从而将配基洗脱。
可有利地应用使用配基结合受体(或抗体,互补物/抗互补物对的一员)或其结合片段的分析系统及可购买到的生物传感仪器(BIAcoreTM,Pharmacia Biosensor,Piscataway,NJ)。将这样的受体、抗体、互补物/抗互补物对部分或片段固定至受体片表面。此仪器的使用公开于Karlsson,免疫学方法杂志145229-40,1991中和Cunningham和Wells,分子生物学杂志234554-63,1993中。用胺或巯基化学法将受体、抗体、成员或片段共价附着到葡聚糖纤维上,此纤维附着至处于流式槽中的金薄上。将试验样品通过此小槽。如果样品中存在配基、表位或互补物/抗互补物对的相反成员,它将分别结合至该固定化受体、抗体或成员上,引起介质折射率的改变,它可检测为金薄表面胞质团共振的变化。此系统可测定结合率和解离率,从中能计算结合亲和力和结合化学计量的估计数。
配体结合多肽也可用于本领域已知的其它检验系统中。这样的系统包括确定结合亲和力的斯卡查德分析法(参阅Scatchard,Ann.NYAcad.Sci.51660-72,1949)及量热分析法(Cunningham等人,科学253545-48,1991;Cunningham等人,科学245821-25,1991)。
zsig37多肽也可用于制备能特异结合zsig37多肽表位、肽或多肽的抗体。制备多克隆和单克隆抗体的方法在本领域中是众所周知的(参阅如Sambrook等人,分子克隆实验室手册,第二版,冷泉港,纽约,1989;和Hurrell,J.G.R.,编辑,单克隆杂交瘤抗体技术和应用,CRC出版公司,Boca Raton,FL,1982)。
正如本领域普通技术人员所明知的那样,多克隆抗体能产生自接种的各种温血动物,如马、牛、山羊、绵羊、狗、鸡、兔子、小鼠、仓鼠、豚鼠和大鼠以及转基因动物,如转基因绵羊、牛、山羊或猪。抗体也可以修饰形式在酵母和真菌以及哺乳动物和昆虫细胞中表达。zsig37多肽或其片段可用作抗原(免疫原)以接种动物或诱发免疫应答。合适的抗原包括SEQ ID NO2编码的zsig37多肽、SEQ ID NO2之第22-281位氨基酸残基片段、SEQ ID NO2之第26-281位氨基酸残基片段或其连续的9-281个氨基酸残基片段。通过使用明矾(氢氧化铝)或者弗氏完全或不完全佐剂之类的佐剂可提高zsig37多肽的免疫原性。可用于免疫接种的多肽还包括融合体,如zsig37或其一部分与免疫球蛋白多肽或亲和标签的融合多肽。多肽免疫原可以是全长分子或其一部分。若多肽部分是“类半抗原”,则将这样的部分加入或连接至大分子载体(如匙孔血蓝蛋白(KLH)、牛血清清蛋白(BSA)或破伤风类毒素)用于免疫接种比较有利。
如本文中所用,术语“抗体”包括多克隆抗体、亲和纯化多克隆抗体、单克隆抗体,及抗原结合片段,如F(ab′)2和Fab蛋白水解片段。还包括基因工程化完整抗体或片段,如嵌合抗体、Fv片段、单链抗体等等,以及合成的抗原结合肽和多肽。通过只移植非人CDR至人的构架和恒定区中,或通过掺入完整的非人可变区(任选地通过取代暴露残基而用类人表面“包藏”它们,结果产生“镶盖”抗体),可将非人抗体人源化。在某些例子中,人源化抗体可在人可变区构架结构域中保留非人源残基以增强正确结合的特性。通过使抗体人源化,可提高生物半寿期,并降低施用于人时产生不利免疫反应的潜力。产生或选择此处有用的抗体的其它技术包括在体外将淋巴细胞暴露于zsig37蛋白质或多肽,以及对噬菌体或相似载体中的抗体展示文库进行选择(例如,通过使用固定化或标记的zsig37蛋白质或肽)。
如果抗体1)结合活性有一个阈值水平,和/或2)不会与有关多肽分子显著进行交叉反应时,则被定义为能够特异性结合。首先,若本文中的抗体以106mol-1或更高107mol-1或更高、更优选108mol-1或更高、最优选109mol-1或更高的结合亲和力(Ka)与zsig37多肽、肽或表位结合,则它们是特异结合的。用本领域的常规技术可容易地测定抗体的结合亲和力,例如,用斯卡查德分析法(Scatchard,Ann.NYAcad.Sci.51660-672,1949)。
其次,抗体在不与相关多肽显著发生交叉反应的情况下也是特异结合的。例如,用标准的Western印迹分析可检测到zsig37多肽,而不能检测到已知的相关多肽时,则抗体不与相关多肽分子显著发生交叉反应(Ausubel等人,同上)。已知相关多肽的例子包括蛋白质家族的其它成员,如Acrp30(SEQ ID NO3)、图1序列对比中所示多肽等等。如果需要,它们也可包括正同系物和突变的人zsig37多肽。此外,抗体可“屏蔽掉”已知相关多肽以分离与本发明多肽特异结合的种类。例如,将针对人zsig37多肽的抗体吸附至粘附于不溶基质的相关多肽上;使人zsig37多肽特异抗体在合适的缓冲条件下流过此基质。这样的筛选可分离与密切相关多肽无交叉反应性的多克隆和单克隆抗体(抗体实验室手册,Harlow和Lane(编辑),冷泉港实验室出版社,1988;免疫学最新方法,Cooligan,等人(编辑),国家健康研究所,John Wiley和Sons,Inc.,1995)。特异抗原的筛选和分离在本领域中是众所周知的(参阅,基础免疫学,Paul(编辑),Raven Press,1993;Getzoff等人,免疫学进展(Adv.in Immunol.)431-98,1988;单克隆抗体原理和实践,Goding,J.W.(编辑),Academic Press Ltd.1996;Benjamin等人,免疫学年度综述(Ann.Rev.Immunol.)267-101,1984)。这样的试验的代表性例子包括并行免疫电泳、放射免疫测定法、放射免疫沉淀法、酶联免疫吸附测定(ELISA)、斑点印迹或蛋白质印迹分析、抑制或竞争试验,及夹心试验。
通过筛选展示于噬菌体(噬菌体展示)或大肠杆菌之类细菌上的随机或定向肽文库,可获得编码具潜在zsig37多肽结合结构域之多肽,即“结合蛋白质”的基因。可用多种方式获得编码多肽的核苷酸序列,如通过随机诱变和随机多核苷酸合成。或者,也可制备限制性的噬菌体展示文库。这些肽展示文库可用于筛选与已知靶相互作用的肽,所说的靶可以是蛋白质或多肽,如配基或受体,生物或合成大分子,或者有机或无机物质。构建和筛选这些肽展示文库的技术在本领域中是已知的(Ladner等人,美国专利号5,223,409;Ladner等人,美国专利号4,946,778;Ladner等人,美国专利号5,403,484和Ladner等人,美国专利号5,571,698),肽展示文库用于筛选这些文库的和试剂盒可购买得到,例如购自Clontech(Palo Alto,CA)、InvitrogenInc.(San Diego,CA)、New England Biolabs,Inc.(Beverly,MA)和Pharmacia LKB Biotechnology Inc.(Piscataway,NJ)。可以用本文所公开的zsig37序列筛选肽展示文库,以鉴定能与zsig37结合的蛋白质。这些能与zsig37多肽相互作用的“结合蛋白质”基本上可象抗体一样用于标记细胞;通过亲和纯化分离同系物多肽;直接或间接地与药物、毒素、放射性核素等等偶联。这些结合蛋白质也可用于诸如筛选表达文库和中和活性之类的分析方法中。结合蛋白质也可用于诊断检验中以测定多肽的循环水平、检测或定量测定作为潜在病理或疾病标记的可溶性多肽。为了提高这些结合蛋白质的半寿期,可以对它们进行偶联。通过二聚体化或多聚聚化可修饰它们的生物特性以用作激动剂或拮抗剂。可以如上所述针对已知的相关多肽筛选结合肽。
zsig37的抗体和结合蛋白质可用于标记表达zsig37的细胞;用于通过亲和纯化分离zsig37;用于测定zsig37多肽循环水平的诊断试验;用于检测或定量测定作为潜在病理或疾病标志的可溶性zsig37;用于应用FACS的分析方法中;用于筛选表达文库;用于产生抗独特型抗体;及作为中和抗体或作为拮抗剂在体内和体外阻断zsig37多肽能量平衡调节活性或类似活性。合适的直接标志或标签包括放射性核素、酶、底物、辅因子、抑制物、荧光标记、化学发光标记、磁性颗粒等等;间接的标志或标签可以使用生物素-抗生物素蛋白或其它互补物/抗互补物对作为中间物质。此外,抗zsig37或其片段的抗体可用于体外试验中以检测变性zsig37或其片段,例如,用于蛋白质印迹或本领域已知的其它试验中。
也可将此处的抗体或结合蛋白质直接或间接地与药物、毒素、放射性核素等偶联,这些偶联物可用于体内诊断或治疗应用中。例如,本发明的多肽或抗体可用于鉴定或处理表达相应抗互补分子(例如分别为受体或抗原)的组织或器官。更具体地说,可将zsig37多肽或抗zsig37抗体或者其生物活性片段或部分偶联至可检测或细胞毒素分子上,并运送到有表达抗互补分子之细胞、组织或器官的哺乳动物中。
合适的可检测分子可直接或间接地附着至多肽或抗体上,它们包括放射性核素、酶、底物、辅因子、抑制物、荧光标记、化学发光标记、磁性颗粒等等。合适的细胞毒素分子可直接或间接地附着至多肽或抗体上,它们包括细菌或植物毒素(例如,白喉毒素、假单胞菌外毒素、蓖麻毒蛋白、相思豆毒蛋白等等),以及治疗性的放射性核素,如碘-131、铼-188或钇-90(或者直接附着至多肽或抗体上,或者通过如螯合部分之类的方式间接附着)。也可将多肽或抗体与细胞毒素药物如阿霉素偶联。为使可检测分子或细胞毒素分子间接附着,可将该可检测分子或细胞毒素分子与互补物/抗互补物对的一个成员偶联,而另一成员结合到多肽或抗体部分上。为此目的,生物素/链霉亲和素是一典型的互补物/抗互补物对。
在另一实施方案中,多肽-毒素融合蛋白或抗体-毒素融合蛋白可用于靶向细胞或组织的抑制或脱离(如治疗癌症细胞或组织)。或者,当多肽有多个功能结构域(即活化结构域或配体结合结构域,以及靶向结构域)时,只含靶向结构域的融合蛋白可能适于指导可检测分子、细胞毒素分子或互补分子至目的细胞或组织类型中。在仅含该结构域的融合蛋白包含互补分子时,则可将抗互补分子与可检测分子或细胞毒素分子偶联。因而这样的结构域-互补分子融合蛋白代表了一般抗互补物-可检测分子/细胞毒素分子偶联物的细胞/组织特异性传送的一般性靶向载体。本文所述的生物活性多肽或抗体偶联物可经静脉内、动脉内、带DMSO的管内、肌肉内、皮下、腹膜内途径送递,也可用经皮方法、电转移、口服或通过吸入方法。
编码zsig37多肽的多核苷酸可用于需要提高或抑制zsig37活性的基因治疗应用中。若哺乳动物zsig37基因突变或缺失,则可将zsig37基因引入该哺乳动物的细胞中。在一个实施例中,经病毒载体将编码zsig37多肽的基因引入体内。这样的载体包括减毒或缺陷DNA病毒,如,但不局限于,单纯疱疹病毒(HSV)、乳头瘤病毒、非洲淋巴瘤病毒(EBV)、腺病毒、腺伴随病毒(AAV),等等。优选完全或几乎完全缺失病毒基因的缺陷病毒。缺陷病毒在引入细胞中后无感染性。使用缺陷病毒可施用于在特定的局部区域内的细胞,而不用担心载体会侵染其它细胞。特殊载体的例子包括,但不局限于,缺陷型单纯疱疹病毒1(HSV1)载体(Kaplitt等人,分子与细胞神经科学(Molec.Cell.Neurosci.)2320-30,1991);减毒腺病毒载体,如由Stratford-Perricaudet等人在临床研究杂志90626-30,1992中所述的载体;及缺陷型腺伴随病毒载体(Samulski等人,病毒学杂志613096-101,1987;Samulski等人,病毒学杂志633822-8,1989)。
在另一实施例中,可在逆转录病毒载体中引入zsig37基因,如按下述文献所述进行Anderson等人,美国专利号5,399,346;Mann等人,细胞33153,1983;Temin等人,美国专利号4,650,764;Temin等人,美国专利号4,980,289;Markowitz等人,病毒学杂志621120,1988;Temin等人,美国专利号5,124,263;WIPO公开文件WO95/07358;及Kuo等人,血液82845,1993。或者,可以用脂质体通过体内脂转染法将载体引入。可用合成的阳离子脂质制备脂质体,用于体内转染编码标志的基因(Felgner等人,美国国家科学院院报847413-7,1987;Mackey等人,美国国家科学院院报858027-31,1988)。利用脂转染法将外源基因引入体内特定器官的方法具有一定的实用优点。脂质体的分子定向至特异细胞代表了其优势的一方面。更具体地说,指导转染至特定细胞代表了优势的一方面。例如,在诸如胰、肝、肾和脑之类具细胞异质性的组织中,指导转染至特殊细胞类型将是尤其有利的。可将脂类与其它分子化学偶联以达到定向的目的。可将定向肽(如激素或神经递质)、如抗体之类的蛋白质或非肽分子与脂质体化学偶联。
将靶细胞从机体中分离,向其中引入作为裸DNA质粒的载体,然后重植此转化细胞入机体内,这是可能做到的。可以用本领域已知方法将用于基因治疗的裸DNA载体引入合乎要求的宿主细胞中,如通过转染、电穿孔、显微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、基因枪的使用或DNA载体转运蛋白的使用。参阅如Wu等人,生物化学杂志267963-7,1992;Wu等人,生物化学杂志,26314621-4,1988。
反义方法学可用于抑制zsig37基因转录,如抑制体内细胞增殖。设计与zsig37编码多核苷酸部分(如,SEQ ID NO1中所述多核苷酸)互补的多核苷酸,以结合zsig37编码mRNA并抑制这些mRNA的翻译。可利用这样的反义多核苷酸抑制细胞培养物或受试者中zsig37多肽编码基因的表达。
也可构建表达zsig37基因的转基因小鼠和zsig37基因功能完全缺失、被称为“敲除小鼠”(Snouwaert等人,科学2571083,1992)的小鼠(Lowell等人,自然366740-42,1993)。这些小鼠可用于体内系统中以研究zsig37基因及由此编码的蛋白质。
为了药用的目的,可将本发明蛋白质按常规方法配制成适于不经肠道的、特别是静脉内或皮下送递。静脉内用药一般是大剂量注射或在1至数小时的典型时间段内输注来进行。大体上,药用配方将包括zsig37蛋白质与药用可接受载体,如盐、缓冲盐、溶于水的5%葡萄糖等的混合。配方可进一步包括一种或多种赋形剂、防腐剂、增溶剂、缓冲剂、预防蛋白质在瓶壁上丢失的清蛋白,等等。按配方制药的方法在本领域中是众所周知的,并公开于例如下述文献中Remington制药科学和实践,Gennaro,编辑,Mack Publishing Co.,Easton PA,第19版,1995。治疗剂量通常由临床医生按认可的标准、考虑待治疗疾病的性质和严重程度及病人特性等而确定。剂量的确定是本领域普通技术人员水平内的工作。
通过以下非限制性实施例对本发明作进一步的阐述。
实施例1EST序列的延伸通过从EST数据库中选择EST,以此为基础推测蛋白质序列,在已知序列数据库中寻找与基于该EST的预测蛋白质最为同源的分泌蛋白质,从而对本发明之新zsig37多肽编码多核苷酸进行了最初的鉴定。识别有可能编码与已知分泌蛋白质具生物学上有意义的同源性的蛋白质的EST以供进一步研究。发现单个EST序列,预计它与脂肪细胞特异蛋白质同源。参阅如Scherer等人,生物化学杂志270(45)26746-9,1995。为了鉴定相应的cDNA,将被认为可能含完整编码序列的克隆用于测序。用Invitrogen的S.N.A.P.TMMiniprep试剂盒(Invitrogen,Crop.,San Diego,CA)按制造商说明书制备在含50μg/ml氨苄青霉素的LB中的5ml过夜培养物。在ABIPRISMTM377型DNA测序仪(Perkin-Elmer Cetus,Norwalk,Ct.)上用ABI PRISMTMDyeTerminator Cycle Sequencing Ready Reaction Kit(Perkin-ElmerCorp.)按制造商说明书对模板测序。将针对含克隆的载体上SP6和T7启动子结合的寡核苷酸ZC695(SEQ ID NO5)、ZC694(SEQ ID NO6)用作测序引物。用寡核苷酸ZC13210(SEQ ID NO7)、ZC13588(SEQID NO8)、ZC13532(SEQ ID NO9)、ZC13641(SEQ ID NO10)、ZC13586(SEQ ID NO11)、ZC13651(SEQ ID NO12)、ZC13622(SEQID NO13)、ZC13625(SEQ ID NO14)、ZC13650(SEQ ID NO15)、ZC13589(SEQ ID NO16)、ZC13624(SEQ ID NO17)、ZC13531(SEQID NO18)、ZC13587(SEQ ID NO19),和ZC13623(SEQ ID NO20)完成克隆的测序。测序反应在Hybaid OmniGene TemperatureCycling System(National Labnet Co.,Woodbridge,NY)中进行。用SEQUENCHERTM3.0序列分析软件(Gene Codes Corporation,AnnArbor,MI)进行数据分析。测出的2769bp序列结果公开于SEQ ID NO1中。将最初来源的EST序列与SEQ ID NO1中所述序列进行比较,显示有一个碱基对的错读(一未知“N”残基)而无碱基对的插入,这样导致分辨出该错读为亮氨酸,并且推断氨基酸序列间无移码。
实施例2组织分布用来自Clontech的人多组织印迹(Palo Alto,CA)进行RNA印迹杂交。将针对SEQ ID NO1中所示成熟蛋白质核苷酸序列5′端的30个碱基长DNA探针(ZC12447;SEQ ID NO4)用T4多核苷酸激酶和正向反应缓冲液(GIBCO BRL,Gaithersburg,MD)按制造商的说明书放射性标记上32P。用NUCTRAP推进柱(Stratagene Cloning Systems,LaJolla,CA)纯化探针。利用EXPRESSHrB(Clontech,Palo Alto,CA)溶液进行预杂交并作为RNA印迹的杂交溶液。在50℃杂交过夜,然后在室温用含2×SSC和0.1%SDS的溶液洗涤印迹,随后在1×SSC和0.1%SDS溶液中于68℃(较熔点约低5℃)洗涤1次。观察到一种转录物大小约为2.8kb。心脏和胎盘的信号强度最高,肾、卵巢、肾上腺和骨骼肌中信号强度相对较低,而在RNA印迹中存在的多种其它组织里信号更低。
用消化道组织RNA印迹进行附加的RNA印迹分析。该印迹是用来自人结肠腺癌细胞系SW480(Clontech,Palo Alto,CA)、人小肠组织(Clontech)、人胃组织(Clontech)、人肠平滑肌细胞系(Hism;ATCCNo.CRL-1692;美国典型培养物保藏中心,12301 Parklawn Drive,Rockville,MD)、正常人结肠细胞系(FHC;ATCC No.CRL-1831;美国典型培养物保藏中心)和人正常胎儿小肠细胞系(FHs 74 Int.;ATCCNo.CCL241;美国典型培养物保藏中心)的mRNA制备的。
用酸性胍方法从Hism、FHC和FHs 74 Int.中分离总RNA(Cheomczynski等人,生化分析162156-9,1987)。通过保留poly A+RNA的柱子洗脱总RNA而选择poly A+RNA(Aviv等人,美国国家科学院院报691408-12,1972)。将来自每一样品的2μg poly A+RNA在于2.2M甲醛和磷酸盐缓冲液中的1.5%琼脂糖凝胶上进行分离。将RNA在20×SSC中过夜转移至Nytran膜(Schleicher和Schuell,Keene,NH)上。在UV Stratalinker 2400(Stratagene,La Jolla,CA)中以0.12焦耳处理印迹。然后将印迹在80℃烤1小时。
用PCR扩增全长cDNA(SEQ ID NO1中所示)并用Rediprimepellet试剂盒(Amersham,Arlington Heights,IL)按制造商说明书以32P dCTD进行放射性标记。在EXPRESSHYB(Clontech)中将印迹于56℃杂交过夜。于2×SSC和0.1%SDS中室温洗涤印迹,然后在2×SSC和0.1%SDS中于65℃洗涤,最后在65℃于0.1×SSC和0.1%SDS中洗涤。结果显示,除了人肠平滑肌细胞系HISM外,zsig37与所有组织均能杂交。
实施例3zsig37基因的染色体绘图用NIGMS人/啮齿类动物体细胞杂交绘图板2(NationalInstitute of General Medical Sciences,Coriell Institute ofMedical Research)通过PCR将zsig37基因绘图至人第17号染色体上的17q25.2区中。这组实验对象由分离自24种人/啮齿类体细胞杂合体的DNA组成,每种杂合体均保留一条特异的人染色体和亲本DNA。为了进行zsig37基因的绘图,在96孔微量滴定板(Stratagene,LaJolla,CA)上建立20μl反应体系并于“Robo Cycler Gradient 96”热循环仪(Stratagene)中进行反应。27个PCR反应中的每一个组成如下2μl 10×KlenTaq PCR反应缓冲液(Clontech Laboratories,Inc.,Palo Alto,CA)、1.6μl dNTP混合物(各2.5mM,PERKIN-ELMER,Foster City,CA)、1μl有义引物(SEQ ID NO21)、1μl反义引物(SEQ ID NO22)、2μl RediLoad(Research Genetics,Inc.)、0.4μl 50×Advantage KlenTaq Polymerase Mix(ClontechLaboratories,Inc.)、来自各个杂合克隆或对照的25ng DNA,补ddH2O至总体积为20μl。用等量矿物油覆盖反应液并将其密闭。PCR循环条件如下起始第1个循环为95℃变性5分钟,然后35个循环为95℃变性1分钟、60℃退火1分钟及72℃延伸1.5分钟,随之最后1个循环为72℃延伸7分钟。在3%Nusieve GTG琼脂糖凝胶(FMC Bioproducts,Rockland,ME)上电泳分离反应物。
实施例4哺乳动物表达载体zsig37 NEE/pZP9和zsig37 CEE/pZP9的构建制备了zsig37多肽的两种表达载体zSIG37 NEE/pZP9和zSIG37CEE/pZP9,其中将这两种构建体设计为表达具C-或N-末端Glu-Glu标志的zsig37多肽。
zsig37 NEE/pZP9以ZC15040(SEQ ID NO24)和ZC15033(SEQ ID NO25)为PCR引物,模板如上文实施例1所述,经PCR产生800bp的zsig-37DNA片段。PCR反应液于94℃温育3分钟,然后进行5个循环94℃30秒,30℃20秒和72℃1分钟,随后为25个循环94℃30秒、64℃20秒和72℃1分钟。之后72℃延伸5分钟。然后将产生的PCR产物在0.9%TBE琼脂糖凝胶上用1×TBE缓冲液进行电泳。切出预期大小的带并将DNA用Qiaex II树脂(Qiagen)按制造商说明书从凝胶中纯化出来。用限制性酶Bam HI和Xba I消化DNA,然后抽提和沉淀。
将切出并经限制酶消化的zsig37 DNA片段亚克隆入已经限制酶Bam HI和XbaI酶切的质粒NEE/pZP9中。zsig37 NEE/pZP9表达载体掺入TPA前导区并连接Glu-Glu标志(SEQ ID NO26)至zsig37多肽编码多核苷酸序列的N-末端。质粒NEE/pZP9(保藏于美国典型培养物保藏中心,12301 Parklawn Drive,Rockville,MD,ATCC No.98668)是含一种表达盒的哺乳动物表达载体,该表达盒具有小鼠金属硫蛋白-1启动子,TPA前导肽,随后是编码Glu-Glu标志的序列(SEQ ID NO26),用于插入编码序列的多限制性酶切位点,及人生长激素终止子。质粒还包含一个大肠杆菌复制起点,具SV40启动子、增强子和复制起点的哺乳动物选择标记表达单元,DHFR基因和SV40终止子。
zsig37 CEE/pZP9用ZC15721(SEQ ID NO27)和ZC15035(SEQ ID NO28)作为PCR引物,按上述步骤经PCR产生866bp的zsig37 DNA片段。用限制酶Eco RI和Bam HI消化纯化的PCR片段,用Qiaex II树脂如上所述纯化凝胶。
将此切出并限制酶消化的zsig37 DNA亚克隆入已用Eco RI和BamHI消化的质粒CEE/pZP9中。该zsig37 CEE/pZP9表达载体使用天然zsig37信号肽,并将Glu-Glu表位(SEQ ID NO26)连接至C-末端以帮助纯化。质粒CEE/pZP9(保存于美国典型培养物保藏中心,12301Parklawn Drive,Rockville,MD,ATCC No.98668)是含一种表达盒的哺乳动物表达载体,该表达盒包含小鼠金属硫蛋白-1启动子、用于插入编码序列的多限制酶切点、编码Glu-Glu标志的序列(SEQ IDNO26)、终止密码子和人生长激素终止子。质粒还具有大肠杆菌复制起点、具SV40启动子、增强子和复制起点的哺乳动物选择标记表达单元、DHFR基因和SV40终止子。
对于N-和C-标记的构建体而言,将约30ng经限制酶消化的插入片段和50ng相应载体室温连接4小时。按制造商的用法说明将1μl每种连接反应液单独电穿孔进入DH10B感受态细胞(GIBCO BRL,Gaithersburg,MD)中,并铺于含50mg/ml氨苄青霉素的LB平板上,保温过夜。
如上所述用PCR筛选菌落。用于zsig37 NEE/pZP9和zsig37CEE/pZP9筛选的引物是ZC 13006(SEQ ID NO29)和ZC 13007(SEQID NO20)。PCR反应液在94℃温育2.5分钟,然后进行25个循环,每个循环为94℃ 10秒、58℃ 20秒和72℃ 1分钟。然后72℃延伸5分钟。用序列分析证实阳性克隆的插入序列,即zsig37 NEE的1013bp长片段和zsig37 CEE的950bp长片段。用QIAGEN Maxi prep kit(Qiagen)按制造商说明书进行大规模质粒的制备。
实施例5转染和zsig37 NEE和CEE多肽的表达将BHK 570细胞(ATCC No.CRL-10314)铺于10cm组织培养皿中,使其于37℃、5%二氧化碳条件下在DMEM/FBS培养基[DMEM,Gibco/BRLHigh Glucose,(Gibco BRL,Gaithersburg,MD),5%胎牛血清(Hyclone,Logan,UT),2μM L-谷氨酰胺(JRH Biosciences,Lenexa,KS),1μM丙酮酸钠(Gibco BRL)]中过夜生长至约50-70%汇合。然后通过LipofectamineTM(Gibco BRL),在无血清(SF)的培养基制剂(DMEM,Gibco/BRL High Glucose,(Gibco BRL,Gaithersburg,MD),2mM L-谷氨酰胺,2mM丙酮酸钠,10μg/ml运铁蛋白,5μg/ml胰岛素,10μg/ml胎球蛋白和2ng/ml硒)中用质粒zsig37 NEE/pZP9(N-末端Glu-Glu标志)或zsig37 CEE/pZP9(C-末端Glu-Glu标志)转染细胞。在15ml试管中用SF培养基将16μg zsig37 NEE/pZP9和16μg zsig37CEE/pZP9分别稀释至终体积640μl。在其它试管中,混合35μlLipcfectamineTM(Gibco BRL)和605μl SF培养基。将LipofectamineTM混合液加入DNA混合液中并室温温育近30分钟。将5ml SF培养基加入DNALipofectamineTM混合物中。用5ml SF培养基清洗细胞,吸出,再加入DNALipofectamineTM混合物。将细胞在37℃温育5小时,再将含10%FBS、1%PSN的6.4ml DMEM培养基加入平板中。将平板在37℃保温过夜,第二天用新鲜FBS/DMEM培养基替换原DNALipofectamineTM混合物。在转染后第2天,将细胞按1∶50、1∶100和1∶200的比例分离至150mm平板的选择培养基(带1μM MTX的ESTEP#1)中。转染后第5天用新鲜选择培养基重培育平板。筛选菌落转染后约10-12天时,从每个转染中选出1个氨甲喋呤抗性菌落的150mm培养皿,吸出培养基,用10ml无血清ESTEP2培养基(668.7g/50L DMEM(Gibco),5.5g/50L丙酮酸,96%的钠盐(Mallinckrodt),185.0g/50L NaHCO3(Mallinkrodt),5.0mg/ml,25ml/50L胰岛素,10.0mg/ml和25mg/50L运铁蛋白)清洗平板。吸出清洗培养基并换入5ml无血清ESTEP2。然后将预浸泡于无血清ESTEP2中的无菌Teflon筛孔(Spectrum Medical Industries,Los Angeles,CA)放到细胞上。之后将预浸于无血清ESTEP2中的无菌硝酸纤维素滤膜放到筛孔之上。将硝酸纤维素膜上的定位标记转移至培养皿上。然后在5%二氧化碳培养箱中将平板37℃温育5-6小时。温育后,移开滤膜,吸出培养基并换入DMEM/5%FBS,1×PSN(Gibco BRL)培养基。然后将滤膜放入含50ml缓冲液(25mM Tris,25mM甘氨酸,5mM β-巯基乙醇)的可密封袋中,并在65℃水浴温育10分钟。在10%脱脂奶粉/Western A缓冲液(Western A50mM Tris pH7.4,5mM EDTA,0.05%NP-40,150mM NaCl和0.25%明胶)中于旋转摇床上室温封闭滤膜15分钟。然后将滤膜与以1∶1000的稀释度稀释于2.5%脱脂奶粉/Western A缓冲液(Western A50mM Tris pH7.4,5mM EDTA,0.05%NP-40,150mM NaCl和0.25%明胶)中的抗Glu-Glu抗体-HRP偶联物于旋转摇床上4℃温育过夜。之后用PBS加0.1%吐温20室温洗滤膜3次,每次5-15分钟。用ECL试剂(Amersham Corp.,Arlington Heights,IL)按制造商说明将滤膜显影并对胶片(Hyperfilm FCL,Amersham)曝光约5分钟。
将胶片与含菌落的平板对比。以胶片为指导,选择合适的菌落。将无菌的3mm克隆盘(PGC Scientific Corp.,Frederick,MD)浸泡于胰蛋白酶液中,放在菌落上。将每个构建体的12个菌落转移至96孔板上的200μl选择培养基中。每个菌落进行7次2倍稀释。细胞在37℃培养1周,在此期间选出稀释度最低而又有容纳最适密度细胞的孔,用胰蛋白酶消化并转移至含选择培养基的12孔板上。还用胰岛白酶消化150mm培养皿,合并剩余细胞用于Western分析和支原体检验。冻存合并物。
将克隆从12孔板直接扩大至两个T-75瓶中。一瓶保持继续培养,另一瓶培养于无血清ESTEP2中以收获细胞进行蛋白质印迹分析。以蛋白质印迹分析为基础,选择每一表达构建体的克隆,合并并转移至大规模培养物中。
实施例6zsig37 CEE的大规模哺乳动物表达将含有按上述表达步骤获得的表达zsig37 CEE的长满细胞的一个T-162瓶和含zsig37 NEE的另一个T-162瓶分别扩大培养成4个T-162瓶。4瓶中的1瓶细胞用于冷冻成4个冻存小瓶,另三个用于生产Nunc细胞厂。
将来自zsig37 CEE和zsig37 NEE的三个T-162瓶的细胞独立接种两个Nunc细胞厂(10层,可购自VMR)。简短地说,用胰蛋白酶将来自上述T-162瓶的细胞分离,合并,并加至预保温至37℃的1.5升ESTEP1培养基(668.7g/50L DMEM(Gibco),5.5g/50L丙酮酸,96%钠盐(Mallinckrodt),185.0g/5L碳酸氢钠(Mallinkrodt),5.0mg/ml和25ml/50L胰岛素(JRH Biosciences),10.0mg/ml和25ml/50L运铁蛋白(JRH Biosciences),2.5L/50L胎牛血清(已鉴定)(Hyclone),1μM MTX,pH调至7.05+/-0.05)中。然后将含细胞的培养基通过漏斗倒入Nunc细胞生产器中。将此细胞生产器放入37℃/5.0%二氧化碳培养箱中。
在汇合率达80-100%时,进行Nunc细胞生产器内容物的可见污染检测(酚红颜色改变)。因为没有观察到污染,故将汇合细胞生产器的上清倒入小的收获容器中,取样后丢弃。然后用400ml PBS清洗粘附细胞1次。为使细胞从生产器上分离下来,向每个生产器中加入100ml胰蛋白酶后倒掉,然后在残留胰蛋白酶中将细胞温育5-10分钟。用200ml ESTEP1培养基洗两次后收集细胞。向10个装有ESTEP1培养基的瓶(每个1.5升,37℃)中的每个内加入40ml收集细胞。然后将1个1.5升瓶细胞用于装满一个Nunc生产器。将每个细胞生产器置于37℃/5.0%二氧化碳培养箱中。
细胞汇合率达80-90%时,进行Nunc细胞生产器的可见污染检测(酚红颜色改变)。因为观察到无污染,故将来自长满生产器的上清倒入小收获容器中,取样后丢弃。然后用400ml PBS洗细胞1次。向每个Nunc细胞生产器中加入1.5升ESTEP2培养基(668.7g/50L DMEM(Gibco),5.5g/50L丙酮酸,96%钠盐(Mallinckrodt),185.0g/50LNaHCO3(Mallinkrodt),5.0mg/ml,25ml/50L胰岛素,10.0mg/ml和25ml/50L运铁蛋白)。将细胞生产器温育于37℃/5.0%CO2中。
在约48小时时进行Nunc细胞生产器的可见污染检测(酚红颜色变化)。将来自每一生产器的上清倒入小收获容器中。将新鲜无血清培养基(1.5升)倒入每一Nunc细胞生产器中并于37℃/5.0%CO2中温育。将收获自每一构建体的1ml上清转移至显微镜载玻片上,用于污染的显微镜分析。合并每一构建体的小收获容器的内容物并立即过滤。然后基本如上所述在48小时时进行第二次收获,此后弃去细胞生产器。用无菌装配的过滤装置对收获上清(条件培养基)进行无菌过滤。装配如下将管扎于Opti-Cap滤器(Millipore Corp.,Bedford,MA)和Gelman Supercap 50滤器(Gelman Sciences,Ann Arbor,MI)上。Supercap 50滤器还附着于罩子中的无菌带帽容器上;位于MilliporeOpti-cap滤器上游的管插入蠕动泵中;管的自由端放入大的收获容器中。蠕动泵转动速率为200和300rpm,直至所有条件培养基通过0.22μm终滤器进入无菌收集容器中。滤液放入4℃冰柜准备纯化。用Millipore 5KDA截流浓缩器(Millipore Corp.,Bedford,MA)按制造商说明书将培养物浓缩10倍,并用抗FLAG标志抗体(Kodak)进行蛋白印迹分析。
zsig37 CEE5个T-162瓶=0.12mg/L,38kDa;1个生产器,FBS=0.12mg/L,38kDa;10个生产器,FBS=0.12mg/L,38kDa;10个生产器(#1),SF=1.2mg/L,38kDa;和10个生产器(#2),SF=3.56mg/L,38kDazsig37 NEE5个T-162瓶=0.137mg/L,35kDa;1个生产器,FBS=0.137mg/L,35kDa;10个生产器,FBS=0.137mg/L,35kDa;10个生产器(#1),SF=1.37mg/L,35kDa;和10个生产器(#2),SF=4.11mg/L,35kDa。
实施例7zsig37 NEE和zsig37 CEE的纯化除非另外提及,否则所有操作均于4℃进行。以下步骤用于纯化含N-末端或C-末端Glu-Glu(EE)标志的zsig37。将来自幼仓鼠肾(BHK)细胞的共25升条件培养物相继通过4英寸的0.2mM Millipore(Bedford,MA)OptiCap小皿滤器和0.2mM Gelman(Ann Arbor,MI)Supercap 50进行无菌过滤。然后用装有3000kDa截流值Amicon(Bedford,MA)S10Y3膜的Millipore ProFlux A30切向流浓缩器将物质浓缩至约1.3升。浓缩物质再次如上所述用Gelman滤器无菌过滤。将蛋白酶抑制剂混合物加入浓缩的条件培养物中至终浓度为2.5mA乙二胺四乙酸(EDTA,Sigma Chemical Co.,St.Louis,MO),0.001mM亮抑酶肽(Boehringer-Mannheim,Indianapolis,IN),0.001mM抑胃酶肽(Boehringer-Mannheim)和0.4mM Pefabloc(Boehringer-Mannheim)。将如下述制备的25.0ml抗EE Sepharose样品加入样品中以分批吸附,在Wheaton(Millville,NJ)转动培养装置上4℃温和搅拌混合物18.0小时。
然后将混合物灌入5.0×20.0cm的Econo-Column(Bio-Rad,Laboratories,Hercules,CA)中,用30个柱体积的磷酸缓冲盐溶液(PBS)洗涤凝胶。丢弃未被保留的流出部分。一旦流出液在280nM的吸收值小于0.05,则将通过柱子的流速减到零,用2.0倍柱床体积含0.4mg/ml EE肽(AnaSpec,San Jose,CA)的PBS分批洗涤抗EESepharose凝胶。所用肽的序列为Glu-Tyr-Met-Pro-Val-Asp(SEQ IDNO31)。4℃ 1.0小时后,恢复流动并收集洗脱蛋白质。此部分被称为肽洗脱物。然后用2.0个柱床体积的0.1M甘氨酸,pH2.5洗涤抗EESepharose凝胶,分别收集甘氨酸洗柱液。通过加入小量体积的10×PBS将甘氨酸洗脱部分的pH调至7.0并保存于4℃以备将来需要时分析用。
用膜的截流分子量为15000的浓缩器(Millipore,Bedford,MA)按制造商说明书浓缩肽洗脱液至5.0ml。用BioCad Sprint HPLC(PerSeptive BioSystems,Framingham,MA)以流速1.0ml/min在平衡于PBS中的1.5×50cm Sephadex G-50(Pharmacia,Piscataway,NJ)柱上通过层析将浓缩肽洗脱液与游离肽分离。收集2ml组分并检测280nM处的吸收值。收集于280nM的吸收值为第一个峰并在近柱排空体积处洗脱的物质。这部分即为纯的zsig37 NEE或zsig37 CEE。如上所述浓缩纯物质,用SDS-PAGE及抗-EE抗体的蛋白质印迹进行分析,取样品进行氨基酸分析和N-末端测序。按我们的标准步骤等分剩余样品并保存于-80℃。
在无还原剂时于SDS-PAGE凝胶上对zsig37 NEE电泳,显示有一条表观分子量为39000的主要考马斯亮蓝染色带及几个分子量在60000-116000之间的次要组分。所有的带在蛋白质印迹上均显示与抗EE抗体具交叉反应性。在有还原剂时,只观察到39,000kDa蛋白质带,它的考马斯蓝染色强度提高。在蛋白质印迹上此带还显示与抗EE抗体有交叉反应性。
对于zsig37 CEE,在无还原剂时于SDS-PAGE凝胶上进行电泳,显示有表观分子量为39000的一主要考马斯兰染色带及数条分子量在60000-116000之间的次要组分。在蛋白质印迹中,只有表观分子量为150000,116000和60000的带显示与抗EF抗体有交叉反应性。有还原剂时,仅观察到39000kDa的考马斯蓝染色带,且此物质显示在蛋白质印迹中与抗EE抗体有交叉反应性。在这些条件下,在150000kDa处也可见少量的交叉反应性物质。
抗EE Sepharose的制备通过500ml Nalgene 0.45μm滤器单元用100ml含0.02%叠氮化钠的PBS洗涤床体积为100ml的蛋白质G-Sepharose(Pharmacia,Piscataway,NJ)3次。用6.0体积的200mM三乙醇胺,pH8.2(TEA,Sigma,St.Louis,MO)洗涤凝胶,加入含900mg抗体的等体积EE抗体溶液。4℃温育过夜后,如上述用5体积的200mM TEA洗涤树脂以去除未结合抗体。将树脂重悬于两体积的TEA中,转移到合适容器里,加入溶于TEA的dimethylpimilimidate-2HCl(Pierce,Rockford,IL)至终浓度为36mg/ml凝胶。室温轻摇凝胶45分钟,用上述滤器单元去除液体。然后通过与5体积于200mM TEA中的20mM乙醇胺室温温育10min封闭凝胶上的非特异位点。用5体积含0.02%叠化钠的PBS洗涤凝胶并在4℃保存于该溶液中。
实施例8粘附和增殖试验如下述检验zsig37刺激TF-1细胞粘附和铺展的能力。在PBS或者ELISA包被缓冲液(0.1M碳酸钠)中制备10-0.0625μg/ml一系列稀释度的C-末端Glu-Glu标志zsig37,以100μl/孔的量将各稀释度溶液分别铺到96孔板(Costar,Pleasanton,CA)中。将平板在37℃,5%二氧化碳中温育2小时。然后用RPMI/10%FBS(RPMI 1640,2mM L-谷氨酰胺,110μg/ml丙酮酸钠,PSN和10%热失活胎牛血清)洗涤平板3次,使其封闭15分钟。
将TF-1细胞(来自急性骨髓白血病细胞)重悬于RPMI/10%FBS中并以10,000个细胞/孔的密度放入zsig37 CEE包被的96孔板至终体积为120μl/孔。平板在37℃,5%二氧化碳中温育2小时。然后用PBS洗平板3次并加入200μl/孔的生长培养基(RPMI/10%FBS,5ng/mlGM-CSF)。洗涤前后均用显微镜检查细胞。
还利用染料掺入试验,基于比色变化及荧光信号的增强,定量测定粘附细胞的数量。在96孔板中加入Alamar BlueTM(AccuMed,Chicago,IL),将细胞在37℃,5%二氧化碳中温育过夜。然后用激发波长544nm发射波长590nm的荧光计扫描平板。在zsig37 CEE-PBS包被平板上的粘附细胞比在zsig37 CEE-0.1M Na2CO3包被平板上的更多。可溶zsig37的加入并不阻碍细胞粘附至结合zsig37上。
用TF1,DA-1(通过生长于IL-3培养基中衍生自有B细胞淋巴瘤的小鼠的淋巴结的IL-3依赖型细胞系(Dr.Kenneth Kaushansky提供,华盛顿大学,西雅图,WA)),pre-B(p53-/-小鼠骨髓细胞,IL-7依赖型,B220+,Thyl low,Sca-1+)和A7BaF-3细胞系以5000个细胞/孔如上所述进行第二个试验。也以500个细胞/孔铺入BHK细胞。zsig37增强了A7-BaF-3细胞的生长并稍微抑制DA-1细胞的生长。
实施例9小鼠正同系物序列利用本发明的新型人zsig37多肽编码多核苷酸从小鼠EST数据库中筛选同源小鼠序列。发现单个EST序列并预计为人zsig37序列。为了鉴定相应的cDNA,用认为可能含整个编码序列的克隆进行测序。用Invitrogen S.N.A.P.TMMiniprep试剂盒(Invitrogen Corp.)按制造商说明书制备5ml LB+50μg/ml氨苄青霉素的过夜培养物。用ABIPRISMTMBig Dye Terminator Cycle Sequencing Ready Reaction Kit(Perkin-Elmer Corp.)按制造商说明书在ABIPRISMTM377型DNA测序仪(Perkin-Elmer Cetus,Norwalk,CT)上进行模板测序。利用寡核苷酸ZC694(SEQ ID NO6)、ZC6768(SEQ ID NO32)、ZC18297(SEQID NO33)、ZC18298(SEQ ID NO34)、ZC18402(SEQ ID NO35)、ZC18403(SEQ ID NO36)、ZC18456(SEQ ID NO37)、ZC18457(SEQID NO38)、ZC18560(SEQ ID NO39)、ZC18561(SEQ ID NO40)、ZC18687(SEQ ID NO41)和ZC18688(SEQ ID NO42)完成克隆的DNA测序。在Hybaid OmniGene Temperature Cycling System(National Labnet Co.,Woodbridge,NY)中进行测序反应。利用SEQUENCHERTM3.1序列分析软件(Gene Codes Corporation,Ann Arbor,MI)进行数据分析。得到的2559bp序列公开于SEQ ID NO43中,推断出的氨基酸序列公开于SEQ ID NO44中。与人zsig37核苷酸序列(SEQ ID NO1)进行对比,显示在核苷酸水平上有77%相同。推定的氨基酸序列(SEQ ID NO44)与人多肽序列(SEQ ID NO2)有77%相同。
实施例10基于细胞的检测在高容量的体外试验中检验zsig37多肽以鉴定能选择性激活永生化成骨细胞系中细胞反应的物质。试验中使用衍生自P53-/-(缺陷型)小鼠的成熟成骨细胞细胞系CCC4,它已用含驱使萤光素酶表达的诱导型血清反应元件(SRE)的质粒进行了转染。这些细胞还表达内源PTH、PDGF和bFGF受体。SRE的刺激作用及因此CCC4细胞中萤光素酶的表达表明该化学实体可能刺激了成骨细胞中的有丝分裂。
用胰蛋白酶消化CCC4细胞系并在铺板培养基(α-MEM,1%热失活胎牛血清,1mM丙酮酸钠和2mM L-谷氨酸)中调节至5×104个细胞/ml,铺于(200μl/孔)Dynatech Microlite不透明白色微量滴定板(Dynatech,Chantilly,VA)中,在37℃、5%CO2中温育过夜。然后吸出生长培养基,并以50μl/孔换入试验培养基(F-12HAM,0.5%牛血清清蛋白,20mM HEPES,1mM丙酮酸钠和2mM L-谷氨酸)置换。在试验培养基中连续稀释zsig37(0.29-1000ng/ml终试验浓度)并加入各孔中。对zsig37样品进行三份试验。还使用血清(阴性)和bFGF(阳性)对照。bFGF终浓度为3ng/ml。对照进行四份试验。将平板在37℃,5%CO2中温育4小时。然后吸出试验培养基并用PBS洗涤平板1次。之后向每孔中加入25μl溶解缓冲液(Luciferase Assay Reagent,E1501,Promega Corp.,Madison,WI)。将平板于室温保温15分钟。以50μl/孔加入萤光素酶底物(Luciferase Assay Reagent,E1501,Promega Corp.)并用Labsystems LUMINOSKAN以2秒/孔然后延迟1秒的速度检测萤光素酶活性。从表5表示的作为3ng/ml bFGF产生的最大诱导信号的百分率的所有读数中减去平均基底(未诱导)信号。
在该检验中zsig37刺激了萤光素酶的表达,表明zsig37可刺激成骨细胞。在1000ng/ml时zsig37的刺激水平为最大值的73-75%。
进行抗部分生长因子模拟试验以确定是否zsig37是作为生长因子的模拟物,尤其是酪氨酸激酶受体DDGF、bFGF和EGF(胰岛素-R阴性)。此试验中使用来自Swiss 3T3小鼠的克隆细胞系Swiss 3T3,该细胞系已用含有驱动萤光素酶表达的诱导型血清反应元件(SRE)的质粒进行了转染。这些细胞还表达内源PMA、EGF和bFGF受体。SRE的刺激作用及因此萤光素酶在Swiss 3T3细胞中的表达表明该化学实体有可能模拟PDGF、bFGF和EGF生长因子的活性。
如上所述用胰蛋白酶消化Swiss 3T3细胞并在铺板培养基中调节至5×104个细胞/ml,铺平板并进行温育。然后吸出生长培养基并以50μl/孔换入检验培养基(F-12HAM,0.5%牛血清清蛋白,20mMHEPES)。在检验培养基中进行zsig37的连续稀释(终检验浓度0.29-1000ng/ml)并加入各孔中。对zsig37样品进行三份试验。还使用血清(阴性)和bFGF(阳性)对照以促进细胞增殖。bFGF的终浓度为3ng/ml。对照进行四份试验。将平板在37℃,5%CO2中温育5小时。然后吸出检验培养基并用PBS洗涤平板1次。随后将25μl溶解缓冲液(Luciferase Assay Reagent,E1501,Promega Corp.,Madison,WI)加入每一孔中。室温温育平板15分钟。加入40μl/孔的萤光素酶底物(Luciferase Assay Reagent,E1501,Promega Corp.)并用Labsystems LUMINOSKAN以2秒/孔随后延迟1秒的速度检测萤光素酶活性。从表示为3ng/ml bFGF所产生的最大诱导的百分率的所有读数中减去平均基底(未诱导)信号。用bFGF、DDGF,EGF或PMA处理该细胞系5小时导致SRE萤光素酶表达诱导了25-50倍。
在此试验中未看出zsig37能刺激萤光素酶的表达。1000ng/ml时zsig37的刺激水平为最大值的0.2-0.1%。
实施例11通过腺病毒送递的zsig37体内施用在注射前4天内(-4--1天)每天称量12周龄的24只雄性和24只雌性C57B16/J小鼠(Jackson Labs,Bar Harbor,ME)体重,测体温并监测食物摄取情况。在注射当天,将小鼠分成3组并通过尾静脉内注射接受0.1ml病毒(AdV空病毒1.8×1011个病毒颗粒/0.1ml或AdV-zsig37-CEE 5×1011个病毒颗粒/0.1ml),或者根本不注射。注射将导致宿主的肝脏发生感染,且经病毒送递的基因将于24小时内开始表达并持续1-4周。检验3组小鼠。组1,未处理,雌雄各8只。组2,AdV空病毒(空病毒),雄雌各8只。组3,AdV-zsig37 CEE,雄雌各8只。
在研究的3周内监测动物的体温、体重和消化食物重量。在各组间未发现差异。
在第21天无痛处理雌性小鼠并经颈离体术处死,在第22天同样处理雄性小鼠。将动物放血并收获组织进行尸检。
在处死小鼠时进行标准血清化学板。肝、肾和代谢参数均处于正常范围内。然而,在zsig37处理组和空病毒处理组之间有所不同。与空病毒对照相比,zsig37动物具有更高的平均血脂指数。这种差别不大,但却有必要作进一步的调查。检测每一动物剩余血清中的总游离脂肪酸。在接受空病毒的雄性小鼠(p=0.0379)及接受zsig37编码病毒的雄性小鼠间可见血清游离脂肪酸水平有统计学上显著的差异;zsig37小鼠水平较高。尽管统计学上看不太显著,但雌性小鼠间也可见有差别(p=0.3357)。离体后称量肝、脾、肾、胸腺、心脏和脑的重量。在处理各组间未发现差别。这些组织和骨髓的组织病理学分析表明在处理各组间无差别。
为了进一步证实上述结果,如上述并作以下改动进行第二次筛选。检验三组a)未处理并受禁食,b)空AdV并禁食,c)AdV-zsig37-CEE并禁食,每组各包括20只C57B16/J,雌雄各10只。将小鼠禁食过夜,收集100μl血清以得到以下参数的基底水平禁食的葡萄糖、TP、碱性磷酸酶、胆固醇、甘油三酯、游离脂肪酸和胰岛素。每周测量体重三次。在第0天,将0.1ml合适病毒溶液从侧尾静脉注射入小鼠。第17天时收集血液,随后禁食过夜。3周后处死小鼠并收集所有血液。将部分血液与EDTA混合以观察CBC,对剩余物如上所述进行重新检验和筛选。收集器官并保留尸体供组织病理学研究。
尽管为了说明的目的而在本文中描述了本发明的一些具体实施方案,但从上文所述可知,还可进行不偏离本发明精神和范围的多种修改。因此,本发明仅由附加的权利要求所限制。
序列表(110)ZymoGenetics,Inc.(120)脂肪细胞特异蛋白质的同系物(130)97-30PC(150)60/053,154(151)1997-07-18(160)44(170)FastSEQ for Windows Version 3.0(210)1(211)2769(212)DNA(213)人(220)(221)CDS(222)(171)...(1013)(400)1gaattcgaat tcctttgttt ccactgggac ggaatcggag ctctggaggc tgggctggcc60aagcgccccg aaggcccgat gcctgacggc tcatgcggcc tccttgtttg cagggcctgg 120gcaaaaattt acactgagtc ccactcttcg ctccagggcc cggcaggaag atg ggc 176Met Gly1tcc cgt gga cag gga ctc ttg ctg gcg tac tgc ctg ctc ctt gcc ttt 224Ser Arg Gly Gln Gly Leu Leu Leu Ala Tyr Cys Leu Leu Leu Ala Phe5 10 15gcc tct ggc ctg gtc ctg agt cgc gtg ccc cat gtc cag ggg gaa cag 272Ala Ser Gly Leu Val Leu Ser Arg Val Pro His Val Gln Gly Glu Gln20 25 30cag gag tgg gag ggg act gag gag ctg ccg tcc cct ccg gac cat gcc 320Gln Glu Trp Glu Gly Thr Glu Glu Leu Pro Ser Pro Pro Asp His Ala35 40 45 50gag agg gct gaa gaa caa cat gaa aaa tac agg ccc agt cag gac cag 368Glu Arg Ala Glu Glu Gln His Glu Lys Tyr Arg Pro Ser Gln Asp Gln55 60 65ggg ctc cct gct tcc cgg tgc ttg cgc tgc tgt gac cct ggt acc tcc 416Gly Leu Pro Ala Ser Arg Cys Leu Arg Cys Cys Asp Pro Gly Thr Ser70 75 80atg tac ccg gcg acc gcc gtg ccc cag atc aac atc act atc ttg aaa 464Met Tyr Pro Ala Thr Ala Val Pro Gln Ile Asn Ile Thr Ile Leu Lys85 90 95ggg gag aag ggt gac cgc gga gat cga ggc ctc caa ggg aaa tat ggc 512Gly Glu Lys Gly Asp Arg Gly Asp Arg Gly Leu Gln Gly Lys Tyr Gly100 105 110aaa aca ggc tca gca ggg gcc agg ggc cac act gga ccc aaa ggg cag 560Lys Thr Gly Ser Ala Gly Ala Arg Gly His Thr Gly Pro Lys Gly Gln115 120 125 130aag ggc tcc atg ggg gcc cct ggg gag cgg tgc aag agc cac tac gcc 608Lys Gly Ser Met Gly Ala Pro Gly Glu Arg Cys Lys Ser His Tyr Ala135 140 145gcc ttt tcg gtg ggc cgg aag aag ccc atg cac agc aac cac tac tac 656Ala Phe Ser Val Gly Arg Lys Lys Pro Met His Ser Asn His Tyr Tyr150 155 160cag acg gtg atc ttc gac acg gag ttc gtg aac ctc tac gac cac ttc 704Gln Thr Val Ile Phe Asp Thr Glu Phe Val Asn Leu Tyr Asp His Phe165 170 175aac atg ttc acc ggc aag ttc tac tgc tac gtg ccc ggc ctc tac ttc 752Asn Met Phe Thr Gly Lys Phe Tyr Cys Tyr Val Pro Gly Leu Tyr Phe180 185 190ttc agc ctc aac gtg cac acc tgg aac cag aag gag acc tac ctg cac 800Phe Ser Leu Asn Val His Thr Trp Asn Gln Lys Glu Thr Tyr Leu His195 200 205 210atc atg aag aac gag gag gag gtg gtg atc ttg ttc gcg cag gtg ggc 848Ile Met Lys Asn Glu Glu Glu Val Val Ile Leu Phe Ala Gln Val Gly215 220 225gac cgc agc atc atg caa agc cag agc ctg atg ctg gag ctg cga gag 896Asp Arg Ser Ile Met Gln Ser Gln Ser Leu Met Leu Glu Leu Arg Glu230 235 240cag gac cag gtg tgg gta cgc ctc tac aag ggc gaa cgt gag aac gcc 944Gln Asp Gln Val Trp Val Arg Leu Tyr Lys Gly Glu Arg Glu Asn Ala245 250 255atc ttc agc gag gag ctg gac acc tac atc acc ttc agt ggc tac ctg 992Ile Phe Ser Glu Glu Leu Asp Thr Tyr Ile Thr Phe Ser Gly Tyr Leu260 265 270gtc aag cac gcc acc gag ccc tagctggccg gccacctcct ttcctctcgc 1043Val Lys His Ala Thr Glu Pro275 280caccttccac ccctgcgctg tgctgacccc agggctcagc accaggctga ccccaccgcc 1103tcttccccga tccctggact ccgactccct ggctttggca ttcagtgaga cgccctgcac 1163acacagaaag ccaaagcgat cggtgctccc agatcccgca gcctctggag agagctgacg 1223gcagatgaaa tcaccagggc ggggcacccg cgagaaccct ctgggacctt ccgcggccct 1283ctctgcacac atcctcaagt gaccccgcac ggcgagacgc gggtggcggc agggcgtccc 1343agggtgcggc accgcggctc cagtccttgg aaataattag gcaaattcta aaggtctcaa 1403aaggagcaaa gtaaaccgtg gaggacaaag aaaagggttg ttatttttgt ctttccagcc 1463agcctgctgg ctcccaagag agaggccttt tcagttgaga ctctgcttaa gagaagatcc 1523aaagttaaag ctctggggtc aggggagggg ccgggggcag gaaactacct ctggcttaat 1583tcttttaagc cacgtaggaa ctttcttgag ggataggtgg accctgacat ccctgtggcc 1643ttgcccaagg gctctgctgg tctttctgag tcacagctgc gaggtgatgg gggctggggc 1703cccaggcgtc agcctcccag agggacagct gagccccctg ccttggctcc aggttggtag 1763aagcagccga agggctcctg acagtggcca gggacccctg ggtcccccag gcctgcagat 1823gtttctatga ggggcagagc tcctggtaca tccatgtgtg gctctgctcc acccctgtgc 1883caccccagag ccctgggggg tggtctccat gcctgccacc ctggcatcgg ctttctgtgc 1943cgcctcccac acaaatcagc cccagaaggc cccggggctt tggcttctgt tttttataaa 2003acacctcaag cagcactgca gtctcccatc tcctcgtggg ctaagcatca ccgcttccac 2063gtgtgttgtg ttggttggca gcaaggctga tccagacccc ttctgccccc actgccctca 2123tccaggcctc tgaccagtag cctgagaggg gctttttcta ggcttcagag caggggagag 2183ctggaagggg ctagaaagct cccgcttgtc tgtttctcag gctcctgtga gcctcagtcc 2243tgagaccaga gtcaagagga agtacacatc ccaatcaccc gtgtcaggat tcactctcag 2303gagctgggtg gcaggagagg caatagcccc tgtggcaatt gcaggaccag ctggagcagg 2363gttgcggtgt ctccgcggtg ctctcgccct gcccatggcc accccagact ctgatctcca 2423ggaaccccat agcccctctc cacctcaccc catgttgatg cccagggtca ctcttgctac 2483ccgctgggcc cccaaacccc cgctgcctct cttccttccc cccatccccc acctggtttt 2543gactaatcct gcttccctct ctgggcctgg ctgccgggat ctggggtccc taagtccctc 2603tctttaaaga acttctgcgg gtcagactct gaagccgagt tgctgtgggc gtgcccggaa 2663gcagagcgcc acactcgctg cttaagctcc cccagctctt tccagaaaac attaaactca 2723gaattgtgtt ttcagcaaaa aaaaaaaaaa aaaaaagggc ggccgc 2769(210)2(211)281(212)PRT(213)人(400)2Met Gly Ser Arg Gly Gln Gly Leu Leu Leu Ala Tyr Cys Leu Leu Leu1 5 10 15Ala Phe Ala Ser Gly Leu Val Leu Ser Arg Val Pro His Val Gln Gly20 25 30Glu Gln Gln Glu Trp Glu Gly Thr Glu Glu Leu Pro Ser Pro Pro Asp35 40 45His Ala Glu Arg Ala Glu Glu Gln His Glu Lys Tyr Arg Pro Ser Gln50 55 60Asp Gln Gly Leu Pro Ala Ser Arg Cys Leu Arg Cys Cys Asp Pro Gly65 70 75 80Thr Ser Met Tyr Pro Ala Thr Ala Val Pro Gln Ile Asn Ile Thr Ile85 90 95Leu Lys Gly Glu Lys Gly Asp Arg Gly Asp Arg Gly Leu Gln Gly Lys100 105 110Tyr Gly Lys Thr Gly Ser Ala Gly Ala Arg Gly His Thr Gly Pro Lys115 120 125Gly Gln Lys Gly Ser Met Gly Ala Pro Gly Glu Arg Cys Lys Ser His130 135 140Tyr Ala Ala Phe Ser Val Gly Arg Lys Lys Pro Met His Ser Asn His145 150 155 160Tyr Tyr Gln Thr Val Ile Phe Asp Thr Glu Phe Val Asn Leu Tyr Asp165 170 175His Phe Asn Met Phe Thr Gly Lys Phe Tyr Cys Tyr Val Pro Gly Leu180 185 190Tyr Phe Phe Ser Leu Asn Val His Thr Trp Asn Gln Lys Glu Thr Tyr195 200 205Leu His Ile Met Lys Asn Glu Glu Glu Val Val Ile Leu Phe Ala Gln210 215 220Val Gly Asp Arg Ser Ile Met Gln Ser Gln Ser Leu Met Leu Glu Leu225 230 235 240Arg Glu Gln Asp Gln Val Trp Val Arg Leu Tyr Lys Gly Glu Arg Glu245 250 255Asn Ala Ile Phe Ser Glu Glu Leu Asp Thr Tyr Ile Thr Phe Ser Gly260 265 270Tyr Leu Val Lys His Ala Thr Glu Pro275 280(210)3(211)247(212)PRT(213)人(400)3Met Leu Leu Leu Gln Ala Leu Leu Phe Leu Leu Ile Leu Pro Ser His1 5 10 15Ala Glu Asp Asp Val Thr Thr Thr Glu Glu Leu Ala Pro Ala Leu Val20 25 30Pro Pro Pro Lys Gly Thr Cys Ala Gly Trp Met Ala Gly Ile Pro Gly35 40 45His Pro Gly His Asn Gly Thr Pro Gly Arg Asp Gly Arg Asp Gly Thr50 55 60Pro Gly Glu Lys Gly Glu LysGly Asp Ala Gly Leu Leu Gly Pro Lys65 70 75 80Gly Glu Thr Gly Asp Val Gly Met Thr Gly Ala Glu Gly Pro Arg Gly85 90 95Phe Pro Gln Thr Pro Gly Arg Lys Gly Glu Pro Gly Glu Ala Ala Tyr100 105 110Met Tyr Arg Ser Ala Phe Ser Val Gly Leu Glu Thr Arg Val Thr Val115 120 125Pro Asn Val Pro Ile Arg Phe Thr Lys Ile Phe Tyr Asn Gln Gln Asn130 135 140His Tyr Asp Gly Ser Thr Gly Lys Phe Tyr Cys Asn Ile Pro Gly Leu145 150 155 160Tyr Tyr Phe Ser Tyr His Ile Thr Val Tyr Met Lys Asp Val Lys Val165 170 175Ser Leu Phe Lys Lys Asp Lys Ala Val Leu Phe Thr Tyr Asp Gln Tyr180 185 190Gln Glu Lys Asn Val Asp Gln Ala Ser Gly Ser Val Leu Leu His Leu195 200 205Glu Val Gly Asp Gln Val Trp Leu Gln Val Tyr Gly Asp Gly Asp His210 215 220Asn Gly Leu Tyr Ala Asp Asn Val Asn Asp Ser Thr Phe Thr Gly Phe225 230 235 240Leu Leu Tyr His Asp Thr Asn245(210)4(211)30(212)DNA(213)人工序列(220)(223)寡核苷酸ZC12447(400)4atggggcacg cgactcagga ccaggccaga 30(210)5(211)19(212)DNA(213)人工序列(220)(223)寡核苷酸ZC695(400)5gatttaggtg acactatag 19(210)6(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC694(400)6taatacgact cactataggg20(210)7(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13210(400)7aagcaccggg aagcagggag20(210)8(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13588(400)8cgggcacgta gcagtagaac20(210)9(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13532(400)9gagagggctg aagaacaaca20(210)10(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13641(400)10aaggtggcga gaggaaagga20(210)11(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13586(400)11tgttcaccgg caagttctac20(210)12(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13651(400)12ctttgtcctc cacggtttac20(210)13(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13622(400)13tttcctctcg ccaccttcca20(210)14(211)21(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13625(400)14cttcggctgc ttctaaccaa c 21(210)15(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13650(400)15gtaaaccgtg gaggacaaag20(210)16(211)21(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13859(400)16gctgccaacc aacacaacca c 21(210)17(211)18(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13624(400)17gcaggattag tcaaaacc 18(210)18(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13531(400)18aacatggggt gaggtggaga20(210)19(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13587(400)19tcctcgtggg ctaagcatca20(210)20(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13623(400)20atctccagga accccatagc20(210)21(211)18(212)DNA(213)人工序列(220)(223)寡核苷酸ZC14444(400)21tctccaggaa ccccatag 18(210)22(211)18(212)DNA(213)人工序列(220)(223)寡核苷酸ZC14445(400)22gcaggattag tcaaaacc 18(210)23(211)843(212)DNA(213)人工序列(220)(223)编码zsig37多肽的简并核苷酸序列(400)23atgggnwsnm gnggncargg nytnytnytn gcntaytgyy tnytnytngc nttygcnwsn 60ggnytngtny tnwsnmgngt nccncaygtn carggngarc arcargartg ggarggnacn120gargarytnc cnwsnccncc ngaycaygcn garmgngcng argarcarca ygaraartay180mgnccnwsnc argaycargg nytnccngcn wsnmgntgyy tnmgntgytg ygayccnggn240acnwsnatgt ayccngcnac ngcngtnccn carathaaya thacnathyt naarggngar300aarggngaym gnggngaymg nggnytncar ggnaartayg gnaaracngg nwsngcnggn360gcnmgnggnc ayacnggncc naarggncar aarggnwsna tgggngcncc nggngarmgn420tgyaarwsnc aytaygcngc nttywsngtn ggnmgnaara arccnatgca ywsnaaycay480taytaycara cngtnathtt ygayacngar ttygtnaayy tntaygayca yttyaayatg540ttyacnggna arttytaytg ytaygtnccn ggnytntayt tyttywsnyt naaygtncay600acntggaayc araargarac ntayytncay athatgaara aygargarga rgtngtnath660ytnttygcnc argtnggnga ymgnwsnath atgcarwsnc arwsnytnat gytngarytn720mgngarcarg aycargtntg ggtnmgnytn tayaarggng armgngaraa ygcnathtty780wsngargary tngayacnta yathacntty wsnggntayy tngtnaarca ygcnacngar840ccn 843(210)24(211)24(212)DNA(213)人工序列(220)(223)寡核苷酸ZC15040(400)24actcattcta gactagggct cggt 24(210)25(211)24(212)DNA(213)人工序列(220)(223)寡核苷酸ZC15033(400)25atgaatggat ccctggtcct gagt 24(210)26(211)7(212)PRT(213)人工序列(220)(223)Glu-Glu亲和标记肽(400)26Glu Glu Tyr Met Pro Met Glu1 5(210)27(211)24(212)DNA(213)人工序列(220)(223)寡核苷酸ZC15721(400)27ctgtaggaat tcatgggctc ccgt 24(210)28(211)24(212)DNA(213)人工序列(220)(223)寡核苷酸ZC15035(400)28attcatggat ccgggctcgg tggc 24(210)29(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13006(400)29ggctgtcctc taagcgtcac20(210)30(211)19(212)DNA(213)人工序列(220)(223)寡核苷酸ZC13007(400)30aggggtcaca gggatgcca 19(210)31(211)6(212)PRT(213)人工序列(220)(223)Glu-Glu肽(400)31Gly Tyr Met Pro Val Asp1 5(210)32(211)25(212)DNA(213)人工序列(220)(223)寡核苷酸ZC6768(400)32gcaattaacc ctcactaaag ggaac 25(210)33(211)21(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18297(400)33tcctgaaagg cgagaaaggt g 21(210)34(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18298(400)34ttccctgagt ctgagctagg20(210)35(211)21(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18402(400)35tccagagtga ctggggaagt g 21(210)36(211)21(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18403(400)36agtgacgagt tcgacaccta c 21(210)37(211)21(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18456(400)37tgtgttccca ttcctggaca c 21(210)38(211)21(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18457(400)38tccttccagc tggctggaaa g 21(210)39(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18560(400)39agaatgcagg gataggtcag20(210)40(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18561(400)40tcagaggatc ctgacagcag20(210)41(211)21(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18687(400)41tggacacgtg agagggactt c 21(210)42(211)20(212)DNA(213)人工序列(220)(223)寡核苷酸ZC18688(400)42agcagtagaa cttcccagtg20(210)43(211)2559(212)DNA(213)Mus musculus(220)(221)CDS(222)(70)...(912)(223)小鼠同系物(400)43gaattcggat cctggaagag atgggattgt tataggcgga aagagagaaa cccagagaag60tccaggaag atg ggc tcc tgt gca cag gga ttc atg ctg gga tgc tgc ctg 111Met Gly Ser Cys Ala Gln Gly Phe Met Leu Gly Cys Cys Leu1 5 10ctg ctg gcc atc acc tgg ggc ccc atc ctg agc ctt gtg cca cgc gtt 159Leu Leu Ala Ile Thr Trp Gly Pro Ile Leu Ser Leu Val Pro Arg Val15 20 25 30cag gag gaa caa cag gag tgg gaa gag aca gag gag ctg cca tct cct 207Gln Glu Glu Gln Gln Glu Trp Glu Glu Thr Glu Glu Leu Pro Ser Pro35 40 45ctg gat cct gtg aca agg cct gaa gaa aca cga gag aag tat agc cct 255Leu Asp Pro Val Thr Arg Pro Glu Glu Thr Arg Glu Lys Tyr Ser Pro50 55 60cgc cag ggt gag gac ctc ccc act tct cgg tgc tac cga tgc tgt gac 303Arg Gln Gly Glu Asp Leu Pro Thr Ser Arg Cys Tyr Arg Cys Cys Asp65 70 75ccc agc aca cct gta tac cag aca att cct cca ccc cag atc aac atc 351Pro Ser Thr Pro Val Tyr Gln Thr Ile Pro Pro Pro Gln Ile Asn Ile80 85 90acc atc ctg aaa ggc gag aaa ggt gac cga ggg gat cga ggc ctc cag 399Thr Ile Leu Lys Gly Glu Lys Gly Asp Arg Gly Asp Arg Gly Leu Gln95 100 105 110ggg aag tac ggc aaa ata ggt tct aca ggt ccc agg ggc cat gtt ggc 447Gly Lys Tyr Gly Lys Ile Gly Ser Thr Gly Pro Arg Gly His Val Gly115 120 125ccc aaa ggg cag aag gga tcc att gga gcc cct ggg aac cac tgc aag 495Pro Lys Gly Gln Lys Gly Ser Ile Gly Ala Pro Gly Asn His Cys Lys130 135 140agc cag tac gca gcc ttc tcc gtg ggc cgg aag aag gct ttg cac agc 543Ser Gln Tyr Ala Ala Phe Ser Val Gly Arg Lys Lys Ala Leu His Ser145 150 155aac gac tac ttc cag ccc gtg gtc ttc gac acg gag ttt gtg aac ctc 591Asn Asp Tyr Phe Gln Pro Val Val Phe Asp Thr Glu Phe Val Asn Leu160 165 170tac aaa cac ttc aat atg ttc act ggg aag ttc tac tgc tat gtg ccg 639Tyr Lys His Phe Asn Met Phe Thr Gly Lys Phe Tyr Cys Tyr Val Pro175 180 185 190ggc atc tac ttc ttc agc ctc aac gtg cac act tgg aac cag aag gag 687Gly Ile Tyr Phe Phe Ser Leu Asn Val His Thr Trp Asn Gln Lys Glu195 200 205acg tac ctg cac atc atg aag aac gag gag gag gtg gtg atc ctg tat 735Thr Tyr Leu His Ile Met Lys Asn Glu Glu Glu Val Val Ile Leu Tyr210 215 220gcg cag gtg agc gac cgc agc atc atg cag agt cag agc ctg atg atg 783Ala Gln Val Ser Asp Arg Ser Ile Met Gln Ser Gln Ser Leu Met Met225 230 235gag ctg cgg gag gag gat gag gtc tgg gtg cgt ctc ttc aag ggc gag 831Glu Leu Arg Glu Glu Asp Glu Val Trp Val Arg Leu Phe Lys Gly Glu240 245 250cgt gag aac gcc att ttc agt gac gag ttc gac acc tac atc acc ttc 879Arg Glu Asn Ala Ile Phe Ser Asp Glu Phe Asp Thr Tyr Ile Thr Phe255 260 265 270agt ggc tac ctg gtc aag cca gcc tct gag ccc tagtggacac tcctgtggag 932Ser Gly Tyr Leu Val Lys Pro Ala Ser Glu Pro275 280cttttgtgga ctgctgacct ccttgcctgg caccctgacc tatccctgca ttctacagac 992actggagtcc tgccccgggc tgaccccatt ttctctctgc tccatcctgg cttccttggc 1052cttggcttcc aaagttttgg cttttgacaa gatgcccttg gccactggga atcccaaagg 1112atggtgcgat cccagatctg gctgctactc taagcagaga gctgccggca gatgaaatca 1172ttgggcgggg agcctgtgag gatattgggg ggcctccagc tccttctgtg tacacagcct 1232tagacgaccc tgtgctgtgt tgtcccgtgg ccacagggtg ttccagagca cagcccctgt 1292gtgttcccat tcctggacac aagtaagcaa atatcatggg tttcttagga acgaagtcaa 1352gcagaaaaga gaaagaaagg tggtgttagt tttggctttc cagccagctg gaaggaggga 1412tggggagaga gagagagaga gagctatttg tattggggaa actgaggcat aggaaaaaca 1472tgaatggcaa cagagtagct gcagtttgtg ggtttggaaa ccacatctga cttaactcta 1532gatcacatat gagctttcct ggggacagca ggactgacct ccgagctctg ttgacatgct 1592atagccttgc ccaggggctg gtcaatcttt ctgagccaca ctagtaaaag ggttggagga 1652gaacagcaag tgccccctgt ggttggctct gggctggtgg cagcatcctg cttgccccaa 1712ctcacaggat cctgacagca gctgggaacc tcagggactc ctgcagcttt ctctgtaaga 1772aataaagctc ctactatgtc ccagtacctc tctgctctgc tccacttccc cagtcactct 1832ggaccccagg gtgggagggc tctcttgcct gttgggacat cagttcccct tcctccttct 1892tggtgaatta accatggaag gaccagggct cggatttggg ttcccaaact gcccttcacc 1952atccctagtg tcctgcttcc ttcccagttc agcatcctgt ctgggaactt gatactttaa 2012cctgctagag cggatgagtc tgatagacct gcccagccct gacacagccc tagtcagctt 2072atggacacgt gagagggact tcctttgaga cccagagctg gggtagagct ataaaaatct 2132acctattccc gggtcaaccc caagtggtag aagaggacac aggctatccc gccctagctc 2192agactcaggg aaggcctcag gcctgattgt ctgactgcag agagcctgtg ttctttcccc 2252atctcacccc gtgttgatcc ccagggcctg ggccactgga tatctgcttt gtgccaacta 2312ggccttgctt gctgcttcct ggtggccctt ggttaggatc cctctctttt ccttctggag 2372ctcaatgtac gtatatgcca cctccgaagg ggcttctgct ggtcagactc tccaagccac 2432ttccatgggt gtgcctacag cagaggctgc tgcctcctgt gctctaccct gctctttcca 2492gaaaacatta aacttgccat ggcgattcac agcaaaaaaa aaaaaaaaaa aaaaaaaagg 2552gcggccg2559(210)44(211)281(212)PRT(213)Mus musculus(400)44Met Gly Ser Cys Ala Gln Gly Phe Met Leu Gly Cys Cys Leu Leu Leu1 5 10 15Ala Ile Thr Trp Gly Pro Ile Leu Ser Leu Val Pro Arg Val Gln Glu20 25 30Glu Gln Gln Glu Trp Glu Glu Thr Glu Glu Leu Pro Ser Pro Leu Asp35 40 45Pro Val Thr Arg Pro Glu Glu Thr Arg Glu Lys Tyr Ser Pro Arg Gln50 55 60Gly Glu Asp Leu Pro Thr Ser Arg Cys Tyr Arg Cys Cys Asp Pro Ser65 70 75 80Thr Pro Val Tyr Gln Thr Ile Pro Pro Pro Gln Ile Asn Ile Thr Ile85 90 95Leu Lys Gly Glu Lys Gly Asp Arg Gly Asp Arg Gly Leu Gln Gly Lys100 105 110Tyr Gly Lys Ile Gly Ser Thr Gly Pro Arg Gly His Val Gly Pro Lys115 120 125Gly Gln Lys Gly Ser Ile Gly Ala Pro Gly Asn His Cys Lys Ser Gln130 135 140Tyr Ala Ala Phe Ser Val Gly Arg Lys Lys Ala Leu His Ser Asn Asp145 150 155 160Tyr Phe Gln Pro Val Val Phe Asp Thr Glu Phe Val Asn Leu Tyr Lys165 170 175His Phe Asn Met Phe Thr Gly Lys Phe Tyr Cys Tyr Val Pro Gly Ile180 185 190Tyr Phe Phe Ser Leu Asn Val His Thr Trp Asn Gln Lys Glu Thr Tyr195 200 205Leu His Ile Met Lys Asn Glu Glu Glu Val Val Ile Leu Tyr Ala Gln210 215 220Val Ser Asp Arg Ser Ile Met Gln Ser Gln Ser Leu Met Met Glu Leu225 230 235 240Arg Glu Glu Asp Glu Val Trp Val Arg Leu Phe Lys Gly Glu Arg Glu245 250 255Asn Ala Ile Phe Ser Asp Glu Phe Asp Thr Tyr Ile Thr Phe Ser Gly260 265 270Tyr Leu Val Lys Pro Ala Ser Glu Pro275 280
权利要求
1.所含氨基酸残基序列与SEQ ID NO2第26-281位残基有至少75%相同的分离多肽,其中所说的序列含有形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中的Xaa可为任何氨基酸;及羧基末端球形部分。
2.根据权利要求1的分离多肽,其中所说多肽的氨基酸序列与SEQ ID NO2第22-281位残基有至少90%相同。
3.根据权利要求2的分离多肽,其中所说的多肽含SEQ ID NO2第1-281位残基或SEQ ID NO44第1-281位残基。
4.根据权利要求1的分离多肽,其在氨基末端或羧基末端与选自亲和标志、毒素、放射性核素、酶和荧光团的部分共价连接。
5.根据权利要求4的分离多肽,其在所说的氨基酸残基序列和所说的亲和标志间还含有蛋白水解切割位点。
6.一种分离多肽,其选自下组a)所含氨基酸残基序列与SEQ ID NO2第99-140位氨基酸残基的序列有至少75%相同的多肽;b)所含氨基酸残基序列与SEQ ID NO2第140或141位至281位氨基酸残基的序列有至少75%相同的多肽;c)所含氨基酸残基序列与SEQ ID NO2第99-281位氨基酸残基的序列有至少75%相同的多肽。
7.基本上由通过肽键连接的第一部分和第二部分组成的融合蛋白质,所说的第一部分包括选自下组的多肽a)所含氨基酸残基序列与SEQ ID NO2第26-281位氨基酸残基的序列有至少75%相同的多肽;b)包含SEQ ID NO2第1、22或26位至281位氨基酸残基所示序列的多肽;c)包含SEQ ID NO44第1、22或26位至第281位氨基酸残基所示序列的多肽;d)SEQ ID NO2或SEQ ID NO44所示zsig37多肽的包含类胶原蛋白结构域或者能二聚体化或多聚体化的类胶原蛋白结构域部分的部分;e)SEQ ID NO2或SEQ ID NO44中所示zsig37多肽的包含类球形结构域或类球形结构域活性部分的部分;或f)SEQ ID NO2或SEQ ID NO44中所示zsig37多肽的包括类胶原蛋白结构域和球形结构域的部分;并且所说的第二部分包括另一种多肽。
8.根据权利要求7的融合蛋白质,其中所说的第一部分选自下组a)具有SEQ ID NO2或SEQ ID NO44第99-140位氨基酸残基序列的多肽;b)具有SEQ ID NO2或SEQ ID NO44第140或141-281位氨基酸残基序列的多肽;c)具有SEQ ID NO2或SEQ ID NO44第99-281位氨基酸残基序列的多肽。
9.包含具SEQ ID NO2或SEQ ID NO44第1-21或1-25位氨基酸残基序列的分泌信号序列的融合蛋白,其中所说的分泌信号序列与附加多肽可操作性地连接。
10.含以下可操作性连接在一起的元件的表达载体转录启动子;编码所含氨基酸残基序列与SEQ ID NO2第26-281位氨基酸残基有至少75%相同的多肽的DNA区段,其中所说的序列包含形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中Xaa可为任何氨基酸;及羧基末端球形部分;和转录终止子。
11.根据权利要求10的表达载体,其中所说的DNA区段编码与SEQ ID NO2第26-281位氨基酸残基的序列有至少90%相同的多肽。
12.根据权利要求11的表达载体,其中所说的DNA区段编码与SEQ ID NO2第22-281位氨基酸残基的序列有至少90%相同的多肽。
13.根据权利要求11的表达载体,其中所说的DNA片段编码含SEQ ID NO2第1-281位残基或SEQ ID NO44第1-281位残基的多肽。
14.根据权利要求11的表达载体,其中所说的DNA区段编码在氨基末端或羧基末端共价连接了亲和标志的多肽。
15.根据权利要求11的表达载体,其中所说的DNA区段进一步编码与所说多肽可操作连接的分泌信号序列。
16.根据权利要求15的表达载体,其中所说的分泌信号序列包含SEQ ID NO2或SEQ ID NO44第1-21或1-25位残基。
17.已引入含以下可操作连接在一起的元件的表达载体的培养细胞转录启动子;编码所含氨基酸残基序列与SEQ ID NO2第26-281位残基有至少75%相同的多肽的DNA区段,其中所说序列包含形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中Xaa可为任何氨基酸;及羧基末端球形部分;和转录终止子,其中所说细胞表达由所说DNA区段编码的所说多肽。
18.一种生产多肽的方法,包括培养已引入含以下可操作连接在一起的元件的表达载体的细胞转录启动子;编码所含氨基酸残基序列与SEQ ID NO2第26-281位残基有至少75%相同的多肽的DNA区段,其中所说的序列包含形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中Xaa可为任何氨基酸;和羧基末端球形部分;和转录终止子;其中所说细胞表达由所说DNA区段编码的所说多肽;和回收所说的表达多肽。
19.一种含有多肽及药学上可接受载体的药物组合物,所说的多肽包含的氨基酸残基序列与SEQ ID NO2第26-281位残基有至少75%相同,其中所说的序列含有形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中Xaa可为任何氨基酸;及羧基末端球形部分。
20.和所含氨基酸残基序列与SEQ ID NO2第26-281位残基有至少75%相同的多肽的表位能够特异结合的抗体,其中所说序列含有形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中Xaa可为任何氨基酸;和羧基末端球形部分。
21.和所含氨基酸残基序列与SEQ ID NO2第26-281位残基有至少75%相同的多肽的表位能特异结合的结合蛋白质,其中所说的序列含形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中Xaa可为任何氨基酸;和羧基末端球形部分。
22.所编码多肽包含的氨基酸残基序列与SEQ ID NO2第26-281位残基有至少75%相同的分离多核苷酸,其中所说的序列含有形成胶原蛋白结构域的Gly-Xaa-Xaa或Gly-Xaa-Pro重复序列,其中Xaa可为任何氨基酸;和羧基末端球形部分。
23.根据权利要求22的分离多核苷酸,其中所说的多肽在氨基酸序列方面与SEQ ID NO2第26-281位残基有至少90%相同。
24.根据权利要求23的分离多核苷酸,其中所说的多肽在氨基酸序列方面与SEQ ID NO2第22-281位残基有至少90%相同。
25.根据权利要求22的分离多核苷酸,其中所说的多肽含SEQ IDNO2第1-281位残基或SEQ ID NO44第1-281位残基。
26.根据权利要求22的分离多核苷酸,其中所说的多核苷酸是DNA。
27.一种分离的多核苷酸,其选自a)SEQ ID NO1第465-688位核苷酸的序列;b)SEQ ID NO1第688-1016位核苷酸的序列;c)SEQ ID NO1第691-1016位核苷酸的序列;d)SEQ ID NO1第465-1016位核苷酸的序列;e)SEQ ID NO43第364-490位核苷酸的序列;f)SEQ ID NO43第490-912位核苷酸的序列;g)SEQ ID NO43第364-912位核苷酸的序列;h)SEQ ID NO43第364-490位核苷酸的序列;i)编码氨基酸残基序列与SEQ ID NO2第99、140或141位至281位残基有至少75%相同的多肽的多核苷酸;j)编码氨基酸残基序列与SEQ ID NO2第99-140位残基有至少75%相同的多肽的多核苷酸;k)与a)、b)、c)、d)、e)、f)、g)、h)、i)或j)互补的核苷酸序列;和l)与a)、b)、c)、d)、e)、f)、g)、h)、i)、j)或k)的简并核苷酸序列。
28.编码基本上由通过肽键连接的第一部分和第二部分组成的融合蛋白质的分离多核苷酸,所说的第一部分选自a)所含氨基酸残基序列与SEQ ID NO2第26-281位残基有至少75%相同的多肽;b)包含SEQ ID NO2第1、22或26-281位残基所示氨基酸残基序列的多肽;c)包含SEQ ID NO44第1、22或26-281位残基所示氨基酸残基序列的多肽;d)SEQ ID NO2或SEQ ID NO44所示zsig37多肽的含类胶原蛋白结构域或者能二聚体化或多聚体化的类胶原蛋白结构域部分的部分;e)SEQ ID NO2或SEQ ID NO44所示zsig37多肽的含类球形结构域或类球形结构域活性部分的部分;或f)SEQ ID NO2或SEQ ID NO44所示zsig37多肽的包括类胶原蛋白结构域和球形结构域的部分;并且所说的第二部分包括另一多肽。
29.编码融合蛋白的分离多核苷酸,该融合蛋白含有具SEQ ID NO2第1-21或1-25位氨基酸残基序列的分泌信号序列,其中所说的分泌信号序列与附加多肽可操作地连接。
30.含SEQ ID NO23第1-843位核苷酸的序列的分离多核苷酸。
31.含SEQ ID NO23多核苷酸或者其互补序列中至少14个连续核苷酸的寡核苷酸探针或引物。
全文摘要
本发明涉及具有类胶原蛋白结构域和球形结构域的蛋白质家族中成员之一的zsig37的多核苷酸和多肽分子。该多肽及其编码多核苷酸参与二聚体化或寡聚体化,并可用于其研究中。本发明还包括抗zsig37多肽的抗体。
文档编号C12N5/02GK1272883SQ98808911
公开日2000年11月8日 申请日期1998年7月17日 优先权日1997年7月18日
发明者P·O·施帕德 申请人:津莫吉尼蒂克斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1