人HsgⅢ基因的制作方法

文档序号:966091阅读:402来源:国知局
专利名称:人HsgⅢ基因的制作方法
技术领域
本发明涉及新鉴定的多肽、编码这些多肽的多核苷酸和这些多核苷酸和多肽在治疗和可能可以用于治疗的其激动剂、拮抗剂和/或抑制剂化合物的鉴定中的用途以及这些多肽和多核苷酸的生产。
背景技术
寻找药物的方法正经历着根本性的变化,新的方法中包括“功能基因组学”,即基于基因组或基因的高流通量生物学。该方法正在迅速取代原来基于“位置克隆”的方法。首先鉴定表现为生物功能或遗传病的表型,然后根据其遗传图谱位置逆向寻找有关基因。
功能基因组学主要依赖各种生物信息学工具,由现有的多个分子生物学数据库中鉴定可能的目的基因序列。这就需要不断鉴定和表征其他基因及其相关多肽/蛋白质,作为寻找药物的靶。
本发明的肽还包括以下分离的多肽,其氨基酸序列与序列2的整个氨基酸序列的同一性为至少70%,优选同一性为至少80%,更优选同一性为至少90%,更加优选同一性为至少95%,最优选同一性为至少97—99%。这些多肽还包括序列2的多肽。
本发明的多肽还包括由含有序列1的多核苷酸编码的分离多肽。
据信本发明的多肽是分泌粒蛋白多肽家族的成员。它们引起人们的关注是因为人HsgⅢ基因是使用EST测序克隆自正常垂体。该基因与其他生物中的配偶体高度类似,可能在信号传导中起作用,并参与分泌途径。这些特性以下称为“NPCABC08活性”或“NPCABC08多肽活性”或“NPCABC08生物活性”。这些活性还包括所述NPCABC08多肽的抗原和免疫原活性,特别是序列2的多肽的抗原和免疫原活性。优选,本发明的多肽具有至少一种NPCABC08的生物活性。
本发明的多肽可以是“成熟”蛋白的形式,也可以是较大蛋白如融合蛋白的一部分。通常包括附加氨基酸序列较为有利,附加氨基酸序列包括分泌或前导序列,原序列,帮助纯化的序列如聚组氨酸残基,或重组生产过程中有助于稳定的附加序列。
本发明也包括上述多肽的变体,即参照物中保守氨基酸发生置换的多肽,保守置换是指一个残基被具有类似特性的其他氨基酸残基置换。典型的这种置换包括Ala,Val,Leu和IIe之间的置换;Ser和Thr之间的置换;酸性残基Asp和Glu之间的置换;Asn和Gln之间的置换;碱性残基Lys和Arg之间的置换;或芳香族残基Phe和Tyr之间的置换。特别优选的是其中置换、缺失或增加几个、5—10个、1—5个、1—3个、1—2个或1个氨基酸或这些方式的组合的变体。
本发明的多肽可以通过任何合适的方式制备。这些多肽包括分离的天然存在的多肽,重组生产的多肽,合成生产的多肽,或这些方法组合生产的多肽。制备这些多肽的方法在本领域广为人知。
本发明另一方面涉及NPCABC08多核苷酸。这些多核苷酸包括含有以下核苷酸序列的分离多核苷酸,所述核苷酸序列编码的多肽与序列2的整个氨基酸序列的同一性为至少70%,优选同一性为至少80%,更优选同一性为至少90%,更加优选同一性为至少95%。多肽同一性为至少97%是高度优选的,多肽同一性为至少98—99%更高度优选,多肽同一性为至少99%是最优选的。这些多核苷酸包括含有编码序列2的多肽的序列1中的核苷酸序列的多核苷酸。
本发明的多核苷酸还包括含有以下核苷酸序列的分离的多核苷酸,上述核苷酸序列与编码序列2多肽的核苷酸序列整个编码区的同一性为至少70%,优选同一性为至少80%,更优选同一性为至少90%,更加优选同一性为至少95%。同一性为至少97%的多核苷酸是高度优选的,同一性为至少98—99%的多核苷酸更高度优选,同一性为至少99%的多核苷酸是最优选的。
本发明的多核苷酸还包括含有以下核苷酸序列的分离的多核苷酸,上述核苷酸序列与序列1的整个核苷酸序列的同一性为至少70%,优选同一性为至少80%,更优选同一性为至少90%,更加优选同一性为至少95%。同一性为至少97%的多核苷酸是高度优选的,同一性为至少98—99%的多核苷酸更高度优选,同一性为至少99%的多核苷酸是最优选的。这些多核苷酸包括含有序列1的多核苷酸的多核苷酸和序列1的多核苷酸。
本发明也提供上述多核苷酸的互补多核苷酸。
序列1的核苷酸序列与小鼠分泌粒蛋白Ⅲ(SgⅢ)mRNA同源(A.Dopazo,J.Mo1.Neurosei.1993;4225—233)。序列1的核苷酸序列为eDNA序列,含有一个多肽编码序列(核苷酸286—1689),编码序列2的468氨基酸的多肽。编码序列2多肽的核苷酸序列可以与序列1中的多肽编码序列相同,或者不同,而是由于遗传密码的丰余(简并)形成的,但也编码序列2的多肽。序列2的多肽结构上与分泌粒蛋白Ⅲ(SgⅢ)家族的其他蛋白相关,与小鼠分泌粒蛋白Ⅲ(SgⅢ)mRNA具有同源性和/或结构相似性(A.Dopazo,J.Mol.Neurosci.1993;4225—233)。
预期本发明优选的多肽和多核苷酸具有其同源多肽和多核苷酸类似的生物功能/特性。并且,本发明的优选多肽和多核苷酸具有至少一种NPCABC08活性。
本发明的多核苷酸可以通过标准克隆和筛选技术从cDNA文库中获得,该文库使用表达序列标记(EST)分析由正常人垂体细胞的mRNA衍生(Adams,M.K.,et a1.,Science(1991)2521651—1656;Adams,M.D.,eta1.,Nature,(1992)355632—634;Adams,M.D.,et al.,Nature(1995)377Supp3—174)。本发明的多核苷酸也可以来自天然来源如基因组DNA文库,或可以使用众所周知的市售技术合成。
当本发明的多核苷酸用于重组生产本发明的多肽时,该多核苷酸可以包括成熟多肽的编码序列本身;成熟多肽编码序列与其他编码序列框内融合的序列,其他编码序列例如前导或分泌序列、前或原或前原蛋白序列或其他融合肽部分的编码序列。例如可以编码帮助融合多肽纯化的标记序列。在本发明这一方面的一些优选实施方案中,标记序列是6—组氨酸肽或HA标记,前者以pQE载体提供(Qiagen,Inc.),有关论述参见Gentz et al.,Proc Natl Acad Sci USA(1989)86821—824。多核苷酸也可以含有非编码的5′或3′序列,如转录、非翻译序列,剪切和聚腺苷酸化信号,核糖体结合位点和稳定mRNA的序列。
本发明进一步优选的实施方案包括编码多肽变体的多核苷酸,所述变体包括序列2的氨基酸序列(序列2),其中置换、缺失或增加几个、5—10、1—5、1—3、l—2或1个氨基酸残基或是这些方式的组合。
本发明的多核苷酸与序列1的核苷酸序列等同或足够等同,因此可以用作cDNA和基因组DNA的杂交探针或核酸扩增(PCR)反应的引物,以分离编码本发明多肽的全长cDNA和基因组克隆,也可以分离与序列1具有高序列相似性的其他基因(包括编码除人以外的物种的同源物和直向同源物的基因)的cDNA和基因组克隆。一般这些核苷酸序列与参照物序列的同一性为70%、优选同一性为80%,更优选同一性为90%,最优选同一性为95%。探针或引物一般包括至少15个核苷酸,优选至少30个核苷酸,也可以包括至少50个核苷酸。特别优选的探针为30到50个核苷酸。
获得编码本发明多肽的多核苷酸包括除人以外的物种的同源物或直向同源物的方法包括以下步骤用具有序列1或其片段的标记探针在严紧杂交条件下筛选合适的文库;分离含有所述多核苷酸序列的全长cDNA和基因组克隆。这些杂交技术是本领域技术人员熟知的。优选的严紧杂交条件包括在如下溶液中42℃温育过夜,然后在约65℃用0.1×SSC洗涤滤膜,所述溶液包括50%甲酰胺,5×SSC(150mM NaCl,15mM柠檬酸三钠),50mM磷酸钠(pH7.6),5×Denhardt溶液,10%葡聚糖硫酸酯和20μg/ml变性剪切的鲑精DNA。因此,本发明也包括通过用具有序列1或其片段的序列的标记探针在严紧杂交条件下筛选合适的文库获得的多核苷酸。
技术人员可以认识到,在多种情况下,分离的cDNA序列是不完整的,其中编码多肽的区域在cDNA的5′末端被切短。这是由于逆转录酶的作用,该酶本身具有较低的持续合成能力(聚合反应过程中酶保持附着于模板的能力的度量),在第1条cDNA链合成过程中不能获得mRNA模板的完整DNA拷贝。
获得全长cDNA或延长短cDNA的方法现有几种是本领域技术人员熟知的,例如基于cDNA末端快速扩增(RACE)法的方法(参见例如Frohman et al.,PNAS USA 85,8998—9002,1988)。最新的技术改进如MarathonTM技术(Clonteeh Laboratories Inc.)大大简化了长链cDNA的搜寻工作。在MarathonTM技术中,由自选定组织抽提的mRNA制备cDNA,在其两端连接“衔接子”序列。然后使用基因特异性和衔接子特异性的寡核苷酸引物组合进行核酸扩增(PCR),扩增cDNA“缺失”的5′端。使用“嵌套”引物重复PCR反应,所谓嵌套引物是指设计成在扩增产物内退火的引物(通常为在衔接子序列3′下游退火的衔接子特异性引物和在已知基因序列5′上游退火的基因特异性引物)。通过DNA测序分析该反应产物,将该产物直接与现有cDNA连接获得完整序列,或使用新序列信息设计5′引物另外进行全长PCR,从而构建全长cDNA。
本发明的重组多肽可以通过本领域已知的方法由含有表达系统的遗传工程改造的宿主细胞制备。因此,本发明另一方面涉及含有本发明的一个或多个多核苷酸的表达系统,经遗传工程改造含有本发明表达系统的宿主细胞,和通过重组技术生产本发明的多肽。利用衍生自本发明DNA构建体的RNA,无细胞翻译系统可用来生产这些蛋白。
为进行重组生产,宿主细胞可以经遗传工程改造含有本发明多核苷酸的表达系统或其部分。将多核苷酸导入宿主细胞可以通过多种标准实验手册中所述的方法实现,所述实验手册如Davis et al.,《分子生物学基本方法》(1986)和Sambrook et al.,《分子克隆实验室手册》第2版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989)。优选的这些方法包括例如磷酸钙转染、DEAE—葡聚糖介导的转染、转位、微注射、阳离子脂介导的转染、电穿孔、转导、摩擦转化、粒子轰击或感染。
合适宿主的代表性实例包括细菌细胞,如链球菌、葡萄球菌、大肠杆菌、链霉菌和枯草杆菌细胞;真菌细胞,如酵母细胞和曲霉细胞;昆虫细胞,如果蝇S2和草地夜蛾Sf9细胞;动物细胞,如CHO、COS、HeLa、C127、3T3、BHK、HEK 293和Bowes melanoma细胞;以及植物细胞。
可使用多种表达系统,这些表达系统包括染色体、附加体和病毒衍生的系统等,例如衍生自细菌质粒、细菌噬菌体、转座子、酵母附加体、插入元件、酵母染色体元件、病毒的载体,和衍生自上述元件组合的载体,所述病毒包括杆状病毒、乳多空病毒如SV40、痘苗病毒、腺病毒、禽痘病毒、伪狂犬病毒和逆转录病毒,组合载体如衍生自质粒和细菌噬菌体遗传元件、粘粒和噬菌粒的载体。表达系统可以含有调节和启动表达的控制区。一般来说,任何适于在宿主中维持、增殖或表达多核苷酸生成多肽的系统或载体均可使用。合适的核苷酸序列可以通过多种已知的常规技术插入到表达系统中,所述技术可参见例如Sambrook et al.,《分子克隆实验室手册》第2版(同上)。为了翻译的蛋白可以分泌到内质网腔内、周质空间或胞外环境,可以向所需的多肽上加入合适的分泌信号。这些信号可以是多肽内源的,也可以是外源分泌信号。
如果本发明的多肽要表达用于筛选试验,一般优选多肽在细胞表面生成。在这种情况下,细胞可以在用于筛选试验之前收获。如果该多肽分泌到培养基中,可以回收培养基以回收和纯化多肽;如果在细胞内生成,细胞首先要裂解,然后回收多肽。
本发明的多肽可以通过已知方法从重组细胞培养物中回收和纯化,所述方法包括硫酸铵或乙醇沉淀,酸抽提,阴离子或阳离子交换色谱,磷酸纤维素色谱,疏水相互作用色谱,亲和色谱,羟基磷灰石色谱和凝集素色谱。最优选高效液相色谱用于纯化。如果多肽在分离或纯化过程中变性,已知的重折叠蛋白的方法可用于恢复活性构象。
本发明还涉及本发明的多肽作为诊断试剂的应用。检测特征在于与功能障碍相关的序列1多核苷酸的基因的突变形式可以提供一种诊断工具,这可以增加或限定一种由于该基因的表达不足、表达过量或表达异常产生的疾病或疾病易感性的诊断。该基因中携带突变的个体可以通过多种技术在DNA水平上检测出来。
诊断核酸可以获自受试者细胞,如血、尿、唾液、组织活检样品或尸检材料。基因组DNA可以直接用来检测,或在分析之前使用PCR或其他扩增技术酶促扩增。RNA或cDNA可以类似方式使用。缺失和插入可以通过与正常基因型相比扩增产物的大小变化检测。点突变可以通过将扩增DNA与标记的NPCABC08核苷酸序列杂交来鉴别。完全匹配的序列可以通过RNA酶消化或融解温度上的差异与错配双链区分。DNA序列差异也可以通过DNA片段在加入或不加变性剂的凝胶上的电泳迁移率或直接DNA测序来检测(可参见例如Myers et al.,Science(1985)2301242)。在特定位置的序列变化也可以通过核酸酶保护试验如RNA酶和S1保护法或化学切割法来显示(可参见Cotton et al.,PNASUSA(1985)854397—4401)。在另一个实施方案中,可以构建含有NPCABC08核苷酸序列或其片段的寡核苷酸探针阵列(array),以便进行例如基因突变的有效筛选。阵列技术方法广为人知,适用性广泛,可用来解决分子遗传学中的多种问题,包括基因表达,遗传连锁和遗传变异性。(参见例如M.Chee et al.,Science,Vol.274,pp610—613(1996)。
诊断试验通过利用上述方法检测NPCABC08基因的突变,提供了诊断或确定对本发明限定疾病的易感性的方法。此外,这些疾病可以通过以下方法诊断确定来自受试者样品中的多肽或mRNA的水平异常降低或增加。表达降低或增加可以使用核苷酸定量领域已知的任何方法在RNA水平上确定,所述方法例如核酸扩增,包括PCR、RT—PCR、RNA酶保护、RNA印迹和其他杂交方法。可用于确定来自宿主的样品中的蛋白如本发明多肽的水平的试验技术为本领域技术人员所熟知。这些试验方法包括放射免疫试验、竞争结合试验、蛋白印迹分析和ELISA试验。
因此,另一方面,本发明涉及包括以下成分的诊断药盒(a)本发明的多核苷酸,优选序列1的核苷酸序列,或其片段;(b)与(a)中核苷酸互补的核苷酸序列;(c)本发明的多肽,优选序列2的多肽,或其片段;(d)本发明多肽的抗体,优选序列2的多肽的抗体。
应当理解,在这种药盒中,(a),(b),(c)或(d)可以包括一种主要成分(substantial component)。这种药盒可用于诊断疾病或对疾病的易感性,所述疾病特别是癌症、白血病、糖尿病、肾病、自身免疫病等。
本发明的核苷酸序列对染色体鉴定也有价值。该序列可以特异靶向一个个体染色体上的特定位置并可与其杂交。根据本发明染色体相关序列的作图是将这些序列与疾病相关的基因联系起来的重要的第一步。一旦序列已经被定位在具体的染色体位置,该序列在染色体上的物理位置可以与遗传图谱数据联系起来。这些数据可参见例如V.McKusick,《人类的孟德尔遗传》(由Johns Hopkins University Welch Medical Library在线获得)。定位在同一染色体区域的基因和疾病之间的关系可以通过连锁分析(物理相邻基因的共遗传)确定。
受影响和正常个体中cDNA或基因组序列的差异也可以确定。如果在某些或全部受影响个体中观察到某一突变,而在正常个体中未观察到该突变,则该突变可能是疾病的病因。
本发明的多肽或其片段或类似物或表达它们的细胞也可用作免疫原,生成对本发明的多肽免疫特异性的抗体。“免疫特异性的”在本领域中表示对本发明多肽的亲和力明显大于对本领域其他相关多肽的亲和力。
针对本发明的多肽的抗体可以通过常规方法向动物优选非人类的动物给药多肽或含表位片段、类似物或细胞获得。为了制备单克隆抗体,可以使用提供连续细胞系培养物生成的抗体的任何技术。实例包括杂交瘤技术(Kohler,G.and Milstein,C.,Nature(1975)256495—497),三瘤(trioma)技术、人B细胞杂交瘤技术(Kozbor et al.,ImmunologyToday(1983)472)和EBV杂交瘤技术(Co1e et a1.,《单克隆抗体和癌症治疗》,pp77—96,Alan R.Liss,Inc.,1985)。
生产单链抗体的技术如美国专利4,946,778所述的技术也可以改进后用来生产本发明多肽的单链抗体。转基因小鼠或其他有机体包括其他哺乳动物也可以用来表达人源化抗体。
上述抗体也可以用来分离或鉴定表达所述多肽的克隆或纯化亲和色谱技术制备的多肽。
抗本发明多肽的抗体也可以用来治疗本发明限定疾病等。
另一方面,本发明涉及遗传工程改造的含有本发明多肽的可溶性融合蛋白或其片段,和各亚类(IgG,IgM,IgA,IgE)免疫球蛋白重链或轻链恒定区的各个部分。优选的免疫球蛋白是人IgG特别是IgG1的重链恒定区部分,其中融合发生在铰链区。在一个具体实施方案中,可以通过加入可被血凝因子Xa切割的切割序列将Fc部分除去。此外,本发明涉及通过遗传工程制备这些融合蛋白的方法,和其在药物筛选、诊断和治疗中的应用。本发明的另一方面还涉及编码这些融合蛋白的多核苷酸。融合蛋白技术的实例可以参见国际专利申请WO 94/29458和WO94/22914。
本发明的其他方面涉及在哺乳动物中诱导免疫应答的方法,包括用本发明的多肽免疫接种哺乳动物,产生抗体和/或T细胞应答,从而保护该动物免于本发明限定疾病等。本发明的其他方面也涉及在哺乳动物中诱导免疫应答的方法,通过在体内指导多核苷酸表达并编码多肽的载体来给药本发明的多肽,以便诱导免疫应答,生成抗体保护动物免于疾病。
本发明的其他方面涉及免疫原/疫苗制剂(组合物),将其引入哺乳动物宿主时,可诱导针对本发明多肽的免疫应答,其中该组合物含有本发明的多肽或多核苷酸。该疫苗制剂还可以含有合适的载体。因为该多肽在胃中可以被降解,优选通过肠胃外途径给药(包括皮下、肌肉、静脉内、皮内等注射)。适合胃肠外给药的制剂包括含水和不含水的无菌注射液,其中可以含有抗氧化剂、缓冲剂、抑菌剂和使制剂与受者血液等渗的溶质;含水和不含水的无菌悬浮液,其中可以含有悬浮剂或增稠剂。该制剂可以是单剂或多剂容器形式,例如密封安瓿和小瓶,也可以保存在冻干条件下,只需在使用前加入无菌液体载体即可。疫苗制剂也可以含有增强制剂免疫原性的佐剂系统,如水包油系统或本领域已知的其他系统。剂量取决于疫苗的比活性,可以通过常规试验方便地确定。
本发明的多肽与多种生物功能有关,包括多种疾病状态,特别是以上所述本发明限定疾病。因此,有必要设计鉴定刺激或抑制多肽功能的化合物的筛选方法。因而,本发明另一方面提供筛选化合物的方法,以鉴定刺激或抑制多肽功能的化合物。一般来说,激动剂或拮抗剂可以用于以上所述本发明限定疾病的治疗和预防目的。化合物可以从多种来源鉴定,例如细胞、无细胞制备物、化学文库和天然产品混合物。鉴定的这些激动剂、拮抗剂或抑制剂可以是本发明多肽的天然或修饰的底物、配体、受体、酶等;或者是本发明多肽的结构或功能模拟物。可参见Coligan et al.,Current Protocol in Immunology 1(2)Chapter 5(1991)。
筛选试验可以简单地测试候选化合物与多肽、具有该多肽的细胞或细胞膜或其融合蛋白的结合,利用直接或间接与候选化合物结合的标记检测。或者筛选方法包括与标记竞争物的竞争。并且,这些筛选方法可以测试候选化合物是否会产生多肽激活或抑制产生的信号,使用适合于具有多肽的细胞的检测系统。激活抑制剂通常在已知激动剂存在时试验,观察候选化合物存在对激动剂激活的影响。结构活性多肽可以用于筛选反向激动剂或抑制剂的方法中,在不存在激动剂或抑制剂时测定候选化合物是否抑制多肽的激活。另外,筛选试验可以简单地包括以下步骤混合候选化合物与含有本发明多肽的溶液,形成混合物,测定混合物中NPCABC08活性,比较混合物与标准品的NPCABC08活性。如上述由Fc部分和NPCABC08多肽形成的融合蛋白等融合蛋白也可用于高流通量筛选试验,以鉴定本发明多肽的拮抗剂(参见D.Bennett et al.,JMol Recognition,852—58(1995);and K.Johanson et al.,J Biol Chem,270(16)9459—9471(1995))。
本发明的多核苷酸、多肽和多肽的抗体也可以用来设计检测加入的化合物对细胞中mRNA和多肽生成的影响的筛选方法。例如,可以设计ELISA,通过本领域已知的标准方法使用单克隆和多克隆抗体来测定分泌或细胞结合的多肽水平。这可以用来从合适的工程改造的细胞或组织中寻找可以抑制或增加多肽生成的物质(也可以分别称为拮抗剂或激动剂)。
该多肽可以用来鉴定存在的膜结合或可溶受体,使用本领域已知的标准受体结合技术。这些包括但不限于配体结合和交联试验,其中多肽用放射性同位素(如125I)标记,化学修饰(如生物素化),或与适合检测或纯化的肽序列融合,与推测的受体源(细胞、细胞膜、细胞上清、组织提取物、体液)温育。其他方法包括生物物理技术,如表面胞质共振和分光术。这些筛选方法也可以用来鉴定多肽的激动剂和拮抗剂,它们与多肽对存在的受体的结合竞争。进行这些试验的标准方法在本领域是众所周知的。
可能的多肽拮抗剂的实例包括多肽的抗体,或者在某些情况下为与多肽的配体、底物、受体、酶等密切相关的寡核苷酸或蛋白,例如配体、底物、受体、酶等的片段;或者为与本发明的多肽结合但不引发应答的小分子,从而抑制多肽的活性。
因此,本发明另一方面涉及一种筛选药盒,用来鉴定本发明多肽的激动剂、拮抗剂、配体、受体、底物、酶等;或者是降低或增加这些多肽生成的化合物,该药盒包括(a)本发明的多肽;(b)表达本发明多肽的重组细胞;(c)表达本发明多肽的细胞膜;(d)本发明多肽的抗体;其中,多肽优选为序列2的多肽。
应当理解,在这种药盒中,(a),(b),(c)或(d)可以包括一种主要成分。
本领域技术人员很容易意识到,本发明的多肽也可以用于基于结构设计多肽的激动剂、拮抗剂或抑制剂的方法中,包括(a)首先确定多肽的三维结构;(b)推测激动剂、拮抗剂或抑制剂中可能的反应或结合部位的三维结构;(c)合成预期与推测的结合或反应部位结合或反应的候选化合物;(d)测试候选化合物是否确实为激动剂、拮抗剂或抑制剂。应当理解,该过程通常是交互式过程。
另一方面,本发明提供了与NPCABC08多肽活性过高或过低有关的异常症状如癌症、白血病、糖尿病、肾病、自身免疫病的治疗方法。
如果多肽活性过高,可以有几种方法。一种方法包括向受试者给药上述抑制剂化合物(拮抗剂),可选与可药用载体组合,其用量可以抑制多肽的功能,例如通过阻断配体、底物、受体、酶等的结合,或通过抑制第二信号,从而缓解异常症状。另一种方法中给药能够与内源多肽竞争结合配体、底物、酶、受体等的可溶形式的多肽。这种竞争物的典型实例包括NPCABC08多肽的片段。
在另一种方法中,可以使用表达阻断技术抑制编码内源NPCABC08多肽的基因的表达。已知的这种技术包括使用反义序列,可以是内部产生的或单独给药(参见例如O′Connor,J Neurochem(1991)56560,《基因表达反义抑制剂的寡脱氧核苷酸》CRC Press,Boca Raton,FL(1988))。或者可以使用与基因形成三螺旋的寡核苷酸(参见例如Lee,et al.,Nucleic Acid Res(1979)63073;Cooney et al.,Science(1988)241456;Dervan et al.,Scicence(1991)2511360)。可以给药这些寡聚体或在体内表达有关寡聚体。
为了治疗NPCABC08和其活性表达不足的异常症状,有几种方法可以使用。一种方法包括向受试者给药治疗有效量的激活本发明多肽的化合物,即上述激动剂,结合给药可药用的载体,从而缓解异常症状。或者,可以使用基因治疗来实现受试者相关细胞内源生产NPCABC08。例如,本发明的多核苷酸可以如上述经工程改造用复制缺陷型逆转录病毒载体表达。然后分离逆转录病毒表达构建体并导入用逆转录病毒质粒载体转导的包装细胞中,载体中含有编码本发明多肽的RNA,因而包装细胞可以产生含有目的基因的感染性病毒粒子。可以向受试者给药这些生产细胞,以便体内改造细胞并在体内表达多肽。基因治疗的有关论述可参见第20章,“基因治疗和其他基于分子遗传学的治疗方法(及其中的参考文献),《人类分子遗传学》,T Strachanand A P Read,BIOS Scientific Publishers Ltd(1996)。另一种方法是给药治疗有效量的本发明的多肽,结合给药合适的药用载体。
另一方面,本发明提供含有治疗有效量的多肽和可药用载体或赋形剂的药物组合物,所述多肽如本发明多肽的可溶形式,激动剂/拮抗剂肽或小分子化合物。这些载体包括但不限于盐水、缓冲盐水、葡萄糖、水、甘油、乙醇和其组合。本发明还涉及药包和药盒,其中包括一个或多个容器,装有一种或多种本发明的上述组合物成分。本发明的多肽和其他化合物可以单独使用,或与其他化合物如治疗化合物联合使用。
组合物应适于给药途径,例如全身或口服途径。优选的全身给药方式包括注射,一般是静脉内注射。也可使用其他注射途径如皮下、肌肉、或腹膜内途径。全身给药的其他方法包括使用胆酸盐或梭链孢酸或其他表面活性剂等渗透剂经粘膜和经皮给药。此外,如果本发明的多肽或其他化合物可以配制成肠道或胶囊剂,也可以口服给药。这些化合物也可以以软膏、糊剂、凝胶等形式表面和/或局部给药。
所需剂量范围取决于本发明肽或其他化合物的选择、给药途径、制剂性质、受试者症状的性质和主治医师的判断。合适的剂量范围为0.1到1OOμg/kg。鉴于可以获得的化合物有多种,不同的给药途径有不同的效果,所需剂量的变化范围很大是可以预见的。例如,预期口服给药较静脉注射所需剂量大。这些剂量水平的变化可以使用用来优化的标准实验方法调整,这在本领域是众所周知的。
治疗用多肽也可以在受试者体内内源产生,这种治疗形式通常称为“基因治疗”。因此,例如来自受试者的细胞可以用多核苷酸如编码来自体内的多肽的DNA或RNA,利用逆转录病毒质粒载体工程改造。然后将这些细胞引入受试者体内。
多核苷酸和多肽序列构成了有价值的信息源,可以用来鉴定具有类似同源性的其他序列。通过将序列存储在计算机可读介质上,然后利用存储的数据借助众所周知的检索工具如GCC检索序列数据库,使鉴定大为便利。因此,本发明另一方面提供一种计算机可读介质,其上存储有含有序列1的多核苷酸和/或由其编码的多肽序列。
为便于理解本说明书中常用的术语,提供以下定义。
“抗体”在本文中包括单克隆和多克隆抗体、嵌合、单链和人源化抗体以及Fab片段,包括Fab或其他免疫球蛋白表达文库的产物。
“分离的”表示“通过人工”改变其天然状态。如果“分离的”组合物或物质在自然界中存在,则它已经从其原始环境改变或取出或者已经取出并改变。例如,在本文中使用该术语时,在活动物体内存在的多核苷酸或多肽不是“分离的”,但已经与天然状态下共存的物质分开的同样多核苷酸或多肽就是“分离的”。
“多核苷酸”一般指聚核糖核苷酸或聚脱氧核糖核苷酸,可以是未修饰或修饰的RNA或DNA。“多核苷酸”包括但不限于单链和双链DNA,单链和双链区混合的DNA,单链和双链RNA,单链和双链区混合的RNA,含有DNA和RNA的杂合分子,可以是单链或更常见为双链或单链和双链区的混合物。此外,“多核苷酸”还指含有RNA或DNA或RNA和DNA的三链区。术语“多核苷酸”也包括含有一个或多个修饰碱基的DNA或RNA,以及为稳定性或其他原因已对骨架进行修饰的DNA或RNA。“修饰”碱基包括例如三苯甲基化碱基和肌苷等稀有碱基。可以对DNA和RNA进行多种修饰,因此,“多核苷酸”包括自然界中常见的多核苷酸的化学、酶促或代谢修饰形式,以及病毒和细胞特征性的DNA和RNA化学形式。“多核苷酸”也包括相对短的、通常被称为寡核苷酸的多核苷酸。
“多肽”指含有通过肽键或修饰的肽键即肽等排物(peptideisosteres)互相连接的两个或多个氨基酸的任何肽或蛋白。“多肽”既包括短链(通常称为肽)的寡肽或寡聚体,也包括长链(通常称为蛋白)。多肽可能含有20种基因编码的氨基酸之外的氨基酸。“多肽”包括通过翻译后加工等天然方法或本领域已知的化学修饰技术修饰的氨基酸序列。这些修饰在基本教科书和专论以及大量研究论文中叙述详尽。修饰可以发生在多肽的任何部位,包括肽骨架、氨基酸侧链和氨基或羧基末端。在给定多肽的不同位点同类修饰可以以相同或不同的程度存在。并且给定多肽可以含有多种类型的修饰。多肽可以由于遍在蛋白化而分支,也可以为分支或不分支的环状。环状、分支和分支环状多肽可能由于翻译后的天然加工或合成方法产生。修饰包括乙酰化、酰化、ADP—核糖基化、酰胺化、黄素的共价辍合、血红素的共价辍合、核苷酸或核苷酸衍生物的共价辍合、脂或脂衍生物的共价辍合、磷脂酰肌醇的共价辍合、交联、环化、二硫键形成、脱甲基化、共价交联的形成、胱氨酸形成、焦谷氨酸形成、甲酰化、γ羧化、糖基化、GPI锚定物形成、羟化、碘化、甲基化、肉豆蔻酰化、氧化、蛋白水解加工、磷酸化、异戊二酰化、外消旋化、硒酰化(selenoylation)、硫酸化、转运RNA介导的氨基酸加入蛋白质,如精氨酰化和遍在蛋白化(可以参见例如《蛋白质结构和分子特性》第2版,T.E.Creighton,W.H.Freeman andCompany,New York,1993 and Wold,F.,“翻译后蛋白修饰前景与展望”,1—12页,《蛋白的翻译后共价修饰》B.C.Johnson,Ed.,AcademicPress,New York,1983;Seifter et al.,“蛋白修饰和非蛋白辅因子的分析”,Meth Enzymol(1990)182626—646和Rattan et al.,“蛋白质合成翻译后修饰和老化”,Ann NY Acad Sci(1992)66348—62)。
“变体”指不同于参照多核苷酸或多肽但保留了基本特性的多核苷酸或多肽。一般多核苷酸变体的核苷酸序列与参照多核苷酸不同。变体核苷酸序列的变化可能改变或不改变由参照多核苷酸编码的多肽的氨基酸序列。如下所述,核苷酸改变可能导致参照序列编码的多肽中氨基酸的置换、添加、缺失、融合和截短。一般多肽变体的氨基酸序列与参照多肽不同。通常,差异有限,因此参照多肽和变体的序列在总体上是极其近似的,在许多区域是相同的。变体和参照多肽在氨基酸序列上可以有任何组合形式的一个或多个置换、添加、缺失的区别。置换或插入的氨基酸残基可以是或不是遗传密码编码的氨基酸。多核苷酸或多肽的变体可以是天然存在的,如等位变体,或者是非天然存在的。非天然存在的多核苷酸和多肽变体可以通过诱变技术或直接合成制备。
“同一性”在本领域中已知是通过比较序列确定的两个或多个多肽序列或多核苷酸序列之间的关系。在本领域中,“同一性”也表示通过这些序列链之间的匹配确定的多肽或多核苷酸序列之间的序列相关程度。“同一性”和“相似性”可以通过已知方法方便地计算,包括但不限于以下文献中所述方法《计算分子生物学》,Lesk,A.M.,ed.OxfordUniversity Ptess,New York,1988;《计算生物学简介和基因组工程》,Smith D.W.,ed.,Academic Press,New York,1993;《序列数据的计算机分析》第l部分,Griffin A.M.,and Griffin H.G.,eds.,Humana Press,NewJersey,1994;《分子生物学中的序列分析》,von Heinje,G.,AcademicPress,1987;《序列分析引物》,Gribskov,M.and Devereux,J.,eds.,MStockton Press,New York,1991;Carillo,H.,ard Lipman,D.,SIAM J.Applied Math.,481073(1988)。确定同一性的方法被设计成使测试的序列之间匹配最大。而且,确定同一性和相似性的优选方法已被编成可公开获得的计算机程序。确定两个序列之间的同一性和相似性的计算机程序方法包括但不限于GCG程序包(Devereux,J.,et al.,Nucleic AcidsResearch(1984)12(1)387),BLASTP,BLASTN,FASTA(Atschul,S.F.et al.,J Molec Biol(1990)215403)。BLAST X程序可从NCBI或其他来源获得(BLAST手册,A1tschul,S.,et al.,NCBI NLM NIH Bethesda,MD 20894;Altschul,S.,et al.,J.Mol.Biol.215403—4lO(1990)。众所周知的Smith Waterman算法也可以用来确定同一性。
多肽序列比较的优选参数包括1)算法Needleman and Wunsch,J.Mol Biol.48443—453(1970)比较矩阵(Comparison matrix)BLOSSUM62,来自Hentikoff andHentikoff,Proc.Natl.Acad.Sci.USA.8910915—10919(1992)缺口补偿12缺口长度补偿4可以应用这些参数的一个程序是Genetics Computers Group,MadisonWI提供的gap程序。上述参数是肽比较的缺省参数(末端缺口不补偿)。
多核苷酸比较的优选参数包括1)算法Needleman and Wunsch,J.Mol Biol.48443—453(1970)比较矩阵(Comparison matrix)匹配=+10,错配=0缺口补偿50缺口长度补偿3可以获得的程序Genetics Computers Group,Madison WI提供的gap程序。这些是核酸比较的缺省参数。
例如,本发明的多核苷酸序列可以与序列2的参照序列相同,即同一性为100%,或者与参照序列相比包括一定数量的氨基酸改变,因此同一性小于100%。这种改变可以选自至少一个核酸缺失、置换(包括转换和颠换)或插入,其中所述改变可以发生在参照多核苷酸序列的5′或3′末端或两个末端之间的任何位置,分别散在分布在参照序列的核酸之间,或者以一个或多个毗连群散在分布在参照序列中。同一性百分数一定时核酸改变的数量如下确定序列2中的总氨基酸数乘以同一性百分数(除以100),然后将其结果从序列2的总氨基酸数中减除,或者nn≤xn—(xn·y)其中nn为氨基酸改变数量,xn为序列2的总氨基酸数,y值在70%时为0.70,在80%时为0.80,在85%时为O.85,依此类推,其中若xn和y的结果不是整数,则将其四舍五入取最近的整数,再从xn中减除。
例如,本发明的多肽序列可以与序列2的参照序列相同,即同一性为100%,或者与参照序列相比包括一定数量的氨基酸改变,因此同一性小于100%。这种改变可以选自至少一个氨基酸缺失、置换(包括保守和非保守置换)或插入,其中所述改变可以发生在参照多肽序列的氨基或羧基末端或两个末端之间的任何位置,分别散在分布在参照序列的氨基酸之间,或者以一个或多个毗连群散在分布在参照序列中。同一性百分数一定时氨基酸改变的数量如下确定序列2中的总氨基酸数乘以同一性百分数(除以100),然后将其结果从序列2的总氨基酸数中减除,或者na≤xa—(xa·y)其中na为氨基酸改变数量,xa为序列2的总氨基酸数,y值在70%时为0.70,在80%时为0.80,在85%时为0.85,依此类推,其中若xa和y的结果不是整数,则将其四舍五入取最近的整数,再从xa中减除。
“融合蛋白”指由两个通常不相关的融合基因或其片段编码的蛋白。例如,EP—A—0 464公开了含有免疫球蛋白分子恒定区各部分和其他人蛋白或其部分的融合蛋白。在很多情况下,在治疗和诊断中使用免疫球蛋白Fc区作为融合蛋白的一部分较为有利,可以导致改进的药物动力特性(参见例如EP—A 0232 262)。另一方面,在某一些应用中,在融合蛋白表达、检测和纯化后能够切除Fc部分较为理想。
本说明书中所引用的所有出版物,包括但不限于专利和专利申请,全部引作参考,如同每一出版物单独和个别地指明引作参考一样。序列信息序列1TAAAGCTACG CCCTGGCCGC AGTCTCCGCG TCACAGGAAC TTCAGCACCC ACAGGGCGGA 60CAGCGCTCCC CTCTACCTGG AGACTTGACT CCCGCGCGCC CCAACCCTGC TTATCCCTTG120ACCGTCGAGT GTCAGAGATC CTGCAGCCGC CCAGTCCCGG CCCCTCTCCC GCCCCACACC180CACCCTCCTG GCTCTTCCTG TTTTTACTCC TCCTTTTCAT TCATAACAAA AGCTACAGCT240CCAGGAGCCC AGCGCCGGGC TGTGACCCAA GCCGAGCGTG GAAGAATGGG GTTCCTCGGG300ACCGGCACTT GGATTCTGGT GTTAGTGCTC CCGATTCAAG CTTTCCCCAA ACCTGGAGGA360AGCCAAGACA AATCTCTACA TAATAGAGAA TTAAGTGCAG AAAGACCTTT GAATGAACAG420ATTGCTGAAG CAGAAGAAGA CAAGATTAAA AAAACATATC CTCCAGAAAA CAAGCCAGGT480CAGAGCAACT ATTCTTTTGT TGATAACTTG AACCTGCTAA GGGCAATAAC AGAAAAGGAA540AAAATTGAGA AAGAAAGACA ATCTATAAGA AGCTCCCCAC TTGATAATAA GTTGAATGTG600GAAGATGTTG ATTCAACCAA GAATCGAAAA CTGATCGATG ATTATGACTC TACTAAGAGT660GGATTGGATC ATAAATTTCA AGATGATCCA GATGGTCTTC ATCAACTAGA CGGGACTCCT720TTAACCGCTG AAGACATTGT CCATAAAATC GCTGCCAGGA TTTATGAAGA AAATGACAGA780GCCGTGTTTG ACAAGATTGT TTCTAAACTA CTTAATCTCG GCCTTATCAC AGAAAGCCAA840GCACATACAC TGGAAGATGA AGTAGCAGAG GTTTTACAAA AATTAATCTC AAAGGAAGCC900AACAATTATG AGGAGGATCC CAATAAGCCC ACAAGCTGGA CTGAGAATCA GGCTGGAAAA960ATACCAGAGA AAGTGACTCC AATGGCAGCA ATTCAAGATG GTCTTGCTAA GGGAGAAAAC 1020GATGAAACAG TATCTAACAC ATTAACCTTG ACAAATGGCT TGGAAAGGAG AACTAAAACC 1080TACAGTGAAG ACAACTTTAG GGACTTCCAA TATTTCCCAA ATTTCTATGC GCTACTGAAA 1140AGTATTGATT CAGAAAAAGA AGCAAAAGAG AAAGAAACAC TGATTACTAT CATGAAAACA 1200CTGATTGACT TTGTGAAGAT GATGGTGAAA TATGGAACAA TATCTCCAGA AGAAGGTGTT 1260TCCTACCTTG AAAACTTGGA TGAAATGATT GCTCTTCAGA CCAAAAACAA GCTAGAAAAA 1320AATGCTACTG ACAATATAAG CAAGCTTTTC CCAGCACCAT CAGAGAAGAG TCATGAAGAA 1380ACAGACAGTA CCAAGGAAGA AGCAGCTAAG ATGGAAAAGG AATATGGAAG CTTGAAGGAT 1440TCCACAAAAG ATGATAACTC CAACCCAGGA GGAAAGACAG ATGAACCCAA AGGAAAAACA 1500GAAGCCTATT TGGAAGCCAT CAGAAAAAAT ATTGAATGGT TGAAGAAACA TGACAAAAAG 1560GGAAATAAAG AAGATTATGA CCTTTCAAAG ATGAGAGACT TCATCAATAA ACAAGCTGAT 1620GCTTATGTGG AGAAAGGCAT CCTTGACAAG GAAGAAGCCG AGGCCATCAA GCGCATTTAT 1680AGCAGCCTGT AAAAATGGCA AAAGATCCAG GAGTCTTTCA ACTGTTTCAG AAAACATAAT 1740ATAGCTTAAA ACACTTCTAA TTCTGTGATT AAAATTTTTT GACCCAAGGG TTATTAGAAA 1800GTGCTGAATT TACAGTAGTT AACCTTTTAC AAGTGGTTAA AACATAGCTT TCTTCCCGTA 1860AAAACTATCT GAAAGTAAAG TTGTATGTAA GCTGAGATTT TGTATACAGG AATCCTTATT 1920TCCTCATAGN CTTATTATTT TATAATCAGG AATATGTTGC TTTGGAAAAA GCCTCTTAAT 1980GGGCTGACCN TAAAAACTCA ATCCNTCTTC CACTGTC2017序列2Met Gly Phe Leu Gly Thr Gly Thr Trp Ile Leu Val Leu Val Leu Pro1 5 10 15Ile Gln Ala Phe Pro Lys Pro Gly Gly Ser Gln Asp Lys Ser Leu His20 25 30Asn Arg Glu Leu Ser Ala Glu Arg Pro Leu Asn Glu Gln Ile Ala Glu35 40 45Ala Glu Glu Asp Lys Ile Lys Lys Thr Tyr Pro Pro Glu Asn Lys Pro50 55 60Gly Gln Ser Asn Tyr Ser Phe Val Asp Asn Leu Asn Leu Leu Arg Ala65 70 5 80Ile Thr Glu Lys Glu Lys Ile Glu Lys Glu Ars Gln Ser Ile Arg Ser85 90 95Ser Pro Leu Asp Asn Lys Leu Asn Val Glu Asp Val Asp Ser Thr Lys100 105 110Asn Arg Lys Leu Ile Asp Asp Tyr Asp Ser Thr Lys Ser Gly Leu Asp115 120 125His Lys Phe Gln Asp Asp Pro Asp Gly Leu His Gln Leu Asp Gly Thr130 135 140Pro Leu Thr Ala Glu Asp Ile Val His Lys Ile Ala Ala Arg Ile Tyr145 150 155 160Glu Glu Asn Asp Arg Ala Val Phe Asp Lys Ile Val Ser Lys Leu Leu165 170 175Asn Leu Gly Leu Ile Thr Glu Ser Gln Ala His Thr Leu Glu Asp Glu180 185 190Val Ala Glu Val Leu Gln Lys Leu Ile Ser Lys Glu Ala Asn Asn Tyr195 200 205Glu Glu Asp Pro Asn Lys Pro Thr Ser Trp Thr Glu Asn Gln Ala Gly210 215 220Lys Ile Pro Glu Lys Val Thr Pro Met Ala Ala Ile Gln Asp Gly Leu225 230 235 240Ala Lys Gly Glu Asn Asp Glu Thr Val Ser Asn Thr Leu Thr Leu Thr245 250 255Asn G1y Leu Glu Arg Arg Thr Lys Thr Tyr Ser Glu Asp Asn Phe Arg260 265 270Asp Phe Gln Tyr Phe Pro ASn Phe Tyr Ala Leu Leu Lys Ser Ile Asp275 280 285Ser Glu Lys Glu Ala Lys Glu Lys Glu Thr Leu Ile Thr Ile Met Lys290 295 300Thr Leu Ile Asp Phe Val Lys Met Met Val Lys Tyr Gly Thr Ile Ser305 310 315 320Pro Glu Glu Gly Val Ser Tyr Leu Glu Asn Leu Asp Glu Met Ile Ala325 330 335Leu Gln Thr Lys Asn Lys Leu Glu Lys Asn Ala Thr Asp Asn Ile Ser340 345 350Lys Leu Phe Pro Ala Pro Ser Glu Lys Ser His Glu Glu Thr Asp Ser355 360 365Thr Lys Glu Glu Ala Ala Lys Met Glu Lys Glu Tyr Gly Ser Leu Lys370 375 380Asp Ser Thr Lys Asp Asp Asn Ser Asn Pro Gly Gly Lys Thr Asp Glu385 390 395 400Pro Lys Gly Lys Thr Glu Ala Tyr Leu Glu Ala Ile Arg Lys Asn Ile405 410 415Glu Trp Leu Lys Lys His Asp Lys Lys Gly Asn Lys Glu Asp Tyr Asp420 425 430Leu Ser Lys Met Arg Asp Phe Ile Asn Lys Gln Ala Asp Ala Tyr Val435 440 445Glu Lys Gly Ile Leu Asp Lys Glu Glu Ala Glu Ala Ile Lys Arg Ile450 455 460Tyr Ser Ser Leu465
序列表(1)一般信息(ⅰ)申请人上海第二医科大学(ⅱ)发明名称人HSG Ⅲ基因(ⅲ)序列数2(ⅳ)通讯资料(A)联系人 Ratner & Prestia(B)街道 P.O.Box 980(C)城市 Valley Forge(D)州PA(E)国家 USA(F)邮编19482(ⅴ)计算机可读形式(A)介质类型软盘(B)计算机IBM兼容(C)操作系统 DOS(D)软件 FastSEQ for Windows Version 2.0(ⅵ)当前申请资料(A)申请号待定(B)申请日(C)分类号未知(ⅶ)在先申请资料(A)申请号(B)申请日(ⅷ)律师/代理人资料(A)姓名 Prestia, Paul F(B)注册号23,031(C)资料/文档号GP—70526(ⅸ)电讯信息(A)电话610—407—0700(B)传真610—407—0700(C)电传846169
(2) SEQ ID NO:1 资料(ⅰ)序列特征(A)长度2017碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型 cDNA(ⅹⅰ)序列描述 SEQ ID NO1TAAAGCTACG CCCTGCCCGC AGTCTCCGCG TCACAGGAAC TTCAGCACCC ACAGGGCGGA 60CAGCCCTCCC CTCTACCTGG AGACTTGACT CCCCCGCGCC CCAACCCTGC TTATCCCTTG120ACCGTCGAGT GTCAGAGATC CTGCAGCCGC CCAGTCCCGG CCCCTCTCCC GCCCCACACC180CACCCTCCTG GCTCTTCCTG TTTTTACTCC TCCTTTTCAT TCATAACAAA AGCTACAGCT240CCAGGAGCCC AGCGCCGGGC TGTGACCCAA GCCGAGCGTG GAAGAATGGG GTTCCTCGGG300ACCGGCACTT GGATTCTGGT GTTAGTGCTC CCGATTCAAG CTTTCCCCAA ACCTGGAGGA360AGCCAAGACA AATCTCTACA TAATAGAGAA TTAAGTGCAG AAAGACCTTT GAATGAACAG420ATTGCTGAAG CAGAAGAAGA CAAGATTAAA AAAACATATC CTCCAGAAAA CAAGCCAGGT480CAGAGCAACT ATTCTTTTGT TGATAACTTG AACCTGCTAA GGGCAATAAC AGAAAAGGAA540AAAATTGAGA AAGAAAGACA ATCTATAAGA AGCTCCCCAC TTGATAATAA GTTGAATGTG600GAAGATGTTG ATTCAACCAA GAATCGAAAA CTGATCGATG ATTATGACTC TACTAAGAGT660GGATTGGATC ATAAATTTCA AGATGATCCA GATGGTCTTC ATCAACTAGA CGGGACTCCT720TTAACCGCTG AAGACATTGT CCATAAAATC GCTGCCAGGA TTTATGAAGA AAATGACAGA780GCCGTGTTTG ACAAGATTGT TTCTAAACTA CTTAATCTCG GCCTTATCAC AGAAAGCCAA840GCACATACAC TGGAAGATGA AGTAGCAGAG GTTTTACAAA AATTAATCTC AAAGGAAGCC900AACAATTATG AGGAGGATCC CAATAAGCCC ACAAGCTGGA CTGAGAATCA GGCTGGAAAA960ATACCAGAGA AAGTGACTCC AATGGCAGCA ATTCAAGATG GTCTTGCTAA GGGAGAAAAC1020GATGAAACAG TATCTAACAC ATTAACCTTG ACAAATGGCT TGGAAAGGAG AACTAAAACC1080TACAGTGAAG ACAACTTTAG GGACTTCCAA TATTTCCCAA ATTTCTATGC GCTACTGAAA1140AGTATTGATT CAGAAAAAGA AGCAAAAGAG AAAGAAACAC TGATTACTAT CATGAAAACA1200CTGATTGACT TTGTGAAGAT GATGGTGAAA TATGGAACAA TATCTCCAGA AGAAGGTGTT1260TCCTACCTTG AAAACTTGGA TGAAATGATT GCTCTTCAGA CCAAAAACAA GCTAGAAAAA1320AATGCTACTG ACAATATAAG CAAGCTTTTC CCAGCACCAT CAGAGAAGAG TCATGAAGAA1380ACAGACAGTA CCAAGGAAGA AGCAGCTAAG ATGGAAAAGG AATATGGAAG CTTGAAGGAT1440TCCACAAAAG ATGATAACTC CAACCCAGGA GGAAAGACAG ATGAACCCAA AGGAAAAACA1500GAAGCCTATT TGGAAGCCAT CAGAAAAAAT ATTGAATGGT TGAAGAAACA TGACAAAAAG1560GGAAATAAAG AAGATTATGA CCTTTCAAAG ATGAGAGACT TCATCAATAA ACAAGCTGAT1620GCTTATGTGG AGAAAGGCAT CCTTGACAAG GAAGAAGCCG AGGCCATCAA GCGCATTTAT1680AGCAGCCTGT AAAAATGGCA AAAGATCCAG GAGTCTTTCA ACTGTTTCAG AAAACATAAT1740ATAGCTTAAA ACACTTCTAA TTCTGTGATT AAAATTTTTT GACCCAAGGG TTATTAGAAA1800GTGCTGAATT TACAGTAGTT AACCTTTTAC AAGTGGTTAA AACATAGCTT TCTTCCCGTA1860AAAACTATCT GAAAGTAAAG TTGTATGTAA GCTGAGATTT TGTATACAGG AATCCTTATT1920TCCTCATAGN CTTATTATTT TATAATCAGG AATATGTTGC TTTGGAAAAA GCCTCTTAAT1980GGGCTGACCN TAAAAACTCA ATCCNTCTTC CACTGTC 2017(2) SEQ ID NO2资料
(ⅰ)序列特征(A)长度468氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述 SEQ ID NO2Met Gly Phe Leu Gly Thr Gly Thr Trp Ile Leu Val Leu Val Leu Pro1 5 10 15Ile Gln Ala Phe Pro Lys Pro Gly Gly Ser Gln Asp Lys Ser Leu His20 25 30Asn Arg Glu Leu Ser Ala Glu Arg Pro Leu Asn Glu Gln Ile Ala Glu35 40 45Ala Glu Glu Asp Lys Ile Lys Lys Thr Tyr Pro Pro Glu Asn Lys Pro50 55 60Gly Gin Ser Asn Tyr Ser Phe Val Asp Asn Leu Asn Leu Leu Arg Ala65 70 75 80Ile Thr Glu Lys Glu Lys Ile Glu Lys G1u Arg Gln Ser Ile Arg Ser85 90 95Ser Pro Leu Asp Asn Lys Leu ASn Val Glu Asp Val Asp Ser Thr Lys100 105 110Asn Arg Lys Leu Ile Asp Asp Tyr Asp Ser Thr Lys Ser Gly Leu Asp115 120 125His Lys Phe Gln Asp Asp Pro Asp Gly Leu His Gln Leu Asp Gly Thr130 135 140Pro Leu Thr Ala Glu Asp Ile Val His Lys Ile Ala Ala Arg Ile Tyr145 150 155 160Glu Glu Asn Asp Arg Ala Val Phe Asp Lys Ile Val Ser Lys Leu Leu165 170 175Asn Leu Gly Leu Ile Thr Glu Ser Gln Ala His Thr Leu Glu Asp Glu180 185 190Val Ala Glu Val Leu Gln Lys Leu Ile Ser Lys Glu Ala Asn Asn Tyr195 200 205Glu Glu Asp Pro Asn Lys Pro Thr Ser Trp Thr Glu Asn Gln Ala Gly210 215 220Lys Ile Pro Glu Lys Val Thr Pro Met Ala Ala Ile Gln Asp Gly Leu225 230 235 240Ala Lys Gly Glu Asn Asp Glu Thr Val Ser Asn Thr Leu Thr Leu Thr245 250 255ASn Gly Leu Glu Arg Arg Thr Lys Thr Tyr Ser Glu Asp Asn Phe Arg260 265 270Asp Phe Gln Tyr Phe Pro ASn Phe Tyr Ala Leu Leu Lys Ser Ile Asp275 280 285Ser Glu Lys Glu Ala Lys Glu Lys Glu Thr Leu Ile Thr Ile Met Lys290 295 300Thr Leu Ile Asp Phe Val Lys Met Met Val Lys Tyr Gly Thr Ile Ser305 310 315 320Pro Glu Glu Gly Val Ser Tyr Leu Glu Asn Leu Asp Glu Met Ile Ala325 330 335Leu Gln Thr Lys Asn Lys Leu Glu Lys ASn Ala Thr Asp Asn Ile Ser340 345 350Lys Leu Phe Pro Ala Pro Ser Glu Lys Ser His Glu Glu Thr Asp Ser355 360 365Thr Lys Glu Glu Ala Ala Lys Met Glu Lys Glu Tyr Gly Ser Leu Lys370 375 380Asp Ser Thr Lys Asp Asp Asn Ser Asn Pro Gly Gly Lys Thr Asp Glu385 390 395 400Pro Lys Gly Lys Thr Glu Ala Tyr Leu Glu Ala Ile Arg Lys Asn Ile405 410 415Glu Trp Leu Lys Lys His Asp Lys Lys Gly Asn Lys Glu Asp Tyr Asp420 425 430Leu Ser Lys Met Arg Asp Phe Ile Asn Lys Gln Ala Asp Ala Tyr Val435 440 445Glu Lys Gly Ile Leu Asp Lys Glu Glu Ala Glu Ala Ile Lys Arg lle450 455 460Tyr Ser Ser Leu46权利要求
1.一种选自以下多肽的分离的多肽(ⅰ)含有与序列2的整个氨基酸序列的同一性为至少(a)70%(b)80%(c)90%;或(a)95%的氨基酸序列的分离多肽;(ⅱ)含有序列2氨基酸序列的分离多肽;或(ⅲ)其氨基酸序列为序列2的分离多肽.
2.一种选自以下多核苷酸的分离的多核苷酸(ⅰ)分离的多核苷酸,其含有的核苷酸序列编码与序列2的整个氨基酸序列的同一性为至少(a)70%(b)80%(c)90%;或(a)95%的氨基酸序列的多肽;(ⅱ)分离的多核苷酸,其含有与序列2多肽序列的整个编码核苷酸序列的同一性为至少(a)70%(b)80%(c)90%;或(a)95%的核苷酸序列;(ⅲ)分离的多核苷酸,其含有与序列1的整个核苷酸序列的同一性为至少(a)70%(b)80%(c)90%;或(a)95%的核苷酸序列;(ⅳ)分离的多核苷酸,其含有编码序列2多肽的核苷酸序列;(ⅴ)分离的多核苷酸,其为序列1的多核苷酸;或(ⅵ)分离的多核苷酸,其可用具有序列1或其片段的序列的标记探针在严紧杂交条件下筛选合适的文库获得;或与所述分离多核苷酸序列互补的核苷酸序列。
3.权利要求1的多肽的免疫特异性抗体。
4.一种治疗方法,用于治疗(ⅰ)需要权利要求1的多肽活性或表达提高的受试者,包括(a)向受试者给药治疗有效量的所述多肽的激动剂;和/或(b)向受试者提供分离的多核苷酸,其含有编码所述多肽的核苷酸序列,其形式可以实现所述多肽活性的体内产生;或(ⅱ)需要抑制权利要求1的多肽的活性或表达的受试者,包括(a)向受试者给药治疗有效量的所述多肽的拮抗剂;和/或(b)向受试者提供抑制编码所述多肽的核苷酸序列表达的核酸分子;和/或(c)向受试者给药治疗有效量的与所述多肽竞争其配体、底物或受体的多肽。
5.诊断受试者中与权利要求1多肽的表达或活性相关的疾病或疾病的易感性的方法,包括(a)确定受试者基因组中所述多肽的编码核苷酸序列是否存在突变;和/或(b)分析来自所述受试者的样品中是否有所述多肽表达或其表达量。
6.鉴定刺激或抑制权利要求1的多肽功能的化合物的筛选方法,包括选自以下的一种方法(a)利用直接或间接与候选化合物结合的标记测定候选化合物与多肽(或具有该多肽的细胞或细胞膜)或其融合蛋白的结合;(b)在标记竞争物存在时测定候选化合物与多肽(或具有该多肽的细胞或细胞膜)或其融合蛋白的结合;(c)利用对具有多肽的细胞或细胞膜合适的检测系统,确定候选化合物是否产生多肽激活或抑制产生的信号;(d)将候选化合物与含有权利要求1的多肽的溶液混合,形成混合物,测定混合物中的多肽活性,比较混合物与标准品的活性;或(e)利用ELISA试验等测定候选化合物对细胞中所述多肽和编码所述多肽的mRNA的生成的影响。
7.权利要求1的多肽的激动剂或拮抗剂。
8.含有一种多核苷酸的表达系统,该多核苷酸在所述表达系统存在于相容细胞中时能够产生权利要求1的多肽。
9.制备重组宿主细胞的方法,包括用权利要求8的表达系统转化或转染细胞,使得宿主细胞在合适的培养条件下能够生成一种多肽,其含有与序列2的整个氨基酸序列的同一性为至少70%的氨基酸序列。
10.权利要求9的方法制备的重组宿主细胞。
11.权利要求10的重组宿主细胞的膜,其表达一种多肽,所述多肽包括与序列2的整个氨基酸序列的同一性为至少70%的氨基酸序列。
12.生产多肽的方法,包括在足以产生所述多肽的条件下培养权利要求10的宿主细胞,由培养物中回收多肽。
全文摘要
本发明公开了NPCABC08多肽和多核苷酸以及通过重组技术生产该多肽的方法。本发明还公开了在治疗和诊断试验中利用NPCABC08多肽和多核苷酸的方法。
文档编号A61K38/00GK1279716SQ98811405
公开日2001年1月10日 申请日期1998年9月22日 优先权日1998年9月22日
发明者陈家伦, 付刚, 宋怀东 申请人:上海第二医科大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1