环amp效应元件激活蛋白及其相关用途的制作方法

文档序号:3555492阅读:1372来源:国知局
专利名称:环amp效应元件激活蛋白及其相关用途的制作方法
背景技术
环-AMP效应元件结合蛋白质(CREB)、激活转录因子1(ATF1)和cAMP效应元件调节子(CREM)是一亚群近相关蛋白质,属于碱性区域亮氨酸拉链(bZIP)转录因子超家族。它们是由多种细胞外刺激物,诸如激素、生长因子、神经肽和神经递质、钙、低氧和氧化应激,所产生的转录控制的中心调节子。主要通过CREB研究已经充分证明,这些蛋白质的激酶-可诱导结构域(KID)内保守丝氨酸残基的磷酸化导致多种靶基因的转录激活,这些靶基因参与细胞生长调节和分化、代谢、生殖和发育、神经元活性调节和免疫调节。所有这些靶基因都具有保守的顺式作用环-AMP效应元件(CRE),该元件具有TGACGTCA回文序列或者不对称变异,其包括具有核心序列TGAC的CRE半位点(见Mayr B,Montminy M.,Nat RevMol Cell Biol 2001 Aug;2(8)599-609)。
当磷酸化的CREB/CREM/ATF1同-和/或异二聚体通过bZIP结构域结合到CRE位点时发生转录调节,而KID结构域将效应分子诸如265kDCREB结合蛋白CBP或p300和相关Pol II基础转录机器募集至转录起始位点附近。
已有大量研究致力于鉴定将细胞刺激与CREB/CREM/ATF1激活作用相连接的分子。这些激活子的复杂性以对用于CREB磷酸化的激酶的研究为例证进行说明。最初,CREB被当作增加cAMP的细胞外刺激物的唯一转录调节子,cAMP又激活用于CREB磷酸化的蛋白激酶A(PKA)。然而,随后的研究揭示CREB蛋白质也由pp90RSK磷酸化以应答生长因子、由MSK-1磷酸化以应答促分裂原和应激、CAMK II/IV磷酸化以应答Ca++上升以及AKT磷酸化以应答低氧和存活信号。从这些研究来看很显然,在从多种细胞外刺激物产生适当的细胞输出过程中,在细胞中CREB/CRE/ATF1家族蛋白质的活性调节是非常复杂的以保证特异性和敏感性。
此处我们描述了对大量全长人cDNA克隆(代表11,000到15,000种基因转录物)进行基于基因组-水平细胞功能筛选以获得激活CRE-依赖性基因表达的蛋白质。这些数据指出了几种迄今为止仍未鉴定的CRE激活子,包括KIAA0616,一种先前未知功能的基因并且此处已经重命名为CREAP1。申请人还发现2种更加不同的人类蛋白质在结构和活性方面与CREAP1相似,这两种人类蛋白质在此处命名为CREAP2和CREAP3,以及小鼠和果蝇同系物,全部这些蛋白质都是目前为止未知的调节CRE-依赖性基因表达的基因家族的成员。
申请人此处还报导了一个令人惊奇的发现,即CREAP1是其它蛋白质,包括烯醇丙酮酸磷酸羧激酶(PEPCK)、双调蛋白和诸如IL-8和Exodus-1/MIPα的趋化因子的有效诱导物。同样,此处可以认为本发明的CREAP蛋白质能够用作新的药物靶标以治疗与启动子区域内含有CRE位点的基因相关的病理状况,以及治疗与PEPCK、双调蛋白和趋化因子特别是IL-8和Exodus-1/MIPα的异常激活相关的疾病。这些疾病包括但不限于骨关节炎、银屑病、气喘、慢性阻塞性肺病(COPD)、类风湿性关节炎、癌症、病理性血管发生、糖尿病、高血压、慢性痛和其它炎症与自身免疫病以及神经变性疾病诸如阿尔茨海默氏病、帕金森氏病和亨廷顿病。
本发明还提供了鉴定抑制或增强CREAP活性和/或抑制或增强CREAP基因表达的调节子的方法以及此类调节子用于治疗人类和兽类患者中这些疾病的用途。本发明还提供了包含所述调节子的药物组合物。
发明简述本申请涉及此处称为CREAP的蛋白质新家族的发现,这些蛋白质是CRE-依赖性转录的激活子和趋化因子的诱导物。同样,此处可以认为该蛋白质家族的成员是研发新治疗剂的适当靶标以预防、治疗或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活有关的病理状况,这些状况包括但不限于骨关节炎、银屑病、气喘、COPD、类风湿性关节炎、癌症、病理性血管发生、糖尿病、高血压、慢性痛以及其它炎症和自身免疫病。此外,由于CREB功能损失已经表明与学习和神经变性方面的缺陷有关,CREAP蛋白质的激动剂可以用于预防、治疗或缓解神经变性疾病如阿尔茨海默氏病、帕金森氏病和亨廷顿病。因此,一方面本发明涉及鉴定用于预防、治疗或缓解所述疾病的调节子的方法,其包括a)体外、先体外后体内或体内测定候选调节子抑制或增强CREAP蛋白质的活性和/或抑制或增强CREAP蛋白质表达的能力,并且可以进一步包括b)测定所鉴定的CREAP调节子逆转在所述病理状况的体内、先体外后体内或体外模型中和/或对处于所述病理状况的患者的临床研究中所观察到的病理效应的能力。
另一方面,本发明涉及预防、治疗或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的方法,其包括在患者需要时对其施用有效量的CREAP调节子,其中所述调节子例如可抑制或增强任意一种或多种所述CREAP蛋白质的活性或抑制或增强任意一种或多种CREAP蛋白质的表达,其中所述CREAP蛋白质选自CREAP1、CREAP2和CREAP3。
在一个实施方案中,调节子包括任意一种或多种选自反义寡核苷酸、三股螺旋DNA、核酶、RNA适体、siRNA和双链或单链RNA的物质,其中所述物质设计为可抑制CREAP蛋白质的表达。在另一个实施方案中,调节子包括CREAP蛋白质的抗体或其片段,其中所述抗体或其片段能够抑制所述CREAP蛋白质的活性。在本发明的另一个实施方案中,调节子包括CREAP蛋白质的肽模拟物,其中所述肽模拟物能够抑制所述CREAP蛋白质的活性。这里认为此处所述的一种或多种调节子可以同时进行施用。
另一方面,本发明涉及治疗、预防或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的方法,其包括对需要其的患者施用包含有效量CREAP调节子的药物组合物。在一个实施方案中,所述调节子在患者体内抑制或增强CREAP蛋白质的活性或者抑制或增强编码所述蛋白质的基因的表达,其中所述CREAP蛋白质选自CREAP1、CREAP2或CREAP3。在一个实施方案中,调节子包括任意一种或多种选自反义寡核苷酸、三股螺旋DNA、核酶、RNA适体、siRNA和双链或单链RNA的物质,其中所述物质设计为可抑制CREAP蛋白质的表达。在另一个实施方案中,调节子包括CREAP蛋白质或其片段的抗体或肽模拟物,其中所述抗体或肽模拟物能够例如抑制所述CREAP蛋白质的酶活性或其它活性。此处认为一种或多种所述蛋白质的一种或多种调节子可以同时施用。
另一方面,本发明涉及包含一种或多种一定量CREAP调节子以在需要其的患者体内有效治疗、预防或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关病理状况的药物组合物,其中所述调节子能够抑制或增强CREAP蛋白质的活性和/或抑制或增强编码CREAP蛋白质的表达,其中所述CREAP蛋白质选自CREAP1、CREAP2或CREAP3。在另一个实施方案中,调节子包括任意一种或多种选自反义寡核苷酸、三股螺旋DNA、核酶、RNA适体、siRNA和双链或单链RNA的物质,其中所述物质设计为可抑制CREAP的表达。在另一个实施方案中,调节子包括CREAP蛋白质或其片段的抗体或肽模拟物,其中所述抗体或肽模拟物能够例如抑制所述CREAP蛋白质的酶活性或其它活性。
另一方面,本发明涉及包含CREAP蛋白质的药物组合物。
另一方面,本发明涉及治疗、预防或缓解与CRE-依赖性基因表达的异常激活或趋化因子异常激活相关的病理状况的方法,该方法包括对需要其的患者施用包含CREAP蛋白质的药物组合物。
另一方面,本发明涉及诊断患有与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的受试者的方法,这些受试者可能是使用CREAP调节子或外源CREAP蛋白质进行治疗的适当的候选者,诊断方法包括检测来自所述受试者的生物学样品中CREAP蛋白质的水平,其中与对照相比具有异常水平的受试者将是用于治疗的适当候选者。
另一方面,本发明涉及本发明涉及诊断患有与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的受试者的方法,该受试者可能是使用一种或多种CREAP调节子或外源CREAP蛋白质进行治疗的适宜候选者,诊断方法包括测定来自所述受试者的生物学样品中CREAP蛋白质mRNA的水平,其中与对照相比具有异常mRNA水平的受试者将是用于治疗的适当候选者。
另一方面,这里还提供了治疗、预防或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的方法,其包括(a)测定受试者中CREAP mRNA和/或CREAP蛋白质水平和(b)对与对照相比具有异常水平mRNA和/或CREAP蛋白质的受试者施用一定量CREAP调节子或外源CREAP蛋白质以足以治疗、预防或缓解所述病理状况。
本发明另一方面还提供了测定方法和试剂盒,其包括对检测来自患者的生物学样品中编码CREAP蛋白质的多核苷酸的表达或CREAP蛋白质或其片段的水平必要的成分,所述试剂盒包括例如结合CREAP蛋白质或其片段的抗体或肽模拟物,或者与CREAP多核苷酸杂交的多核苷酸探针。在优选的实施方案中,此类试剂盒还包括详细说明了操作过程的使用说明书,通过该操作过程使用试剂盒成分。
本发明还涉及CREAP调节子或外源CREAP蛋白质用于生产治疗、预防或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的药物的用途。优选地是,所述病理状况是自身免疫病或神经变性疾病。在一个实施方案中,所述调节子包括任意一种或多种选自反义寡核苷酸、三股螺旋DNA、核酶、RNA适体、siRNA和双链或单链RNA的物质,其中所述物质设计为可抑制CREAP基因的表达。在另一个实施方案中,所述调节子包括CREAP蛋白质的一种或多种抗体或其片段,其中所述抗体或其片段能够例如抑制CREAP酶活性或其它活性。在另一个实施方案中,所述调节子包括CREAP蛋白质的一种或多种肽模拟物,其中所述模拟物能够例如抑制CREAP酶活性或其它活性。
本发明还涉及用作药物的外源CREAP蛋白质或CREAP蛋白质的调节子。在一个实施方案中,所述调节子包括任意一种或多种选自反义寡核苷酸、三股螺旋DNA、核酶、RNA适体、siRNA和双链或单链RNA的物质,其中所述物质设计为可抑制CREAP的表达。在另一个实施方案中,所述调节子包括一种或多种针对CREAP的抗体或CREAP的肽模拟物或其片段,其中所述抗体、肽模拟物或其片段能够例如抑制CREAP的酶活性或其它活性。在另一个实施方案中,所述调节子包括CREAP蛋白质的一种或多种肽模拟物,其中所述模拟物能够例如抑制CREAP的酶活性或其它活性。
由于迄今为止还没有公开CREAP2和CREAP3的正确多核苷酸序列,此处可以认为本发明还提供了包含分别显示于SEQ ID NO16和SEQID NO25的氨基酸序列的分离的多肽。此外,本发明提供了包括显示于SEQ ID NO16和SEQ ID NO25的氨基酸序列及其片段的分离多肽。根据本发明该方面,这里还提供了人类来源的新多肽以及其生物学、诊断学或治疗学上有用的片段、变体、同系物及衍生物、片段的变体和衍生物和上述物质的类似物。
本发明还可以得到分离的核酸,这些核酸包含编码此处所公开的CREAP蛋白质,具体而言是CREAP2和CREAP3和其同系物和片段和/或等价物的核苷酸序列,或者基本上与具有如SEQ ID NO15和SEQ IDNO24中所显示的核苷酸序列的核酸相似的核酸。在优选的实施方案中,所分离的DNA采用载体分子的形式,其包含至少一部分本发明的DNA,具体而言包含由显示于SEQ ID NO1、SEQ ID NO.15或SEQ ID NO24中的核苷酸序列所组成的DNA。
本发明的另一方面提供了产生上述多肽、多肽片段、变体和衍生物、变体和衍生物的片段,以及上述物质的类似物的方法。在本发明该方面优选的实施方案中提供了产生上述CREAP蛋白质的方法,其包括在足以在宿主细胞中表达所述多肽的条件下培养表达其中整合载体的宿主细胞,该表达载体含有编码此种多核苷酸的外源来源核苷酸序列,从而引起所述多肽的表达,并且任选地回收所表达的多肽。
在本发明该方面优选的实施方案中,提供了产生包含或由显示于SEQID NO2、SEQ ID NO16或SEQ ID NO25的氨基酸序列组成的多肽的方法,该方法包括在足以在宿主细胞中表达所述多肽的条件下培养其中整合表达载体的宿主细胞,该表达载体含有编码包含或由显示于SEQ ID NO2、SEQ ID NO16或SEQ ID NO25的氨基酸序列组成的多肽的外源来源核苷酸序列,从而引起产生所表达的多肽,并且任选地回收所表达的多肽。优选地,在任何此类方法中,外源来源核苷酸序列包含或为显示于SEQ IDNO1中的核苷酸序列、显示于SEQ ID NO15中的核苷酸序列或显示于SEQ ID NO24中的核苷酸序列。根据本发明的另一方面,这里提供了利用上述多肽和多核苷酸的产品、组合物或方法以尤其用于研究、生物学、临床和治疗目的。
另一方面,本发明提供了能够在体外进行繁殖的宿主细胞,优选地为脊椎动物细胞,尤其是哺乳动物细胞,或细菌细胞,这些细胞一旦在培养物中生长则能够产生包括显示于SEQ ID NO2、SEQ ID NO16、SEQ IDNO25中的氨基酸序列或其片段的多肽,其中细胞含有转录控制DNA序列,优选地为除人类CREAP转录控制序列之外的序列,其中转录控制序列控制编码多肽的DNA的转录,该多肽具有根据SEQ ID NO2、SEQ IDNO16、SEQ ID NO25或其片段的氨基酸序列,包括但不限于包含CREAP蛋白质活性部分或片段的氨基酸序列。
另一方面,本发明涉及用于将本发明的核酸导入需要治疗受试者的一种或多种组织的方法,结果为在组织内细胞表达或分泌所述核酸所编码的一种或多种蛋白质。


图1说明CREAP1是高度保守的蛋白质并含有有效转录激活结构域。显示了人CREAP1和预测的小鼠、河豚和果蝇CREAP1相关基因的氨基酸序列。阴影表示相同和高度保守的氨基酸。框内是保守的潜在PKA磷酸化位点。第一条序列代表人、第二条代表小鼠、第三条代表河豚并且第四条代表果蝇。
图2表示对应人和果蝇CREAP蛋白质的全长cDNA的氨基酸序列。使用ClustalW比对氨基酸并且阴影表示保守氨基酸。
发明详述认为此处描述的本发明不限于特定的方法、方案和试剂,因为它们可以改变。也可以理解此处所用的术语是仅为了描述特定实施方案,并且无意以任意方式限制本发明的范围。
除非另外定义,此处使用的全部技术与科学术语与本发明所属领域的普通技术人员所通常理解的意义相同。尽管与此处所述的那些方法和材料相似或相当的任意方法和材料能够用于本发明的实践或测试,现在又描述了优选的方法、设备和材料。为了描述和公开报道于可以与本发明结合使用的出版物中的材料和方法,引用此处所提及的全部出版物作为参考。
实践本发明过程中,使用了许多分子生物学的常规技术。这些技术是众所周知的并说明于例如Current Protocols in Molecular Biology,I、II和III卷,1997(F.M.Ausubel编著);Sambrook等人,1989,MolecularCloningA Laboratory Manual,第二版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.;DNA CloningA Practical Approach,I和II卷,1985(D.N.Glover编著);Oligonucleotide Synthesis,1984(M.L.Gait编著);Nucleic Acid Hybridization,1985,(Hames和Higgins);Transcription and Translation,1984(Hames和Higgins编著);Animal CellCulture,1986(R.I.Freshney编著);Immobilized Cells and Enzymes,1986(IRL Press);Perbal,1984,A Practical Guide to Molecular Cloning;系列,Methods in Enzymology(Academic Press,Inc.);Gene Transfer Vectors forMammalian Cells,1987(J.H.Miller和M.P.Calos编著,Cold SpringHarbor Laboratory);以及Methods in Enzymology 154卷和155卷(Wu和Grossman,和Wu,分别编著)。
缩略语ABIN-2NF-κB激活-2的A20-结合抑制因子ACT1 NFkB-激活蛋白1ANKRD3锚蛋白重复序列结构域蛋白3AP-1 激活蛋白1ARHGEF1 Rho鸟嘌呤核苷酸交换因子(GEF)1ATCC 美国典型培养物保藏中心ATF 激活转录因子BZIP 碱性区亮氨酸拉链C/EBP CCAAT/增强子结合蛋白CAD 组成型活化结构域CAMK Ca++/钙调蛋白依赖蛋白质激酶cAMP 环AMPCBP CREB结合蛋白质CNS 中枢神经系统COPD 慢性阻塞性肺病CR53 假定的转录因子CR53CRE 环AMP效应元件CREB 环AMP效应元件结合蛋白质CREB1 cAMP应答元件结合蛋白质1CRE-BPa cAMP效应元件-结合蛋白质CREM cAMP效应元件调节子ERK 细胞外信号调节激酶EST 表达序列标签HPH2 果蝇蛋白Polyhomeotic(Ph)的人同系物HPH2 人Polycomb同系物2
HTS高通量筛选IBMX 3-异丁基-1-甲基黄嘌呤ICER 可诱导cAMP早期阻遏物IkBα 核因子κ-B激酶α亚基抑制剂IKKIkBα激酶IKKγ IkBα激酶γIL-1 白细胞介素-1IL-8 白细胞介素-8IL-8P-Luc IL-8启动子-报告子驱动萤光素酶表达IL-24 白细胞介素-24KIAA0616 由cDNA克隆KIAA0616预测的假想蛋白KID激酶可诱导结构域MAP3K11促分裂原-活化蛋白激酶激酶激酶11MAP3K12促分裂原-活化蛋白激酶激酶激酶12MEK促分裂原-活化蛋白激酶/ERK激酶MEKK 促分裂原-活化蛋白激酶/ERK激酶激酶-1MSK促分裂原和应激活化蛋白激酶NFAT 激活T细胞核因子NF-IL-6核因子-白细胞介素-6转录因子NF-κB B-细胞中κ轻多肽基因增强子的核因子NPY神经肽YNR2F2 细胞核受体亚家族2,组F,成员2Oct-1 八聚体结合转录因子1Oct-1/C/EBP八聚体结合转录因子1/CCAAT/增强子结合蛋白质PCK1 烯醇丙酮酸磷酸羧激酶IPKA环AMP-依赖蛋白激酶POL II RNA聚合酶IIrelA 网状内皮组织增殖病毒癌基因同系物A,别名NF-κB亚基3、
p65Rho-GEF- p114Rho-特异鸟嘌呤核苷酸交换因子p114RIPK2受体-相互作用丝氨酸-苏氨酸激酶2RLU 相对发光单位RSK 核醣体S6激酶TBP TATA-结合蛋白质TEF1 促甲状腺胚胎因子1TF 转录因子TNFα肿瘤坏死因子-αTRAF6TNF受体相关因子6TSHα促甲状腺激素αVCAM1血管细胞粘附分子-1XboxPX-盒结合蛋白质1如此处和所附权利要求书中所使用,单数形式″一个″、″一种″和″该″包括复数参照,除非上下文另外清楚地指明。因此,例如,“抗体”是本领域技术人员已知的一种或多种抗体及其等价物。另外,CREAP蛋白质或“CREAP”,除非另外指明,包括此处所公开的任意一种或多种CREAP蛋白质,具体而言是此处鉴定的属于CREAP蛋白质家族的任意一种或多种人CREAP1-3多肽。
物质“调节”CREAP蛋白质(例如“CREAP调节子”)的能力包括但不限于物质抑制或增强CREAP蛋白质的活性和/或抑制或增强任意一种或多种所述蛋白质表达的能力。此类调节子包括CREAP活性的激动剂和拮抗剂。此类调节还可能参与实现其它蛋白质与CREAP蛋白质相互作用的能力,所述其它蛋白质为例如相关调节蛋白质或由CREAP所修饰的蛋白质。
如此处所使用,术语“激动剂”,是指可以直接或间接调节多肽(例如CREAP多肽)并增加所述多肽生物学活性的分子(即调节子)。激动剂可以包括蛋白质、核酸、碳水化合物或其他分子。增强蛋白质基因转录或生物化学功能的调节子是分别增加所述蛋白质转录或刺激其生物化学特性或活性的物质。
如此处所所用术语“拮抗剂”或“抑制剂”是指可以直接或间接调节多肽(例如CREAP多肽)并阻断或抑制所述多肽生物学活性的分子(即调节子)。拮抗剂和抑制剂可以包括蛋白质、核酸、碳水化合物或其他分子。抑制蛋白质表达或生物化学功能的调节子是分别降低所述蛋白质基因表达或生物学活性的物质。
如此处所使用“核酸序列”是指寡核苷酸、核苷酸或多核苷酸及其片段或部分,并且也指基因组或合成来源的DNA或RNA,它们可以是单链的或双链的,并代表有义链或反义链。
如此出所使用术语“反义”是指与特定DNA或RNA序列互补的核苷酸序列。术语“反义链”此处用于指与“有义”链互补的核酸链。反义分子可以通过任意方法产生,包括通过将目的基因以反方向连接至允许互补链合成的病毒启动子上进行合成。一旦导入细胞,该转录链结合细胞产生的天然序列形成双链体。然后这些双链体阻断进一步的转录或翻译。命名“负”有时用于指反义链,而“正”有时用于指有义链。
如此处所认为,反义寡核苷酸、三股螺旋DNA、RNA适体、siRNA、核酶和双链或单链RNA设计用于抑制CREAP表达从而根据蛋白质的所选核酸序列设计的抑制分子能够引起内源性CREAP产生特异抑制作用。例如,利用CREAP1核苷酸序列的知识而无需进行过多实验就可以设计反义分子,该反义分子与CREAP mRNA产生最强的杂交作用。同样,能够合成识别目的蛋白质的特定核苷酸序列并将其切割的核酶(Cech.J.Amer.Med Assn.2603030(1988))。设计此类分子用于基因表达靶定抑制的技术是本领域的技术人员众所周知的。
此处公开的CREAP蛋白质包括但不限于人CREAP1、CREAP2和CREAP3多肽,这些多肽的任意及全部形式包括但不限于,来自人类或任意其它物种的部分形式、同系物、同种型、前体形式、全长多肽、包含任意上述蛋白质序列或部分的融合蛋白。目的片段包括但不限于那些包含对于正常CREAP功能特别重要的氨基酸的片段,例如包括氨基酸356-580。CREAP1的序列及其变体可以发现于Genbank登录号NM_025021和AB014516。据申请人的认识,以前还没有公开CREAP2和CREAP3的完整、正确序列;部分序列可以发现于Genbank(CREAP 2登录号XM_117201(DNA)和XP_117201(蛋白质)和CREAP3登录号AK090443(DNA)和BAC03424(蛋白质))。CREAP同系物包括文中所公开的那些,和对于本领域的技术人员显而易见的那些同系物,并且它们包括于本发明的范围之内。也可以认为CREAP蛋白质包括那些分离于天然存在的任意物种来源例如基因组DNA文库和包含表达系统的基因工程宿主细胞的CREAP蛋白质,或者通过化学合成,使用例如自动化肽合成仪或此类方法组合产生的CREAP蛋白质。分离和制备此类多肽的方法在本领域是众所周知的。
如文中所使用的术语“样本”或“生物样本”以其最广泛含义使用。来自受试者的生物样本可以包括血、尿或其他生物材料,使用这些样本可以测定CREAP蛋白质的活性或基因表达。
如文中所使用,术语“抗体”指完整分子及其片段,例如Fa、F(ab′)x2和Fv,它们能够结合表位决定簇。使用完整多肽或者含有作为免疫抗原的目的小肽的片段能够制备结合文中所公开的CREAP多肽的抗体。用于免疫动物的多肽或肽可以来自于RNA的翻译或化学合成,并且如果期望,能够将所述变肽或肽连接于载体蛋白质上。通常使用的与肽化学偶联的载体包括牛血清白蛋白和甲状腺球蛋白。然后偶联的肽用于免疫动物(例如小鼠、大鼠或兔)。
如文中所使用术语“人源化抗体”指其中非抗原结合区域内的氨基酸已经被替换以与人抗体更相似,但仍保留最初结合能力的抗体分子。
肽模拟物是基于能够模拟正常多肽功能的主题多肽的关键残基的知识产生的合成的衍生肽或非肽试剂。肽模拟物能够破坏多肽结合其受体或其他蛋白质并且干扰多肽的正常功能。例如,CREAP模拟物将干扰正常CREAP功能。
“治疗有效量”是足以治疗、预防或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的药物量。
如文中所使用“相关调节蛋白质”和“相关调节多肽”是指参与CREAP蛋白质调节的多肽,通过本领域技术人员使用诸如文中所述的常规方法可以对所述多肽进行鉴定。
“与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况”包括但不限于这些疾病例如骨关节炎、COPD、银屑病、气喘、类风湿性关节炎、癌症、病理性血管发生、糖尿病、高血压、慢性痛和其它炎症与自身免疫病以及神经变性疾病诸如阿尔茨海默氏病、帕金森氏病和亨廷顿病。异常激活可以包括过度激活,例如其中编码CREAP蛋白质的mRNA上调或者这些基因的蛋白质产物在细胞中通过增加绝对量或比活而增强了活性的情况,以及其中CRE-依赖性基因表达下调或异常低的趋化因子激活的情况。
如文中所认为,本发明包括使用文中所公开的CREAP基因和基因产物发现分别诱导或抑制CRE-依赖基因的激动剂和拮抗剂的方法。如文中所使用,“CRE-依赖”基因包括那些依赖于通过CRE-结合蛋白质如CREB1、CREB2、CRE-BPa起作用的环amp效应元件的基因(综述,见Lonze,B.,和Ginty,D.(2002)Neuron 35,605;Muller FU,Neumann J,Schmitz W.,Mol Cell Biochem 2000 Sep;212(1-2)11-7和Mayr B,Montminy M.Nat Rev Mol Cell Biol 2001 Aug;2(8)599-609)。这些基因包括但不限于对代谢控制至关重要的基因,例如PEPCK、解偶联蛋白质-1、神经调节分子,例如甘丙肽和酪氨酸羟化酶,以及包括胰岛素和双调蛋白在内的生长因子。CREAP激活的趋化因子包括IL-8和Exodus1/MIP3α和CRE激活的趋化因子包括MIP-1β(Proffitt等人,1995,Gene 152173-179;和Zhang等人,2002;J.Biol Chem,27719042-19048)。
“受试者”指任意人或非人生物体。
以其最广泛含义,术语“基本上相似”或“相当”,当文中用于指核苷酸序列时,意思是指对应参照核苷酸序列的核苷酸序列,其中相应序列编码与参照核苷酸所编码的多肽具有基本上相同的结构和功能的多肽,例如仅改变不影响多肽功能的氨基酸。所期望的是基本上相似的核苷酸序列编码参照核苷酸序列所编码的多肽。基本上相似核苷酸序列和参照核苷酸序列之间的同一性百分数期望为至少80%,更加期望的为至少85%,优选地为至少90%,更加优选地为至少95%,更加优选地为至少99%。
“基本上相似”于参照核苷酸序列的核苷酸序列与参照核苷酸序列在50℃下在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交,50℃下在2×SSC,0.1%SDS中洗涤,更加期望地是在50℃下在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交,50℃时在1×SSC,0.1%SDS中洗涤,更加期望地是50℃下在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交,50℃下在0.5×SSC,0.1%SDS中洗涤,优选地是50℃下在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mMEDTA中杂交,50℃下在0.1×SSC,0.1%SDS中洗涤,更加优选地是50℃下在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交,65℃下在0.1×SSC,0.1%SDS中洗涤,所述核苷酸序列仍然编码功能性等价基因产物。一般而言,杂交条件可以是高度严格条件或较低高度严格条件。在其中核酸分子是脱氧寡核苷酸(“oligo”)的情况下,高度严格条件可以指例如在37℃(对于14-碱基oligo)、48℃(对于17-碱基oligo)、55℃(对于20-碱基oligo)和60℃(对于23-碱基oligo)下在6×SSC/0.05%焦磷酸钠中洗涤。对于不同组成的核酸此类严格条件的适当范围描述于Krause和Aaronson(1991),Methods in Enzymology,200546-556,此外还有Maniatis等人,上面引用。
“提高的mRNA转录水平”是指在患有与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的个体的适当组织或细胞中从编码本发明的CREAP多肽的天然内源人基因转录的信使RNA与对照水平相比更大的量,具体而言是在未患有此种疾病的受试者相应组织内所发现mRNA的量的至少约2倍,优选地为至少约5倍,更加优选地为至少约10倍,最优选地为至少约100倍。此种上升的mRNA水平最终可以导致与健康个体相比在患有所述疾病的个体内从此种mRNA转录的蛋白质水平增加。
如文中所使用,“宿主细胞”是指含有异源DNA的原核或真核细胞,该异源DNA已经通过任意方法,例如电穿孔、磷酸钙沉淀、显微注射、转化、病毒感染等等导入细胞。
如文中所使用“异源”意思是指“不同天然来源”或代表非天然状态。例如,如果使用来自另一种生物体,特别是来自另一物种的DNA或基因转化宿主细胞,该基因对于宿主细胞是异源的并且对于携带该基因的宿主细胞的子代细胞也是异源的。同样,异源的是指来自并插入到相同天然最初细胞类型的核苷酸序列,但是它以非天然状态存在,例如不同拷贝数,或者在不同调节元件的控制下。
“载体”分子是核酸分子,其中可以插入异源核酸然后能够将该核酸分子导入适当宿主细胞。载体优选地具有一个或多个复制起点,和重组DNA能够插入其中的一个或多个位点。载体通常具有便利方法,通过这些方法能够从那些不含该载体的细胞中将含有该载体的细胞选择出来,例如这些载体编码药物抗性基因。常见载体包括质粒、病毒基因组和(主要在酵母和细菌内)“人工染色体”。
“质粒”文中通常以小写字母p开始,大写字母和/或数字随后进行命名,与本领域技术人员所熟悉的标准命名惯例相一致。文中所公开的起始质粒或者是商业可得的、在无限制基础上公开可得的,或者能够通过众所周知的常规方法、已公开的操作从可获得质粒进行构建。根据本发明能够使用的许多质粒和其他克隆和表达载体是众所周知的并且本领域的那些技术人员很容易获得。而且,技术人员可以容易地构建适用于本发明的任意多种其他质粒。本发明中此类质粒及其他载体的特性、构建和用途对于本公开的技术人员是显而易见的。
术语“分离的”意思是指将物质从其最初的环境(例如如果该物质是天然存在的则指天然环境)除去。例如,存在于活的动物中天然存在多核苷酸或多肽不是分离的,但是与天然系统中一些或全部共同存在的物质分离的相同多核苷酸或多肽是分离的,即使它们随后导入该天然系统中。此类多核苷酸可以是载体的部分和/或此类多核苷酸或多肽可以是组合物的部分,并且仍然是分离的,因为此种载体或组合物不是其天然环境中的部分。
如文中所使用,术语“转录控制序列”是指DNA序列,例如起始密码子序列、增强子序列和启动子序列,转录控制序列诱导、抑制或者以其他方式控制它们有效连接的编码蛋白质的核酸序列的转录。
如文中所使用,“人转录控制序列”是任意那些发现于各自人染色体并通常发现与编码本发明多种CREAP蛋白质的任意一种人基因相关的任意一种转录控制序列。
如文中所使用,“非人转录控制序列”是未发现于人基因组中的任意转录控制序列。
如文中所使用,本发明多肽的“化学衍生物”是本发明的一种多肽,其含有额外的通常不是所述分子部分的化学部分。此化学部分可以改善该分子的可溶性、吸收、生物半寿期等等。该部分可以备选降低分子的毒性,去除或减弱该分子的任何不期望的副作用等。已经例如在Remington′sPharmaceutical Sciences,第16版,Mack Publishing Co.,Easton,Pa.(1980)中公开能够调节此类效应的部分。
本发明基于一个令人惊奇的发现,即先前在公开序列数据库中称为″KIAA0616”且至今未知功能的蛋白质是CRE-激活蛋白质。文中称为CREAP1,除了通常激活CRE-依赖转录之外,该多肽还能够诱导多种疾病相关基因例如趋化因子,酶例如PEPCK和生长因子例如双调蛋白。
另外,对公共数据库的检索表明先前收录而未指出功能的2种cDNA和蛋白质(虽然存在错误且/或仅部分序列)XP 117201和FLJ00364编码具有CREAP1相似活性的蛋白质。如此,本发明包括迄今为止未公开的准确核苷酸序列,如文中详细概括,这些序列编码文中命名为CREAP2和CREAP3的多肽并且这些多肽属于新CREAP蛋白质家族。
因此,本发明提供了包含显示于SEQ ID NO16和SEQ ID NO25中的氨基酸序列的分离的多肽。此外,本发明提供了由显示于SEQ ID NO16和SEQ ID NO25中的氨基酸序列所组成的分离的多肽。例如,此类多肽可以是包含CREAP2或CREAP3的氨基酸序列的融合蛋白质。文中还涉及到包含CREAP1的融合蛋白质。
本发明还包括分离的核酸或核苷酸分子,优选地为DNA分子,具体而言是编码CREAP蛋白质,特别是CREAP2或CREAP3的分子。优选地,本发明分离的核酸分子,优选地DNA分子,编码包含显示于SEQ IDNO16或SEQ ID NO25中的氨基酸序列的多肽。同样优选的是分离的核酸分子,优选地为DNA分子,所述核酸分子编码由显示于SEQ ID NO16或SEQ ID NO25中的氨基酸序列组成的多肽。
本发明还包括(a)载体,其包含CREAP蛋白质,尤其人CREAP1、CREAP2或CREAP3或其部分的核苷酸序列和/或其互补序列(即反义序列);(b)载体分子,优选地为包含转录控制序列的载体分子,尤其是表达载体,其包含任意上述CREAP蛋白质的编码序列,其与指导编码序列表达的调节元件有效连接;和(c)基因工程化宿主细胞,其包含如文中所述载体分子或至少任意上述核苷酸序列的片段,该序列与指导宿主细胞中编码序列表达的调节元件有效连接。如文中所使用,调节元件包括但不限于可诱导和不可诱导型启动子、增强子、操纵基因以及本领域技术人员熟知的驱动和调控表达的其他元件。优选地为,宿主细胞可以是脊椎动物宿主细胞,优选地为哺乳动物宿主细胞,例如人细胞或啮齿类动物的细胞,例如CHO或BHK细胞。同样优选地为宿主细胞可以是细菌宿主细胞,尤其是大肠杆菌(E.coli)细胞特别优选宿主细胞,具体而言是上述类型的细胞,它们能够在体外进行繁殖并且能够培养生长时产生CREAP多肽,具体而言包含或由显示于SEQ ID NOs2、16或25中的氨基酸序列所组成的多肽,其中所述细胞包含不是编码所述多肽的天然内源人基因转录控制序列的至少一种转录控制序列,其中所述一种或多种转录控制序列控制编码所述多肽的DNA的转录。
本发明还包括文中所公开的任意核酸序列的片段。编码CREAP多肽的核酸序列片段可以用作cDNA文库的杂交探针以分离全长基因和分离与CREAP具有相似生物学活性的与CREAP基因具有高度序列相似性的其他基因。该类型探针优选地具有至少约30个碱基并且包含,如约30至约50个碱基、约50至约100个碱基、约100至约200个碱基、或者多于200个碱基。探针还可以用于鉴定对应于全长转录物的cDNA克隆和基因组单个或多个克隆,其中所述的基因组克隆包含包括调节区域和启动子区域、外显子和内含子的完整CREAP基因。筛选的实例包括通过使用已知DNA序列合成寡核苷酸探针以分离CREAP基因编码区。具有与本发明基因序列互补的序列的标记寡核苷酸用于筛选人cDNA、基因组DNA或mRNA文库以确定该探针能够与文库的哪些成员杂交。
除了上面所述的基因序列外,文中公开了此种序列的同系物,优选地鉴定出了果蝇、小鼠和红鳍东方豚(Fugu rubripres)的CREAP蛋白质(见下文实施例)。通过本领域公知的分子生物学技术不用过多地进行实验可以鉴定并容易地分离额外的同系物。此外,在基因组内的其他遗传基因座上可能存在编码与此种基因产物的一个或多个结构域有着广泛同源性的蛋白质的基因。通过相似的技术还可以鉴定出这些基因。
例如,本发明编码CREAP多肽的分离的核苷酸序列可以进行标记并用于筛选从由目的生物体获得的mRNA构建的cDNA文库。当cDNA文库来自于与标记序列所来源的生物体类型不同的生物体时,杂交条件将是较低严格的。备选地,标记的片段可以用于再次使用适当严格条件筛选来自目的生物体的基因组文库。对于本领域技术人员此类低严格条件将是众所周知的,并且将依赖于文库和标记序列所来源的特定生物体进行可预测的改变。关于此类条件的指导参见例如上面引用的Sambrook等人的文献。
另外,通过使用基于目的基因内的氨基酸序列设计的2种简并寡核苷酸引物群进行PCR可以分离先前未知的差别表达的基因型序列。反应的模板可以是通过mRNA反转录获得的cDNA,所述mRNA是从已知或怀疑表达差别表达基因等位基因的人或非人细胞系或组织制备得到的。
PCR产物可以进行亚克隆并测序以保证所扩增的序列代表差别表达基因样核酸序列的序列。然后PCR片段可以用于通过多种方法分离全长cDNA克隆。例如,所扩增的片段可以进行标记并用于筛选噬菌体cDNA文库。备选地,标记的片段可以用于筛选基因组文库。
PCR技术还可以用于分离全长cDNA序列。例如,按照标准程序,可以从适当细胞或组织来源分离RNA。使用对所扩增片段的最5′末端特异的寡核苷酸引物对RNA进行逆转录反应以启动第一链合成。然后使用标准末端转移酶反应用鸟嘌呤对所得到的RNA/DNA杂合体进行“加尾”,可以用RNA酶H消化杂合体,并随后使用多聚-C引物启动第二链的合成。因此,所扩增片段的上游cDNA序列可以容易地进行分离。对于可以使用的克隆策略的综述,参见例如Sambrook等人,1989,如前。
在所鉴定的基因是正常或野生型基因的情况下,该基因可用于分离该基因的突变体等位基因。在已知或怀疑具有遗传基础的过程和失调中此种分离是优选的。突变体等位基因可以从已知或怀疑具有促进与炎症或免疫反应相关疾病症状的基因型的个体分离。然后突变体等位基因和突变体等位基因产物可以用于下面所描述的诊断性测定系统。
例如,通过使用PCR-本领域技术人员众所周知的技术,可以分离突变体基因的cDNA。在这种情况下,通过将oligo-dT寡核苷酸与从已知或怀疑在推测携带突变体等位基因的个体中表达的组织中分离的mRNA杂交,并且通过使用逆转录酶延伸新链可以合成第一条cDNA链。然后使用与正常基因5′末端特异杂交的寡核苷酸合成cDNA的第二链。然后使用这2种引物,通过PCR扩增产物,将产物克隆入适当的载体,并通过本领域技术人员众所周知的方法对其进行DNA序列分析。通过将突变体基因和正常基因的DNA序列进行比较,能够确定负责突变体基因产物功能缺失或改变的突变。
备选地,分别使用DNA或者RNA从怀疑或已知带有突变体等位基因的个体的已知或怀疑表达目的基因的组织中构建并筛选基因组文库或cDNA文库。正常基因或其任何适宜的片段可以被标记并用作探针以鉴定文库中的相应突变体等位基因。然后,通过本领域常规实践的方法将包含此基因的克隆纯化出来并进行如上所述的序列分析。
另外,利用从怀疑或已知带有突变体等位基因的个体的已知或怀疑表达目的基因的组织中分离的DNA或者合成的cDNA构建了表达文库。以该种方式,使用如下所述的标准抗体筛选技术结合针对正常基因产物产生的抗体,可以表达和筛选由推定的突变体组织产生的基因产物。(对于筛选技术见,例如Harlow,E.和Lane著,1988,“AntibodiesA LaboratoryManual”,Cold Spring Harbor Press,Cold Spring Harbor。)在突变导致具有改变功能(例如作为错义突变的结果)的表达基因产物的情况下,一组多克隆抗体可能与突变基因产物交叉反应。通过它们与此类标记抗体的反应所检测到的文库克隆能够进行纯化并如上所述进行序列分析。
本发明包括由显示于任意SEQ ID NO1、15、24、26、28、31序列中的核苷酸序列所编码的那些蛋白质或其片段。
此外,本发明包括代表功能等价基因产物的蛋白质。此种等价差别表达基因产物可以包含在由上述差别表达基因序列所编码的氨基酸序列内的氨基酸残基缺失、添加或替代,但是这导致了沉默变化,从而产生功能等价差别表达基因产物。基于所涉及残基的极性、电荷、可溶性、疏水性、亲水性和/或两亲性的相似性,可以进行氨基酸替代。
例如,非极性(疏水)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和蛋氨酸;极性中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;正电荷(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸;负电荷(酸性)氨基酸包括天冬氨酸和谷氨酸。如文中所使用,“功能等价”可以指能够与上述差别表达基因序列所编码的内源性差别表达基因产物呈现基本上相似的体内或体外活性的蛋白质或多肽。“功能等价”还可以指能够以与内源性差别表达基因产物将采用的方式基本上相似的方式与其他细胞或细胞外分子相互作用的蛋白质或多肽。例如,“功能等价”肽在免疫测定中将能够降低抗体与内源性蛋白质相应肽(即其氨基酸序列进行修饰以获得“功能等价”肽的肽)或内源性蛋白质自身的结合,其中产生了针对内源性蛋白质的相应肽的抗体。等摩尔浓度功能等价肽将减少上述相应肽的结合的至少约5%,优选地在约5%和10%之间,更加优选地在约10%和25%之间,甚至更加优选地在约25%和50%之间,并且最优选地在约40%和50%之间。
此处公开的数据表明特定多肽片段对于CREAP家族蛋白质的活性是关键的。对于CREAP1-3,这些区域特别是保守的氨基末端200个氨基酸和羧基末端100个氨基酸,每个区域作为几个保守的结构域。本发明特别优选的多肽是那些包含对应或包含于进化保守区域内的氨基酸序列,例如每种蛋白质的末端75个氨基酸;例如从氨基酸1-75的区域,更加具体而言是,CREAP1的氨基酸片段1-68、CREAP2的氨基酸片段1-74和CREAP3的氨基酸片段1-66。
因此,这些CREAP肽片段和编码文中所公开的CREAP多肽活性部分的核酸片段,以及包含所述片段的载体也属于本发明的范围之内。如文中所使用,编码CREAP多肽活性部分的核酸片段是指具有比编码CREAP多肽全部氨基酸序列的核苷酸序列更少核苷酸的核苷酸序列,并且该序列编码具有文中所述CREAP蛋白质活性的肽(即具有CREAP蛋白质至少一种生物学活性的肽)。一般而言,编码具有CREAP蛋白质活性的肽的核酸将选自编码成熟蛋白质的碱基。然而,在一些情况下,可以期望从CREAP蛋白质的核酸的前导序列部分选择全部或部分肽。这些核酸还可以包括接头序列、修饰的限制性内切酶位点和用于分子克隆、表达或纯化或具有CREAP蛋白质至少一种生物学活性的重组肽的其他序列。按照常规方法可以获得CREAP肽片段和编码具有CREAP蛋白质活性的肽片段的核酸。
此外,针对这些肽片段的抗体可以如上文所描述进行制备。还可以使用可以增加这些肽片段的肽免疫原性的修饰(例如氨基酸替换)。同样,使用本领域技术人员所熟悉的方法,可以修饰CREAP蛋白质所述多肽以含有信号或前导序列或者偶联至接头或其他序列以容易进行分子操作。
使用本领域众所周知的技术,通过重组DNA技术可以产生本发明的多肽。因此,这里提供了产生本发明多肽的方法,该方法包括在足以在宿主细胞中表达所述多肽的条件下培养其中整合入表达载体的宿主细胞,所述表达载体含有编码包含显示于SEQ ID NO2、16、25、27、29和30,优选地为SEQ ID NO 2、16和25的氨基酸序列的外源来源多核苷酸,从而引起所表达多肽的产生。任选地,所述方法进一步包括回收由所述细胞产生的多肽。在此种方法优选的实施方案中,所述外源来源多核苷酸编码由显示于SEQ ID NO2、16、25、27、29和30的氨基酸序列组成的多肽。优选地,所述外源来源多核苷酸包含显示于SEQ ID NO1、15、24、26、28和31中任意一个的核苷酸序列。
因此,文中描述了通过表达编码各个多肽序列的核酸制备本发明多肽和肽的方法。本领域技术人员众所周知的方法能够用于构建包含蛋白质编码序列和适当转录/翻译控制信号的表达载体。这些方法包括例如体外重组DNA技术、合成技术和体内重组/遗传重组。参见,例如描述于Sambrook等人,1989,上述和Ausubel等人,1989,上述中的技术。备选地,使用例如合成仪可以化学合成能够编码差别表达基因蛋白质序列的RNA。参见例如描述于″Oligonucleotide Synthesis″,1984,Gait,M.J.著,IRL Press,Oxford的技术,该文献在文中整体引用作为参考。
多种宿主-表达载体系统可以用于表达编码本发明序列的差别表达基因。此类宿主-表达系统不仅代表可以产生和随后纯化目的编码序列的运载体,还代表当用适当核苷酸编码序列转化或转染时可以原位呈现本发明差别表达基因蛋白质的细胞。这些表达系统包括但不限于诸如用含有差别表达基因蛋白质编码序列的重组噬菌体DNA、质粒DNA或粘粒DNA表达载体转化的微生物如细菌(例如大肠杆菌、枯草芽孢杆菌(B.subtilis));用含有差别表达基因蛋白质编码序列的重组酵母表达载体转化的酵母(例如酵母属(Saccharomyces)、毕赤酵母属(Pichia));用含有差别表达基因蛋白质编码序列的重组病毒表达载体(例如杆状病毒)感染或转染的昆虫细胞系统;用含有蛋白质编码序列的重组病毒表达载体(例如花椰菜花叶病毒,CaMV;烟草花叶病毒,TMV)感染或用重组载体,包括含有蛋白质编码序列的质粒(例如Ti质粒)转化的植物细胞系统;或者包含含有来自哺乳动物细胞基因组启动子(例如金属硫蛋白启动子)或哺乳动物病毒启动子(例如腺病毒晚期启动子;痘苗病毒7.5K启动子或CMV启动子)的重组表达构建体的哺乳动物细胞系统(例如COS、CHO、BHK、293、3T3)。
由细胞还能够从细胞天然CREAP编码基因进行本发明CREAP蛋白质的表达。此类表达的方法详述于例如美国专利5,641,670;5,733,761;5,968,502和5,994,127,所有专利作为整体在文中特别引用作为参考。已经通过任意一个美国专利5,641,670;5,733,761;5,968,502和5,994,127的方法诱导表达CREAP的细胞能够植入活动物体预期组织内以增加该组织中CREAP的局部浓度。对于例如发生CREB功能缺失的神经变性疾病,此类方法具有治疗意义,并且同样激动剂和/或外源CREAP蛋白质可以用于预防、治疗或缓解所述疾病。
在细菌系统中,取决于进行表达的蛋白质的用途可以对许多表达载体进行有利地选择。例如,当产生大量此种蛋白质时,对于抗体的产生或者筛选肽库,可以期望指导易于纯化的高水平融合蛋白质产物表达的载体。在这方面,可以使用如许多出售商(例如Qiagen、Valencia、CA)所提供的包含六组氨酸标签的融合蛋白质(Sisk et alk,1994J.Virol 68766-775)。此类载体包括但不限于大肠杆菌表达载体pUR278(Ruther等人,1983,EMBO J.21791),其中蛋白质编码序列可以单独连接入载体与lac Z编码区处于读码框内,从而产生融合蛋白质;pIN载体(Inouye和Inouye,1985,Nucleic Acids Res.133101-3109;Van Heeke和Schuster,1989,J.Biol.Chem.2645503-5509)等等。pGEX载体还可以用于表达作为与谷胱甘肽S-转移酶(GST)的融合蛋白质的外源多肽。一般而言,此类融合蛋白质是可溶的并且通过吸附至谷胱甘肽琼脂糖珠子并随后存在游离谷胱甘肽时进行洗脱能够容易地从裂解细胞进行纯化。pGEX载体设计为包含凝血酶或因子Xa蛋白酶切割位点以至于能够从GST部分释放所克隆的靶基因蛋白质。
使用包含缺乏启动子区域的报道基因转录单位的载体能够从任意期望的基因选择启动子区域,所述报道基因转录单位为例如氯霉素乙酰转移酶(“CAT”)、或萤光素酶转录单位,位于用于导入候选启动子片段,即可以包含启动子的片段的单个或多个限制位点的下游。例如,在CAT基因上游限制位点将包含启动子的片段导入载体引起产生CAT活性,通过标准CAT测定法能够检测该活性。适于该目的的载体是众所周知的并且容易获得。2种此类载体是pKK232-8和pCM7。因此,用于本发明多核苷酸表达的启动子不但包括众所周知且易于获得的启动子,还包括使用报道基因通过上述技术可以容易获得的启动子。
适于表达根据本发明的多核苷酸和多肽的已知细菌启动子包括大肠杆菌lacI和lacZ启动子、T3和T7启动子、T5tac启动子、λPR、PL启动子和trp启动子。已知适于该方面的真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、逆转录病毒LTR启动子,例如劳斯肉瘤病毒(Rous sarcoma virus)(“RSV”)的那些启动子、和金属硫蛋白启动子,例如小鼠金属硫蛋白-I启动子。
在昆虫系统中,苜蓿银纹夜蛾核型多角体病毒(Autographa californicanuclear polyhedrosis virus)(AcNPV)是能够用作载体以表达外源基因的几种昆虫系统之一。该病毒生长于草地夜蛾(Spodoptera frugiperda)细胞。编码序列可以单独克隆入病毒非必需区(例如多角体蛋白基因)并置于AcNPV启动子(例如多角体蛋白启动子)控制之下。编码序列的成功插入将导致多角体蛋白基因失活和非封闭重组病毒(即缺乏多角体蛋白基因所编码的蛋白质外壳的病毒)的产生。然后这些重组病毒用于感染草地夜蛾细胞,在其中表达所插入的基因(例如,参见Smith等人,1983,J.Virol.46584;Smith,美国专利号4,215,051)。
在哺乳动物宿主细胞中,可以利用许多基于病毒的表达系统。在腺病毒用作表达载体的情况下,将目的编码序列连接到腺病毒转录/翻译控制复合体中,例如晚期启动子和三联前导序列。然后通过体外或体内重组将这种嵌合基因插入到腺病毒的基因组中。插入到病毒基因组的非必需区(如E1区或E3区)会导致产生有活力的并且能够在感染的宿主细胞内表达目的蛋白质的重组病毒(例如,见Logan和Shenk,1984,Proc.Natl.Acad.Sci.USA 813655-3659)。为了有效翻译所插入的基因编码序列还需要特异的起始信号。这些信号包括ATG起始密码子和邻近的序列。在包括其自身的起始密码子和邻近序列的完整的基因插入到适当的表达载体时的情况下,则可以不需要额外的翻译控制信号。然而,在只有部分基因编码序列被插入的情况下,则必须提供外源的翻译控制信号,包括ATG起始密码子。而且,起始密码子必须与目的编码序列阅读框同相以保证完整插入片段的翻译。这些外源翻译控制信号和起始密码子可以有多种来源,可以是天然的和合成的。通过包含适当的转录增强子元件、转录终止子等可以增强表达的效率(见Bittner等,1987,Methods in Enzymol.153516-544)。其它的常用系统是基于SV40、逆转录病毒或腺伴随病毒的。对适当载体和用于在宿主细胞内表达的启动子的选择是众所周知的过程并且用于载体构建、载体导入宿主和在宿主本身内进行表达的必需技术是本领域的常规技术。通常,重组表达载体会包括复制起点、源于高表达基因的用于指导下游结构序列转录的启动子、和用于在暴露于载体后将包含载体的细胞分离出来的选择标记。
此外,可以选择能够调节所插入序列表达的或者以特异的目的方式修饰和加工基因产物的宿主细胞株。蛋白质产物的此类修饰(例如糖基化)和加工(例如切割)对于蛋白质的功能是重要的。不同的宿主细胞具有用于蛋白质翻译后加工和修饰的特征性的和特异的机制。可以选择适当的细胞系或宿主系统以保证对所表达的外来蛋白质进行正确的修饰和加工。为了实现该目的,可以使用具有对初级转录物进行正确加工、对基因产物进行糖基化和磷酸化的细胞机器的真核宿主细胞。此类哺乳动物宿主细胞包括但不限于CHO、VERO、BHK、HeLa、COS、MDCK、293、3T3、WI38等。
本发明还包括具有CREAP蛋白质活性的重组CREAP肽和肽片段。术语“重组蛋白质”指通过重组技术产生的本发明的蛋白质,其中通常将编码CREAP活性片段的DNA插入到适宜表达载体中,所述表达载体用于转化宿主细胞以产生异源蛋白质。具体而言,具有CREAP蛋白质活性的重组肽片段包括包含CREAP1、2或3的保守的氨基末端200个氨基酸或者羧基末端100个氨基酸的CREAP蛋白质片段。所述的片段包括CREAP1的氨基酸片段1-267和575-650,CREAP2的氨基酸片段1-280和615-693和CREAP3的氨基酸片段1-279和545-619以及上面所讨论的包含人CREAP1-3中氨基酸1-75的区域的片段。
本发明的重组蛋白质还可以包括根据本领域技术人员熟悉的技术可以得到的CREAP和不同多肽的嵌合蛋白或融合蛋白质(见,例如CurrentProtocols in Molecular Biology;Ausubel等著,John Wiley & Sons;1992;PNAS 854879(1988))。
为了长期高产量的产生重组蛋白质,优选稳定表达。例如,可以对稳定表达差别表达的基因蛋白质的细胞系进行工程改造。不是使用包含病毒复制起点的表达载体,而是用适当表达控制元件(例如启动子、增强子、序列、转录终止子、多聚腺苷酸位点等)控制的DNA和选择标记转化宿主细胞。在外来DNA导入之后,将工程改造的细胞在富集培养基中生长1-2天然后转入至选择培养基中。重组质粒中的选择标记赋予抗选择的抗性并且允许细胞稳定整合质粒到其染色体中并且允许细胞生长形成转化灶,将所述的细胞转化灶进行克隆并扩大培养成细胞系。该方法可以有利地用于改造表达差别表达基因蛋白质的细胞系。此类工程改造细胞系对于筛选和评价能够影响所表达蛋白质的内源活性的化合物是特别有用的。
可以使用许多选择系统,包括但不限于单纯疱疹病毒胸苷激酶(Wigler等,1977,Cell 11223)、次黄嘌呤-鸟嘌呤磷酸核糖转移酶(Szybalska和Szybalski,1962,Proc.Natl.Acad.Sci.USA 482026)和腺嘌呤磷酸核糖转移酶(Lowy等,1980,Cell 22817)基因可以分别在tk-、hgprt-或aprt-细胞中采用。还可以使用抗代谢物抗性作为用于赋予氨甲喋呤抗性的dhfr(Wigler等,1980,Natl.Acad.Sci.USA 773567;O′Hare等,1981,Proc.Natl.Acad.Sci.USA 781527)、赋予对霉酚酸抗性的gpt(Mulligan和Berg,1981,Proc.Natl.Acad.Sci.USA 782072)、赋予对氨基糖苷G-418抗性的neo(Colberre-Garapin等,1981,J.Mol.Biol.1501)和赋予对潮霉素抗性的hygro(Santerre等,1984,Gene 30147)选择的基础。
一种备选的融合蛋白质表达系统允许对人细胞系中表达的非变性的融合蛋白质容易地进行纯化(Janknecht等,1991,Proc.Natl.Acad.Sci.USA888972-8976)。在该系统中,目的基因被亚克隆进入痘苗重组质粒中以致于基因的可读框在翻译水平上融合到由6个组氨酸残基组成的氨基末端标签上。将重组痘苗病毒感染的细胞的提取物加到Ni2+氮川乙酸-琼脂糖柱子上并且具有组氨酸标签的蛋白质可以用含咪唑的缓冲液选择性洗脱下来。
当将本发明的蛋白质用作分析系统,如下面所述的那些分析系统中的组分时,本发明的蛋白质可以直接或间接标记以利于检测蛋白质和测试物质之间所形成的复合体。可以使用的多种适宜标记系统的任何一种包括但不限于放射性同位素如125I、当暴露于底物时可以产生可检测量热信号或光的酶标记系统、和荧光标记。
当重组DNA技术用来产生用于此类分析系统的本发明的蛋白质时,可以有利地改造融合蛋白以利于标记、固定化、检测和/或分离。
间接标记包括使用能够特异结合本发明多肽的蛋白质,如标记抗体。此类抗体包括但不限于多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和由Fab表达文库产生的片段。
文中还预期文中公开的CREAP蛋白质是有用的药物靶标,其中所述的药物靶标可用于开发用于治疗与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的治疗剂。此类状况包括但不限于骨关节炎、牛皮癣、气喘、COPD、银屑病、气喘、类风湿关节炎、癌症、病理性血管发生、糖尿病、高血压、慢性疼痛和其它炎症性和自身免疫病以及神经变性疾病,例如阿尔茨海默氏病、帕金森氏病和亨廷顿病。
除了趋化因子外,资料还表明CREAP蛋白质能够诱导其它基因例如PEPCK和双调蛋白。双调蛋白是一种与癌症相关的EGF样生长因子。PEPCK是葡萄糖的合成中一种限制性因子并且同样是糖原异生所需的,通常认为对PEPCK的阻断是治疗糖尿病的治疗方法。同样,文中还预期能够通过本发明的调节子治疗的病理性状况包括与这些蛋白质的异常活性或表达相关的状况。
另一方面,本发明涉及鉴定对于治疗、预防或改善上面讨论的病理状况有用的调节子的方法,所述方法包括a)测定候选调节子体外、先体外后体内(ex vivo)或体内抑制或增强CREAP活性和/或抑制或增强CREAP表达的能力和进一步包括b)测定所鉴定出来的CREAP调节子逆转在所述病理状况的体外、先体外后体内或体内模型中和/或在对具有所述病理状况的患者的临床研究中所观察到的病理影响的能力。
可以用常规的筛选测定法(例如体外、先体外后体内和体内)鉴定能够抑制或增强CREAP蛋白质活性和/或抑制或增强CREAP表达的调节子。通过常规测定方法使用源于受试者的生物样本可以测定受试者体内的CREAP活性和CREAP水平。使用本领域技术人员熟悉的方法包括例如常规Northern分析或商业可得的微阵列也可以确定CREAP的基因表达(例如mRNA水平)。此外,使用ELISA基于抗体的测定法或荧光标记反应测定法可以检测测试化合物对CREAP水平和/或相关调节蛋白质水平的影响。这些技术容易地用于高通量筛选并且是本领域技术人员所熟悉的。
从这些研究中收集到的资料可以用于鉴定对治疗上面所讨论的病理状况具有治疗有效性的那些调节子,例如根据常规的方法在所述病理状况的常规体外或体内模型中和/或在对具有所述病理状况的人的临床试验中对抑制性物质进行进一步测定以便评估所述化合物体内治疗、预防或改善所述病理状况的能力。
通过应用关于CREAP多肽的活性部分的关键信息,本发明使得能够通过采用本领域技术人员熟悉的合理药物设计来研发具有CREAP功能的调节子,例如小分子激动剂或拮抗剂。
另一方面,本发明涉及预防、治疗或改善文中所述病理状况的方法,所述的方法包括对需要其的受试者施用包含有效量CREAP调节子的药物组合物。此类调节子包括针对CREAP多肽或其片段的抗体。在一些特别优选的实施方案中,药物组合物包含对人CREAP多肽或人CREAP多肽的部分具有高度选择性的抗体。针对CREAP蛋白质的抗体能够引起该蛋白质在受试者体内聚集并且因此抑制或降低该蛋白质的活性。此类抗体还可以抑制或降低CREAP活性,例如通过与活性位点直接相互作用或阻止物质接近活性位点实现所述抑制或降低。CREAP抗体还可以通过阻止蛋白质-蛋白质的相互作用而用于抑制CREAP活性,所述的蛋白质-蛋白质相互作用可能参与CREAP蛋白质调节并且对于蛋白质的活性是必需的。根据本领域技术人员熟悉的标准测定方法可以产生和鉴定如文中所述具有抑制活性的抗体。
CREAP抗体还可以用于诊断。例如可以根据常规的方法使用这些抗体以便定量受试者体内的CREAP蛋白质水平;例如提高的水平表明CRE-依赖性基因表达的过度激活(例如在其启动子区域具有CRE的基因的激活)并且可能表明过度激活的程度和相关病理状况的相应的严重程度。因而,不同的CREAP水平可以指示与异常的CRE-依赖性基因表达或趋化因子异常活化相关的病理状况的多种临床形式或严重程度。此种信息对于鉴定患有病理状况的患者的亚群是有用的,其中所述的病理状况可能应答或不应答用CREAP调节子进行的治疗。
文中还预期监测CREAP水平或活性和/或检测CREAP表达(mRNA水平)可以用作临床试验过程的一部分,例如以确定给定治疗方案的功效。例如,对已经施用药物的患者进行评估并且临床医生可以鉴定出CREAP水平、活性和/或表达水平高于期望值的那些患者(即水平高于或低于没有经历相关疾病状态的对照患者或者通过临床干预疾病状态已充分缓和的患者的水平)。基于这些资料,医生于是调整剂量、施用方案或所开药物的类型。
对于优化患者治疗所考虑的因素包括所治疗的具体状况、所治疗的具体哺乳动物、各个患者的临床状况、活性化合物的递送部位、活性化合物的具体类型、施用方法、施用的时间安排和开业医生已知的其它因素。欲施用的活性化合物的治疗有效量可以通过此种考虑进行控制并且是治疗特定病理状况所需要的最小量。
由于CREAP基因家族包含高度保守的关键区,所以可以预计CREAP蛋白质的肽模拟物可以用作CREAP调节子。所以,本发明的一个实施方案是从能够阻断CREAP功能的CREAP家族蛋白质衍生的或者设计的肽。可以预计这些肽模拟物能够阻断所有高度相关的CREAP蛋白质的功能。根据常规方法基于对多肽中CREAP蛋白质活性所需的区域的理解可以制造出适宜的肽模拟物。简言之,通过常规的结构功能研究如对野生型蛋白质的缺失或突变分析可以鉴定出蛋白质中的短氨基酸序列。一旦鉴定出关键的区域,可以预期如果它们对应着蛋白质的高度保守部分则该区域会负责关键的功能(例如蛋白质-蛋白质相互作用)。设计成看上去像所述关键区的小的合成肽模拟物预计能够与完整的蛋白质竞争并且因此而干扰该蛋白质的功能。合成的氨基酸序列可以由与该区域全部或部分匹配的氨基酸组成。此类氨基酸可以用类似原先的氨基酸的但是能赋予更好的药理学特性如更高的抑制活性、稳定性、半衰期或生物利用率的其它化学结构代替。
针对CREAP蛋白质或相关调节蛋白质的适宜抗体可以从商业来源得到或者根据常规的方法产生。例如文中所述的是用于产生能够特异识别一种或多种差别表达基因表位的抗体的方法。此类抗体可以包括但不限于多克隆抗体、单克隆抗体(mAb)、人源化或嵌合抗体、单链抗体、Fab片段、F(ab′)2片段、由Fab表达文库产生的片段、抗独特型(anti-Id)抗体、和上面抗体任意一种的表位结合片段。
为了产生针对文中所讨论的CREAP多肽的抗体,通过注射多肽或其部分对多种宿主动物进行免疫。此类宿主动物包括但不限于兔、小鼠和大鼠。可以使用多种佐剂以增强免疫反应,这取决于宿主物种,佐剂包括但不限于弗氏佐剂(完全佐剂和不完全佐剂)、矿物凝胶例如氢氧化铝、表面活性物质例如溶血卵磷脂、多聚醇、聚阴离子、肽、油乳化液、匙孔血蓝蛋白、二硝基苯酚和潜在有用的人类佐剂例如BCG(卡介苗)和短小棒状杆菌(Corynebacterium parvum)。
多克隆抗体是来源于用抗原如靶基因产物或抗原的抗原功能衍生物免疫的动物血清的抗体分子的异质群体。为了产生多克隆抗体,通过注射添加有上述佐剂的多肽或其部分对如上述的宿主动物进行免疫。
单克隆抗体是针对特定抗原的同质抗体群体,它们可以通过任何用于由培养的连续细胞系产生抗体分子的技术得到。所述的技术包括但不限于Kohler和Milstein的杂交瘤技术(1975,Nature 256495-497;和美国专利号4,376,110)、人B-细胞杂交瘤技术(Kosbor等,1983,ImmunologyToday 472;Cole等,1983,Proc.Natl.Acad.Sci.USA 802026-2030)和EBV-杂交瘤技术(Cole等,1985,Monoclonal Antibodies And CancerTherapy,Alan R.Liss,Inc.,第77-96页)。此类抗体可以是包括IgG、IgM、IgE、IgA、IgD在内的任何免疫球蛋白类型和其任何亚类。对产生本发明mAb的杂交瘤可以进行体外或体内培养。高效价mAb的体内生产使得其成为目前优选的生产方法。
此外,可以使用为了通过将具有适当抗原特异性的小鼠抗体分子的基因和具有适当生物学活性的人抗体分子的基因拼接起来产生“嵌合抗体”而开发的技术(Morrison等,1984,Proc.Natl.Acad.Sci.,816851-6855;Neuberger等,1984,Nature,312604-608;Takeda等,1985,Nature,314452-454)。嵌合抗体是这样一种分子,其中不同的部分来源于不同的动物物种,例如具有来源于小鼠的mAb的可变区或高变区和人免疫球蛋白恒定区的嵌合抗体。
备选地,可以用产生单链抗体的技术(美国专利号4,946,778;Bird,1988,Science 242423-426;Huston等,1988,Proc.Natl.Acad.Sci.USA855879-5883;和Ward等,1989,Nature 334544-546)以便产生差别表达基因-单链抗体。通过将Fv区的重链和轻链片段借助于氨基酸桥进行连接导致单链多肽而形成单链抗体。
最优选地,可以用产生“人源化抗体”的技术产生针对文中公开的多肽、片段、衍生物和功能等价物的抗体。此类技术公开于美国专利号5,932,448;5,693,762;5,693,761;5,585,089;5,530,101;5,910,771;5,569,825;5,625,126;5,633,425;5,789,650;5,545,580;5,661,016和5,770,429,其全部公开全文引用作为参考。
能够识别特异表位的抗体片段可以通过已知的技术来产生。例如此类片段包括但不限于通过胃蛋白酶对抗体分子进行消化而产生的F(ab′)2片段和通过F(ab′)2片段二硫键的还原而产生的Fab片段。备选地,可以构建Fab表达文库(Huse等,1989,Science,2461275-1281)以便允许快速并容易地鉴定具有目的特异性的单克隆Fab片段。
文中所述的抗体检测可以通过使用标准ELISA、FACS分析和体外或体内标准的成像技术来实现。通过将抗体偶联(即物理性连接)到可检测物质有利于检测。可检测物质的实例包括多种酶、辅基、荧光物质、发光物质、生物发光物质和放射性物质。适宜酶的实例包括辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶或者乙酰胆碱酯酶;适宜辅基复合体的实例包括链霉亲和素/生物素和抗生物素蛋白/生物素;适宜荧光物质的实例包括伞形酮、萤光素、异硫氰酸荧光素、罗丹明、二氯三嗪基胺荧光素、丹磺酰氯、或藻红蛋白;发光物质的实例包括鲁米诺;生物发光物质的实例包括萤光素酶、萤光素和水母发光蛋白,适宜放射性物质的实例包括125I、131I、35S或3H。
为了便于检测,特别优选的是三明治测定法,其中存在多种变化形式,全部的测定法都包括在本发明的之内。例如,在典型的正向测定法中,未标记的抗体固定在固体基质上并且将待测试的样本与结合的分子接触。在足以允许抗体-抗原二元复合体形成的适当孵育阶段后,加入用能够诱导检测信号的报道分子标记的二级抗体并进行孵育一定时间使得足以形成抗体-抗原-标记抗体三元复合体。然后将任何未反应的物质洗掉并且抗原的存在可以通过观察信号进行确定或者通过与包含已知量抗原的对照样本进行比较来定量。正向测定法的变化形式包括同时测定法,其中样本和抗体同时加入到结合的抗体的,或者反向测定法,其中标记的抗体和欲进行测试样本先混合、孵育并加入到未标记的表面结合抗体。这些技术是本领域技术人员众所周知的并且技术的微小变化也是显而易见的。如文中所使用,“三明治测定法”旨在包括基本双位点(two-site)技术的所有变化形式。对于本发明的免疫测定法,唯一的限制因素是标记的抗体是CREAP多肽或相关调节蛋白质或其片段的特异抗体。
最常用的报道分子可以是酶、包含荧光团或放射性核素的分子。对于酶免疫测定法,通常通过戊二醛或高碘酸盐将酶连接到二级抗体上。然而,正如能够容易地认识到的,存在本领域技术人员众所周知的多种不同连接技术。通常使用的酶包括辣根过氧化物酶、葡萄糖氧化酶、β-半乳糖苷酶和碱性磷酸酶。通常选择与特定酶使用的底物用来在被相应的酶水解时产生可检测的颜色变化。例如,对硝基苯基磷酸酯适宜用于碱性磷酸酶缀合物;对于过氧化物酶缀合物通常使用1,2-苯二胺或甲苯胺。采用荧光底物也是可能的,其中得到荧光产物而不是上面提到的显色底物。然后将含有适当底物的溶液加入到三元复合体中。底物与连接到二级抗体上的酶进行反应,给出了定量的可见信号,所述的可见信号可以进一步定量(通常通过分光光度计测量)以评估血清样本中存在的目的多肽或多肽片段的量。
备选地,可以将荧光化合物如荧光素和罗丹明通过化学方法偶联到抗体上而不改变其结合能力。当通过使用特定波长的光照射激活时,荧光染料-标记的抗体吸收光能,诱导分子内的可激发状态,随后发出特征性较长波长的光。发射光呈现使用光学显微镜通过视觉可检测的特征性颜色。免疫荧光和EIA技术都是本领域内完善建立的并且对于本发明的方法是特别优选的。然而,还可以使用其他报道分子例如放射性同位素、化学发光分子或生物发光分子。如何改变操作以适应所要求的用途对于技术人员将是显而易见的。
在另一个实施方案中,可通过基因治疗将包含编码CREAP蛋白质或其功能性衍生物的序列的核酸施用以进行治疗。基因治疗是指通过将核酸施用于受试者进行治疗。在本发明的这个实施方案中,核酸产生其编码蛋白质,该蛋白质通过促进正常CRE-依赖性基因表达或趋化因子正常激活介导治疗效果。
根据本发明能够使用用于本领域可得到的基因治疗的任意方法。下面描述了代表性方法。
在优选的方面,治疗包含CREAP核酸,该核酸是在适当宿主细胞中表达CREAP蛋白质或其片段或嵌合蛋白质的表达载体的一部分。具体而言,此种核酸具有可能连接至CREAP编码区的启动子,所述启动子是可诱导的或组成型的,并且,任选地是组织特异性的。在另一个具体实施方案中,使用核酸分子,其中CREAP编码序列和任意其它预期序列的侧翼为促进基因组内预期位点上同源重组的区域,从而提供CREAP核酸的染色体内表达(Koller和Smithies,1989,Proc.Natl.Acad.Sci.USA868932-8935;Zijlstra等,1989,Nature 342435-438)。
将核酸递送入患者可以是直接的,在这种情况下患者直接暴露于核酸或核酸运送载体,或者是间接的,在这种情况下首先在体外用核酸转化细胞,然后将细胞移植入患者。这两种方法分别是已知的体内或先体外后体内基因疗法。
在特定实施方案中,核酸直接在体内进行施用,其中该核酸表达产生所编码的产物。这能够通过本领域已知的众多方法中的任意一种实现,例如通过将其构建为适当核酸表达载体的一部分并将其施用使其成为细胞内部分,例如通过使用有缺陷或减毒的逆转录病毒或其他病毒载体感染(参见,例如美国专利号4,980,286和其它下文所提及的方法),或者通过直接注射裸露DNA,或者通过使用微粒轰击(例如基因枪;Biolistic,Dupont),或者用类脂或细胞表面受体或转染试剂包被,包囊于脂质体、微粒或微囊,或者通过将其与已知进入细胞核的肽连接施用,通过将其与受到受体介导的内吞的配体连接施用(参见例如美国专利5,166,320;5,728,399;5,874,297和6,030,954,所有这些专利在文中全文引用作为参考)(这能够用于靶向特异表达受体的细胞类型)等等。在另一个实施方案中,形成了核酸-配体复合体,其中配体包含病毒融合肽以破坏内体,允许核酸避免溶酶体的降解。在另一个实施方案中,通过靶向特异的受体可以将核酸在体内进行靶向用于细胞的特异摄取和表达(见,例如PCT公开WO92/06180;WO92/22635;WO92/20316;WO93/14188和WO93/20221)。备选地,通过同源重组可以将核酸进行细胞内导入并整合进入宿主细胞DNA以便表达(见,例如美国专利5,413,923;5,416,260和5,574,205;和Zijlstra等,1989,Nature342435-438)。
在特定实施方案中,使用了包含CREAP核酸的病毒载体。例如可以使用逆转录病毒载体(见,例如美国专利5,219,740;5,604,090;和5,834,182)。这些逆转录病毒经修饰缺失了对于病毒基因组包装和整合入宿主细胞DNA不需要的逆转录病毒序列。将欲在基因治疗中使用的CREAP核酸克隆到载体中,其利于基因递送入患者。
腺病毒是能够在基因治疗中使用的其它病毒载体。腺病毒对于递送基因到呼吸上皮是特别有吸引力的运载工具。腺病毒天然感染呼吸上皮导致产生轻微疾病。基于腺病毒的递送系统的其它靶标是肝脏、中枢神经系统、内皮细胞和肌肉。腺病毒具有能够感染非分裂细胞的优点。进行基于腺病毒的基因治疗的方法描述于例如美国专利5,824,544;5,868,040;5,871,722;5,880,102;5,882,877;5,885,808;5,932,210;5,981,225;5,994,106;5,994,132;5,994,134;6,001,557和6,033,8843,所有这些在文中全文引用作为参考。
也已经提出在基因治疗中使用腺伴随病毒(AAV)。产生和利用AAV的方法描述于例如美国专利5,173,414;5,252,479;5,552,311;5,658,785;5,763,416;5,773,289;5,843,742;5,869,040;5,942,496和5,948,675,全部这些在文中全文引用作为参考。
基因治疗的另一种方法涉及通过如电穿孔、脂转染、磷酸钙介导的转染或病毒感染的方法将基因转移进入组织培养中的细胞。通常,转移方法包括将选择标记转移入细胞。然后将细胞置于选择的条件下以便分离那些已经摄取并且正在表达所转移基因的那些细胞。然后将那些细胞递送给患者。在该实施方案中,在将所得的重组细胞进行体内使用之前已经将核酸导入了细胞。此种导入可以通过本领域已知的任意方法进行,所述的方法包括但不限于转染、电穿孔、微注射、用包含核酸序列的病毒或噬菌体载体进行感染、细胞融合、染色体介导的基因转移、微细胞介导的基因转移、原生质球融合等等。多种技术是本领域已知的用于将外来基因导入细胞并且可以按照本发明使用,其前提条件是受体细胞必需的发育和生理功能不被破坏。所述技术应该提供将核酸稳定转移入细胞,以致于核酸可由细胞表达并且优选地可由其细胞子代遗传和表达。
通过本领域已知的方法可以将所得重组细胞递送给患者。在优选的实施方案中用上皮细胞进行注射例如皮下注射。在另一个实施方案中,重组皮肤细胞作为皮肤移植物应用于患者。重组的血细胞(例如造血干细胞或祖细胞)优选地静脉内施用。预想的所用细胞量取决于预期的效果、患者状况等等并且可以由本领域技术人员确定。
为了基因治疗的目的能够将核酸导入的细胞包括任何希望的可得的细胞类型,并且包括但不限于上皮细胞、内皮细胞、角质形成细胞、成纤维细胞、肌细胞、肝细胞;血细胞如T淋巴细胞、B淋巴细胞、单核细胞、巨噬细胞、嗜中性粒细胞、嗜酸性粒细胞、巨核细胞、粒细胞;多种干细胞或祖细胞,尤其造血干细胞或祖细胞,例如从骨髓、脐带血、外周血、胎肝中得到的那些干细胞或祖细胞。
在优选的实施方案中,用于基因治疗的细胞是患者自体的。
在重组细胞用于基因治疗的实施方案中,将CREAP核酸导入细胞以致于CREAP核酸可由细胞或其后代表达,然后为了产生治疗效果将重组细胞体内施用。在一个特定实施方案中,使用了干细胞或祖细胞。依照本发明的该实施方案,可以潜在地使用能够在体外分离和维持的任何干细胞和/或祖细胞。此类干细胞包括但不限于造血干细胞(HSC)、上皮组织例如皮肤和消化道的被覆上皮的干细胞、胚胎心肌细胞、肝脏干细胞(见,例如WO94/08598)和神经干细胞(Stemple和Anderson,1992,Cell 71973-985)。
通过已知的方法可以从诸如皮肤和消化道的被覆上皮的组织得到上皮干细胞(ESC)或角质形成细胞(Rheinwald,1980,Meth.Cell Bio.21A229)。在分层上皮组织例如皮肤中,通过最靠近基膜的生发层内的干细胞的有丝分裂进行更新。消化道被覆上皮内的干细胞提供了该组织的快速更新速率。从患者或者供体的皮肤或者消化道被覆上皮中得到的ESC或者角质形成细胞可以在组织培养中生长(Pittelkow和Scott,1986,Mayo ClinicProc.61771)。如果ESC是由供体提供的,还可以使用抑制宿主抗移植物反应性的方法(例如辐射、药物或抗体施用以促进适当的免疫抑制)。
至于造血干细胞(HSC),能够提供HSC体外分离、繁殖和维持的任何技术均可在本发明的该实施方案中使用。可以实现其目的的技术包括(a)对从将来的宿主或供体分离而来的骨髓中分离和建立HSC培养物,或者(b)使用先前建立的长期HSC培养物,其可以是同种异体的或者异种的。非自体的HSC优选地与抑制将来宿主/患者移植免疫反应的方法联合使用。在本发明的特定实施方案中,通过针吸出从后髂嵴得到人骨髓细胞(见,例如Kodo等,1984,J.Clin.Invest.731377-1384)。在本发明优选的实施方案中,可以得到高度富集的或者基本上纯的HSC。这种富集可以在长期培养之前、长期培养过程中、或长期培养之后完成,并且可以通过本领域已知的任何技术来实现。通过使用例如改良的Dexter细胞培养技术(Dexter等,1977,J.Cell Physiol.91335)或者Witlock-Witte培养技术(Witlock和Witte,1982,Proc.Natl.Acad.Sci.USA 793608-3612)可以建立和维持骨髓细胞的长期培养物。
在一个特定实施方案中,为了基因治疗的目的欲被导入的核酸包含有效连接到编码区的可诱导启动子,以致于通过控制转录的适当诱导物的存在或缺乏可以控制核酸的表达。
本发明还涉及本发明多核苷酸作为诊断试剂的用途。具体而言,本发明涉及对与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况进行诊断的方法,其中所述的方法包括检测信使RNA在来源于人的适当的组织和细胞内异常的转录,例如提高的转录,所述的信使RNA是从编码包含SEQ ID NO2、16、25所示氨基酸序列的天然内源人类基因转录的,其中所述异常转录可以诊断所述人患有上述疾病。具体而言,所述天然内源人基因包含SEQ ID NO1、15、24中所示的核苷酸序列。在优选实施方案中,此种方法包括将所述适当组织或细胞的样本或源于所述组织或细胞的分离的RNA或者DNA分子与长度至少约20个核苷酸的分离核苷酸序列相接触,其中所述的核苷酸序列在高严格条件下能够与编码由SEQ ID NO2、16、25所示氨基酸序列组成的多肽分离的核苷酸序列杂交。检测到升高的转录表明受试者是用一种或多种CREAP调节子治疗的适宜候选者。
对与功能障碍相关的CREAP蛋白质突变形式的检测提供了诊断工具,该诊断工具可以增加或定义疾病或疾病易感性的诊断,所述疾病源于CREAP基因低表达、过表达或改变的时间或空间表达。通过多种技术可以在DNA水平检测携带基因中突变的个体。
用于诊断的核酸,尤其mRNA可以从受试者的细胞,如从血、尿、唾液、活组织检查或尸检材料得到。基因组DNA可以直接用于检测或者在分析前使用PCR或其他扩增技术酶促扩增。还可以以相似的方式使用RNA或cDNA。通过扩增产物与正常基因型相比大小的变化可以检测缺失和插入。将扩增的DNA与编码本发明CREAP多肽的标记核苷酸序列进行杂交可以鉴定点突变。通过RNA酶消化或者通过解链温度的差异可以区别完全匹配序列和错配双链体。通过DNA片段在含有或不含有变性剂的凝胶中电泳迁移率的改变或者通过直接DNA测序也可以检测DNA序列差异(例如Myers等,Science(1985)2301242)。在特定位置的序列改变还可以通过核酸酶保护分析,例如RNA酶和S1保护或者化学断裂方法揭示(见Cotton等,Proc Natl Acad Sci USA(1985)854397-4401)。在另一个实施方案中,可以构建包含编码本发明CREAP多核苷酸序列或这一核苷酸序列的片段的寡核苷酸探针阵列以便进行例如遗传突变的有效筛选。阵列技术方法是众所周知的并且具有广泛的应用性并且可以用来解决分子遗传学包括基因表达、遗传连锁和遗传变异中的多种问题(见例如M.Chee等,Science,第274卷,第610-613页(1996))。
诊断测定法提供了通过使用所描述的方法检测CREAP基因内突变来诊断或确定对疾病易感性的方法。此外,此类疾病可以通过这样的方法诊断,其中所述方法包括检测源于受试者的样本中的多肽或mRNA的不正常降低或升高的水平。使用本领域众所周知的用于定量多核苷酸的任何方法可以在RNA水平上测量降低或增加的表达,其中所述方法为例如核酸扩增,如PCR、RT-PCR、RNA酶保护、RNA印记和其它杂交方法。用于测定源于宿主的样本内蛋白质,如本发明多肽水平的测定技术是本领域技术人员众所周知的。此种测定方法包括放射免疫测定法、竞争结合测定法、蛋白质印迹分析和ELISA测定法。
因此在另一方面本发明涉及诊断试剂盒,其包含(a)本发明的多核苷酸,优选SEQ ID NO1、15或24的核苷酸序列或其片段;(b)与(a)中核苷酸序列互补的核苷酸序列;(c)本发明的多肽,优选SEQ ID NO2、16、25的多肽或其片段;(d)针对本发明多肽,优选针对SEQ ID NO2、16、25的多肽的抗体;或(e)针对CREAP蛋白质,优选SEQ ID NO2、16、25的肽模拟物。
应当理解在任何此类试剂盒中,(a)、(b)、(c)、(d)或(e)包含基本成分。此类试剂盒可用于诊断疾病或者诊断对疾病,特别是与CRE-依赖性基因表达,异常激活或趋化因子异常激活相关的病理状况的易感性。还预期到所述试剂盒包含设计用于检测如文中所讨论的CREAP相关调节蛋白质或被CREAP修饰的蛋白质水平的成分(a)-(e)。
本发明的核苷酸序列对于染色体定位也是有价值的。序列特异靶向个体的人染色体上的特定位置并与该位置杂交。根据本发明将相关序列在染色体上定位是将那些序列与基因相关疾病联系起来的重要的第一步。一旦序列被定位到精确的染色体位置,则该序列在染色体上的物理位置可以与遗传图数据联系起来。此种数据可以在例如V.McKusick,MendelianInheritance in Man(通过Johns Hopkins University Welch MedicalLibrary在线得到)中找到。然后通过连锁分析(物理上相邻基因的共同遗传)鉴定已经定位于同一染色体区域的基因和疾病之间的关系。
还可以确定受侵袭个体和未受侵袭个体之间cDNA或者基因组序列的差异。如果在一些或全部受侵袭个体中观察到突变但在任何正常个体中部没有观察到突变,则该突变可能是该疾病的病因。
本发明的药物组合物还可以包含在核酸水平抑制CREAP蛋白质表达的物质。此类分子包括核酶、反义寡核苷酸、三股螺旋DNA、RNA适体、siRNA和针对CREAP核酸的适当核苷酸序列的双链或单链RNA。这些抑制分子可以由本领域的技术人员使用常规的技术无需过多负担和实验即可产生。例如,通过设计针对编码文中所讨论的CREAP多肽的基因的控制区,即启动子、增强子和内含子的反义分子、DNA或者RNA可以实现对基因表达的修饰(例如抑制)。例如可以使用源于转录起始位点,例如起始位点的-10到+10位的寡核苷酸。尽管如此,基因的所有区域均可用来设计反义分子以便产生与mRNA有着最强杂交的反义分子并且此类适宜的反义寡核苷酸可以通过本领域技术人员熟悉的标准测定方法产生和鉴定。
类似地,使用“三股螺旋”碱基配对方法可以实现基因表达的表达抑制。三股螺旋配对是有用的,因为它抑制双螺旋足够打开以结合聚合酶、转录因子或调节分子的能力。使用三股DNA的治疗最近进展在文献中有所描述(Gee,J.E.等(1994)Huber,B.E.和B.I.Carr,Molecular andImmunologic Approaches,Futura Publishing Co.,Mt.Kisco,N.Y.)。这些分子还可以设计成通过防止转录物结合核糖体而阻断mRNA翻译。
核酶,即酶活性RNA分子,可以通过催化RNA的特异切割用来抑制基因表达。核酶作用的机制涉及核酶分子与互补的靶RNA的序列特异的杂交和随后的内切核酸性切割。可以使用的实例包括工程化的“锤头”(“hammerhead”)或“发夹”(“hairpin”)基序核酶分子,所述的核酶分子可以设计成特异地和有效地催化基因序列例如CREAP1、CREAP2或CREAP3基因的内切核酸切割。
通过扫描靶分子中的包括下列序列GUA、GUU和GUC在内的核酶切割位点初步鉴定任何潜在RNA靶标内的特异核酶切割位点。一旦鉴定出核酶切割位点,则对对应于包含切割位点的靶基因区域的15-20个核糖核苷酸之间的短RNA序列评估可能使该寡核苷酸不起作用的二级结构特征。通过使用核糖核酸酶保护分析测试与互补寡核苷酸杂交的可接近性也可以评估候选靶标的适宜性。
核酶方法包括将细胞暴露于核酶中或者在细胞中诱导表达此种小RNA核酶分子(Grassi和Marini,1996,Annals of Medicine 28499-510;Gibson,1996,Cancer and Metastasis Reviews 15287-299)。靶向于对应于至少一种文中讨论的基因的mRNA的锤头和发夹型核酶在细胞内的表达可以用来抑制所述基因编码的蛋白质。
核酶可以以掺入核酶序列的RNA寡核苷酸的形式直接递送入细胞或者作为编码目的核酶RNA的表达载体导入细胞。核酶通常在体内以足够数目表达以有效催化切割mRNA并由此改变细胞内mRNA丰度(Cotten等,1989,EMBO J.83861-3866)。具体而言,可以将能够编码DNA序列的、根据常规的众所周知的规则设计的并通过例如标准亚磷酸胺(phosphoramidite)化学合成的核酶编码DNA序列连接进入编码tRNA的基因的反密码子茎和环的限制酶位点中,然后通过本领域常规的方法将其转化进入目的细胞并在目的细胞中进行表达。优选地,在该构建体中还引入可诱导的启动子(例如糖皮质激素或者四环素效应元件)以致于核酶的表达可以选择性控制。为了进行饱和性使用,可以使用高活性和组成型活性的启动子。在该应用中tDNA基因(即编码tRNA的基因)是有用的,因为它们尺寸小、转录速度高并且在不同类型组织中普遍表达。
因此,核酶通常设计成能够切割几乎任何mRNA序列并且细胞通常用编码此种核酶序列的DNA转化,以致于表达可控的和催化有效量的核酶。因此,细胞内的几乎任何RNA种类的丰度均可以改变或干扰。
以与描述用于反义核苷酸基本上相同的方式可以改变核酶序列,例如核酶序列可以包含修饰的碱基部分。
也可以将RNA适体导入细胞或者在细胞内表达以改变RNA的丰度或活性。RNA适体是蛋白质的特异RNA配体,所述配体能够特异抑制所述蛋白质的翻译,例如Tat和Rev RNA(Good等,1997,Gene Therapy 445-54)。
还可以使用常规的双链RNA技术实现基因表达的基因特异抑制。对此种技术的描述可以在WO 99/32619中找到,其公开全文引用作为参考。此外,已经证实siRNA技术可用作为抑制基因表达的方法(Cullen,BR Nat.Immunol.2002,7月;3(7)597-9)。
本发明的反义分子、三股螺旋DNA、RNA适体和核酶可以通过本领域已知的用于核酸分子合成的任何方法进行制备。这些技术包括用于化学合成寡核苷酸的技术如固相亚磷酸胺化学合成。备选地,可以通过编码文中所讨论多肽基因的DNA序列的体外和体内转录产生RNA分子。此类DNA序列可以整合到具有适当RNA聚合酶启动子例如T7或SP6的多种载体中。备选地,可以将组成型或诱导性合成反义RNA的cDNA构建体导入到细胞系、细胞或者组织中。
除了上述的用于抑制CREAP表达的方法外,文中还设想人们可以鉴定和采用小分子或其它天然产物以抑制文中所讨论多肽的体内转录。例如,本领域技术人员使用常规的方法可以建立CREAP1、CREAP2或者CREAP3的测定法,所述测定法可应用于从细胞系的培养得到的样本。使用该测定法,可以对细胞系进行筛选以找出表达目的CREAP蛋白质的细胞系。这些细胞系可以培养于如96孔板中。对基因表达的一些已知调节物例如地塞米松、佛波酯、热休克对原代组织培养物和细胞系影响的比较可以选择出最适合使用的细胞系。筛选将仅仅为在添加到每个孔中的不同化合物存在的条件下将细胞培养一定长度的时间和然后测定CREAP活性/mRNA水平。
为了在上述的测定法中便于检测CREAP,可以将萤光素酶或其它商业可得的荧光蛋白质作为适宜的标志蛋白质基因融合到CREAP1、CREAP2或者CREAP3的启动子。通过使用GenBank登录号NM_025021的序列对NCBI基因组序列(当前CREAP1的基因组重叠群序列的GenBank登录号是NT_011295)进行BLAST分析,可以从基因组序列数据鉴定出例如CREAP1启动子的ATG上游的序列。结果给出了CREAP1的ATG上游的不包含任何未知碱基的至少5kb的序列。可以容易地设计并测试能够从人类基因组DNA扩增2kb或更长片段的两对嵌套式PCR引物。可以将启动子片段容易地插入到经设计用于在人细胞中表达的任意无启动子的报告基因载体中(例如Clontech无启动子增强荧光蛋白载体pECFP-1、pEGFP-1或pEYFP,Clontech,Palo Alto,CA)。筛选将仅仅为在添加到每个孔中的不同化合物存在下将细胞培养适当长度时间,然后测定报道基因活性。使用先前所描述的病理状况的体内模型测定有希望的化合物对CREAP1活性和/或体内mRNA水平的影响。另外的方法详细描述了诸如适当培养时间、培养条件、报告子分析并且其它能够用于鉴定可用于抑制体内CREAP蛋白质转录的小分子或其它天然产物的方法学将是本领域技术人员所熟悉的。
此外,编码CREAP蛋白质的cDNA和/或CREAP蛋白质自身能够用于鉴定其它蛋白质,例如激酶、蛋白酶或转录因子,在级联反应中所述其它蛋白质由CREAP蛋白质修饰或间接激活的。如此所鉴定的蛋白质能够用于例如药物筛选以治疗文中所述的病理状况。为了鉴定CREAP蛋白质下游的这些基因,设想例如技术人员能够使用常规方法用特异CREAP抑制剂治疗疾病状态模型动物,处死这些动物,回收相关组织并从这些细胞分离总RNA并应用标准微阵列分析技术鉴定相对对照动物(未施用药物的动物)改变的信号水平。
另外,常规体外或体内测定可以用于鉴定导致CREAP蛋白质过表达的可能基因。如此鉴定的基因所编码的这些相关调节蛋白质能够用于筛选可能是文中所述病理状况治疗的有效治疗剂的药物。例如,可以使用常规报告基因分析,其中CREAP蛋白质启动子区域置于报告基因的上游,构建体转染进适宜细胞(例如来自ATCC,Manassas,VA)并且使用常规技术,通过检测报告基因的表达分析引起CREAP启动子激活的上游基因。
文中还设想技术人员可以按照常规方法通过设计例如CREAP蛋白质的抗体或肽模拟物和/或设计靶向此类蛋白质的基因的抑制性反义寡核苷酸、三股螺旋DNA、核酶、siRNA、双链或单链RNA和RNA适体,抑制相关调节蛋白质或CREAP蛋白质所修饰的蛋白质的基因的功能和/或表达来作为治疗文中所述病理状况的途径。还设想用于治疗所述病理状况的包含此类抑制性物质的药物组合物。
本发明另外的实施方案涉及将药物组合物与可药用载体、赋形剂或稀释剂联合施用以治疗文中所述的任意病理状况。此类药物组合物可以包含CREAP蛋白质或其片段针对CREAP多肽或肽段的抗体、肽模拟物、和/或CREAP调节子(例如激动剂、拮抗剂或CREAP表达和/或功能抑制剂)。这些组合物可以单独施用或与至少一种其它试剂例如稳定化合物联合施用,该组合物可以在包括但不限于盐水、缓冲盐水、右旋糖和水的任意无菌生物相容性药物载体中施用。组合物可以单独或与其它试剂、药物或激素联合施用于患者。
当本领域技术人员认为在医学上有利时,例如其中CREAP功能激动剂对例如神经变性疾病如阿尔茨海默氏病、帕金森氏病和亨廷顿病具有治疗作用的情况下可以施用包含CREAP蛋白质或其片段的药物组合物。根据本发明使用的此类药物组合物可以以常规方式使用一种或多种生理可接受载体或赋形剂形成制剂。
文中所公开的用于预防、治疗或缓解与CRE-依赖基因异常表达或趋化因子异常激活相关病理状况的药物组合物可以以治疗有效量施用于患者。治疗有效量是指足以预防、治疗或缓解所述状况的化合物的量。
化合物及其生理可用盐和溶剂化物可以配制以通过吸入或吹入(通过口或鼻)或经局部、口、口含、肠胃外或直肠施用。
对于经口施用,药物组合物可以采取例如片剂或胶囊的形式,这些片剂或胶囊是通过常规方法由可药用赋形剂如粘合剂(例如预胶化的玉米淀粉、聚乙烯吡咯烷酮、或羟丙基甲基纤维素);填充剂(例如乳糖、微晶纤维素或磷酸氢钙);润滑剂(例如硬脂酸镁、滑石粉或二氧化硅);崩解剂(例如马铃薯淀粉或淀粉羟乙酸钠)或者湿润剂(例如十二烷基硫酸钠)制备的。这些片剂可以通过本领域众所周知的方法进行包衣。用于经口施用的液体制剂可以采用例如溶液剂、糖浆剂或悬浮剂的形式,或者它们可以呈现为在使用前用水或其它适当载体构成的干燥产物。此类液体制剂可以通过常规方法使用可药用添加剂如悬浮剂(例如山梨醇糖浆、纤维素衍生物或氢化食用脂);乳化剂(例如卵磷脂或阿拉伯胶);非水性载体(例如杏仁油、油酯、乙醇或分馏植物油)和防腐剂(例如对羟基苯甲酸甲酯、对羟基苯甲酸丙酯或者山梨酸)进行制备。这些制剂还可以包含适当的缓冲盐、增香剂、着色剂和甜味剂。
经口施用的制剂可以适当配制以控释活性化合物。
对于口含施用,组合物可以采用常规方法配制的片剂或锭剂的形式。
对于通过吸入施用,根据本发明使用的化合物以包装于增压袋或喷雾器中的气溶胶喷剂的形式,使用适当的推进剂例如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其它适当气体进行常规递送。对于增压气溶胶,剂量单位可以通过阀门递送计量量进行确定。在吸入器或吹入器中使用的例如明胶的胶囊和药筒可以配制成包含所述化合物和适当粉末基质如乳糖或淀粉的粉末混合物。
化合物可以配制成通过注射,例如通过快速浓注注射或连续输注进行胃肠外施用。用于注射的制剂可以以加入防腐剂的单位剂量形式,例如在安瓿瓶内或在多剂量容器内的单位剂量形式存在。组合物可以采用诸如油或水性载体的悬浮剂、溶液剂或乳剂形式,并且可以包含配制剂例如悬浮剂、稳定剂和/或分散剂。备选地,活性成分可以是粉剂形式,其使用前与适当载体如无菌、无致热原水构成。
化合物还可以配制成直肠组合物如栓剂或滞留型灌肠剂,例如包含常规栓剂基质如可可脂或其它甘油酯。
除了先前所述的制剂,化合物还可以配制成长效制剂。此类长效制剂可以通过植入(例如皮下或肌内)或肌内注射施用。因此,例如,化合物可以使用适当聚合的或疏水物质(例如可用油中的乳剂)或离子交换树脂配制,或配制成微溶衍生物,例如微溶盐。
如果期望,组合物可以存在于包装或分配装置内,它们可以包含含有活性成分的一种或多种剂型。例如包装可以包含金属或塑料箔,如水泡眼包装。包装或分配装置可以带有施用说明书。
适于用于本发明的药物组合物包括组合物,其中包含有效量活性成分以实现预期目的。有效量的确定是在本领域技术人员能力范围之内。
对于任意化合物,治疗有效剂量可以最初在如赘生细胞的细胞培养测定中或者动物模型中,通常为小鼠、兔、狗或猪的动物模型中进行估计。动物模型还可以用于确定适当浓度范围和施用途径。剂量在动物模型中确定以获得包括IC50(即实现症状半最大抑制的测试化合物浓度)的循环血浆浓度范围。然后此类信息可以用于确定在人类中的有用剂量和施用途径。
治疗有效量是指用于预防、治疗或缓解特定目的病理状况的活性成分的量。通过细胞培养物或实验动物中的标准药学方法,例如ED50(50%群体的治疗有效剂量)和LD50(50%群体的致死剂量),可以确定疗效和毒性。毒性和疗效之间的剂量比率是治疗指数,并且该指数能够表示为比率LD50/ED50。呈现大治疗指数的药物组合物是优选的。从细胞培养物测定和动物研究获得的数据用于确定人类使用的剂量范围。包含于此类组合物中的剂量优选地是在包括ED50的循环浓度范围之内并具有很少或无毒性的剂量。在该范围内剂量的改变依赖于所用剂型、患者敏感性和施用途径。
医生将按照与需要治疗的患者相关的因素确定确切剂量。调节剂量和施用以提供足够水平的活性部分或维持预期效果。可以考虑的因素包括疾病状况的严重性、受试者的一般健康、年龄、体重、和受试的性别、饮食、施用时间和频率、药物联合、反应敏感性和对治疗的耐受性/应答。依赖于特定制剂的半寿期和清除速度,长效药物组合物可以每3或4天、每周或两周一次进行施用。
依赖于施用途径,正常剂量可以为0.1到100,000微克,最多总剂量约1g。在文献中提供了关于特定剂量和递送方法的指导并且本领域的从业者通常可获得。本领域技术人员采用与蛋白质或它们的抑制剂不同的核苷酸制剂。同样,多核苷酸或多肽的递送对于特定细胞、状况、位置等等将是特异的。适于蛋白质经口施用的药物制剂描述于例如美国专利5,008,114;5,505,962;5,641,515;5,681,811;5,700,486;5,766,633;5,792,451;5,853,748;5,972,387;5,976,569和6,051,561。
下面的实施例进一步阐明本发明并且无意限制本发明。
下面的材料和方法用于进行下面实施例1-5一组人全长cDNA克隆的集合我们已经存档并对来自由33种人组织类型mRNA制备的多个高质量全长cDNA文库的约170,000个克隆在5’末端进行了测序。使用专有的生物信息学方法,我们已经鉴定了具有ORF起始ATG密码子的所有cDNA克隆,其中所述的ORF是通过实验确定的或者概念上预测的,并且这些cDNA克隆因此可能代表全长转录物。使用Q-bot(Genetix Limited,Hampshire,英国)将来自存档克隆系列的pCMVSport6载体(Invitrogen,Carlsbad,CA)中的总共20,702个克隆重新排列到含有60μl LB培养基(LB)的384-孔Genetix板中。基于对这20,702个克隆5’序列的生物信息学分析,它们来源于约11,000个基因,这些基因的结构与存在具有强有力证据,尽管它们中的大部分没有功能,并且6,000个潜在的新序列还不存在于公共cDNA数据库中。
将阵列化的克隆复制以产生用于存档的多拷贝。一个拷贝用于使用QIAGEN BioRobot 8000(Qiagen,Valencia,CA)产生小量制备DNA。将DNA样品洗脱到96孔UV板(Corning,Acton,MA)中并且通过在SPECTRAmax 190(Molecular Devices,Sunnyvale,CA)上测定OD260值确定DNA样品浓度和产量。然后将所得到的20,702个DNA样品在384孔板中等分试样以产生多拷贝用于存档(在TE缓冲液中80pg/孔)和用于基于细胞的测定(在OPTI-MEM细胞培养基(Invitrogen)中50ng/孔)。
将板密封并保存于-20℃。
对环AMP效应元件的激活子进行基因组范围的筛选将生长于225ml组织培养瓶中的Hela细胞(ATCC,Manassas,VA)用胰酶消化并在DMEM培养基(Invitrogen)中稀释到105个细胞/ml。然后将细胞悬浮液用Multi-drop 384(Thermo Labsystems,Beverly,MA)以30μl/孔分配到384孔组织培养板。孵育过夜后,将由0.25μl Fugene 6转染试剂(Roche Applied Biosciences)、6μl含有50ng pCRE-Luc质粒构建体(Stratagene)和50ng来自克隆集合的各个cDNA质粒的OPTI-MEM培养基的混合物用Biomek FX液体处理机器人(Beckman Coulter)加入到384孔板的每个孔中。转染后40小时,使用BrightGlo Luciferase Assay System(Promega,Madison,WI)在LUMINOSKAN Ascent发光计(ThermoLabsystems)按照制造商的方法测定每个孔中的萤光素酶活性。使用专门设计用于处理高通量基因功能化项目的室内数据处理和分析系统对原始萤光素酶数据进行处理。整个分析一式两份进行以产生41,404个数据点,每个数据点对应在单个孔中使用单个cDNA克隆的微型化转染实验。
HTS采样点证实和确认对于每组一式两份的20,702个数据点,计算了Z得分(计算为激活倍数除以群体标准差)和针对群体中位数的激活倍数并且储存于带注释的可检索数据库中。基于下面2条标准选择了潜在的激活剂(1)在任一测定中Z得分大于3.0和(2)在两个测定中萤光素酶/中位数的增加倍数大于8.0。基于上述标准鉴定出总共85个克隆(总克隆的0.4%)。从克隆档案对这些采样点的DNA样品进行检索并且将DNA样品重新转化入细菌菌株XL-10Gold(Stratagene)。挑取每个样品的各个克隆并且进行DNA小量制备。对部分小量制备的DNA样品从5’末端测序以进行克隆验证。剩余的样品用于采样点确认,其中将它们与pCRE-Luc报告子构建体和编码处于SV40早期启动子控制下的海肾(kenilla)萤光素酶的pRL-SV40质粒(Promega)一起手工转染入Hela细胞,随后按照制造商的建议进行双萤光素酶测定(Promega)。
RNA印迹分析和体外转录和翻译分析使用EcoRI和NotI消化含有CREAP1 cDNA的pCMVSport6质粒,使用Qiagen DNA凝胶提取试剂盒将插入片段进行凝胶纯化并使用Enzo随机引物标记系统按照出售商的手册(Bio-11-dCTP脱氧核苷酸包装,目录号42723,Enzo Biochem,Farmingdale,NY)进行标记。简而言之,将200ng CREAP1片段或100ngβ肌动蛋白cDNA(Clontech)在100℃变性10分钟,冰上冷却3-5分钟,并且然后与5μl 10x六聚体随机引物、5μldCTP-11-Bio混合物和1μl Klenow片段混合并在37℃孵育4小时。根据所建议的方案,将探针与多组织mRNA RNA印迹膜(Clontech)杂交。利用生物素检测试剂盒(Ambion,Austin,TX)实现信号检测。将膜曝光于X-光片10-30秒。在首次曝光后,将膜去除探针并用β肌动蛋白探针(Clontech)进行重杂交以标准化表达水平。
使用TNT SP6 Quick Coupled Transcription and Translation System(Promega)根据销售商的手册进行CREAP1蛋白质的体外转录和翻译。将翻译产物在Nupage预制凝胶(4-20%)(Invitrogen)中分离,转移至硝酸纤维素膜并用Transcend非放射性检测系统(Promega)根据制造商的说明书进行检测。
CREAP1-CREB信号途径分析对于体内激酶测定,使用与酵母GAL4 DNA结合结构域(氨基酸1-147)构建体融合的CREB或ATF2转录因子的激活结构域(Stratagene,PathDetect体内信号转导途径反式报告系统)。按照制造商的方法(Stratagene)使用了含有5×GAL4 DNA结合元件和TATA盒驱动萤光素酶报道基因的HLR细胞系。将104个HLR细胞分散于96孔组织培养板的每个孔中。16小时后,分别用100ng Creb-GAL4或ATF2-GAL4融合构建体、30ng海肾萤光素酶对照质粒与100ng pCMVSPORT6、pCMVSPORT-CREAP1、pFC-PKA或pFC-MEKK(Stratagene)激活子质粒转染细胞。使用Fugene6试剂(Roche Molecular Biochemicals,Basel,瑞士)按照制造商的手册进行转染。转染40小时后,使用制造商的方法进行Dual-Glo萤光素酶测定(Promega)。
对于显性失活CREB测定,使用了CREB显性失活构建体(非磷酸化的S133A突变体或DNA结合结构域K287L突变体K-Creb)(Clontech,目录号K6014-1)。根据制造商对上面的转染和萤光素酶测定方法进行了一些改良。Hela细胞、pCMVSPORT6、pCMV-CREAP1、pS133A-Creb或pK-Creb构建体用于转染。
CREAP1蛋白质缺失的功能分析利用本领域技术人员熟悉的PCR策略将CREAP1蛋白质氨基酸1-170、1-356、1-494、1-580和170-650插入到pFlag-CMV4表达载体(Sigma,St.Louis,MO)。
将104个Hela细胞分散于96孔组织培养板的每个孔中。16小时后,分别用100ng pCRE-Luc报告子构建体、30ng海肾萤光素酶对照质粒与100ng pCMVSPORT6、pCMVSPORT-CREAP1和不同的Flag-CREAP1缺失融合构建体转染细胞。使用Fugene6试剂(Roche AppliedBiosciences)按照制造商的用法说明进行转染。转染40小时后进行Dual-Glo萤光素酶测定(Promega)。萤火虫萤光素酶计数对海肾萤光素酶进行标准化并作图。
实施例1对环AMP效应元件激活基因进行基因组范围的筛选为了鉴定编码能够导致CRE激活的蛋白质的cDNA,我们筛选了带注释的和有索引的20,702个人cDNA克隆的集合,预测这些克隆能够代表微型化CRE-萤光素酶报告基因系统内的11,000-16,000个单个基因的全长转录物。一式两份地进行实验以产生41,404个数据点,每个数据点对应来自瞬时蛋白质过表达测定的萤光素酶活性,其中使用目的cDNA克隆和含有萤火虫萤光素酶基因的质粒对约3,000个Hela细胞进行瞬时转染。对两组数据的统计分析已经产生了一列85个克隆,这些克隆导致在2次一式两份的初步筛选实验中萤光素酶活性与群体中位数相比至少增加8倍。在随后第二次验证实验中,当回收这些克隆各个菌落并进行相似测定但使用SV40启动子控制下的海肾萤光素酶进行数据标准化时,确认了14个克隆(数据未显示)。所获得的采样点包括一种迄今功能未知的蛋白质,由Kazusa DNA研究所命名为KIAA0616(登录号NM 025021)。基于我们对该蛋白质的功能分析,我们基于文中所描述的瞬时过表达萤光素酶报道基因分析系统中该蛋白质激活CRE的能力重新命名该蛋白质为CRE激活蛋白质1或“CREAP1”。
为了进一步定义CREAP1的途径或启动子特异性,在Hela细胞中在相似的分析系统中测试了一组多种启动子-萤光素酶构建体。这些构建体能够测试CREAP1激活CREB、NFAT和NFkB转录因子结合元件和IL-8、VCAM、IL-24和NPY的真正启动子的能力。此外,包括用于背景测试和特异性对照的3种萤光素酶载体。结果表明CREAP1是CRE特异激活子(数据未显示)。
实施例2CREAP1基因的DNA序列和氨其酸序列按照常规的方法对活性CREAP1克隆的2.4kb cDNA插入片段的两条链进行测序。结果表明该基因编码区是1950个核苷酸并且氨基酸序列预测为650个氨基酸。生物信息学分析表明CREAP1除了在分子中间的氨基酸379-448的富含脯氨酸的结构域外不包含保守蛋白质功能结构域(例如激酶ATP结合结构域或者转录因子DNA结合结构域)。下面显示了DNA序列和氨基酸序列。
CREAP1的经证实的全长DNA序列CCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGGACTCTAGCCTAGGCCGCGGGACGGATAACAATTTCACACAGGAAACAGCTATGACCATTAGGCCTATTTAGGTGACACTATAGAACAAGTTTGTACAAAAAAGCAGGCTGGTACCGGTCCGGAATTCCCGGGAGGAGGAGGAGGTGGCGGCGAGAAGATGGCGACTTCGAACAATCCGCGGAAATTCAGCGAGAAGATCGCGCTGCACAATCAGAAGCAGGCGGAGGAGACGGCGGCCTTCGAGGAGGTCATGAAGGACCTGAGCCTGACGCGGGCCGCGCGGCTCCAGCTCCAGAAATCCCAGTACCTGCAACTGGGCCCCAGCCGAGGCCAGTACTATGGCGGGTCCCTGCCCAACGTGAACCAGATCGGGAGTGGCACCATGGACCTGCCCTTCCAGCCCAGCGGATTTCTGGGGGAGGCCCTGGCAGCGGCTCCTGTCTCTCTGACCCCCTTCCAATCCTCGGGCCTGGACACCAGCCGGACCACCCGGCACCATGGGCTGGTGGACAGGGTGTACCGGGAGCGTGGCCGGCTCGGCTCCCCACACCGCCGGCCCCTGTCAGTGGACAAACACGGACGGCAGGCCGACAGCTGCCCCTATGGCACCATGTACCTCTCACCACCCGCGGACACCAGCTGGAGAAGGACCAATTCTGACTCCGCCCTGCACCAGAGCACAATGACGCCCACGCAGCCAGAATCCTTTAGCAGTGGGTCCCAGGACGTGCACCAGAAAAGAGTCTTACTGTTAACAGTCCCAGGAATGGAAGAGACCACATCAGAGGCAGACAAAAACCTTTCCAAGCAAGCATGGGACACCAAGAAGACGGGGTCCAGGCCCAAGTCCTGTGAGGTCCCCGGAATCAACATCTTCCCGTCTGCCGACCAGGAAAACACTACAGCCCTGATCCCCGCCACCCACAACACAGGGGGGTCCCTGCCCGACCTGACCAACATCCACTTCCCCTCCCCGCTCCCGACCCCGCTGGACCCCGAGGAGCCCACCTTCCCTGCACTGAGCAGCTCCAGCAGCACCGGCAACCTCGCGGCCAACCTGACGCACCTGGGCATCGGT
GGCGCCGGCCAGGGAATGAGCACACCTGGCTCCTCTCCACAGCACCGCCCAGCTGGCGTCAGCCCCCTGTCCCTGAGCACAGAGGCAAGGCGTCAGCAGGCATCGCCCACCCTGTCCCCGCTGTCACCCATCACTCAGGCTGTAGCCATGGACGCCCTGTCTCTGGAGCAGCAGCTGCCCTACGCCTTCTTCACCCAGGCGGGCTCCCAGCAGCCACCGCCGCAGCCCCAGCCCCCGCCGCCTCCTCCACCCGCGTCCCAGCAGCCACCACCCCCGCCACCCCCACAGGCGCCCGTCCGCCTGCCCCCTGGTGGCCCCCTGTTGCCCAGCGCCAGCCTGACTCGTGGGCCACAGCCGCCCCCGCTTGCAGTCACGGTACCGTCCTCTCTCCCCCAGTCCCCCCCAGAGAACCCTGGCCAGCCATCGATGGGGATCGACATCGCCTCGGCGCCGGCTCTGCAGCAGTACCGCACTAGCGCCGGCTCCCCGGCCAACCAGTCTCCCACCTCGCCAGTCTCCAATCAAGGCTTCTCCCCAGGGAGCTCCCCGCAACACACTTCCACCCTGGGCAGCGTGTTTGGGGACGCGTACTATGAGCAGCAGATGGCGGCCAGGCAGGCCAATGCTCTGTCCCACCAGCTGGAGCAGTTCAACATGATGGAGAACGCCATCAGCTCCAGCAGCCTGTACAGCCCGGGCTCCACACTCAACTACTCGCAGGCGGCCATGATGGGCCTCACGGGCAGCCACGGGAGCCTGCCGGACTCGCAGCAACTGGGATACGCCAGCCACAGTGGCATCCCCAACATCATCCTCACAGTGACAGGAGAGTCCCCCCCCAGCCTCTCTAAAGAACTGACCAGCTCTCTGGCCGGGGTCGGCGACGTCAGCTTCGACTCCGACAGCCAGTTTCCCCTGGACGAACTCAAGATCGACCCCCTGACCCTCGACGGACTGCACATGCTCAACGACCCCGACATGGTTCTGGCCGACCCAGCCACCGAGGACACCTTCCGGATGGACCGCCTGTGAGCGGGCACGCCGGCACCCTGCCGCTCAGCCGTCCCGACGGCGCCTCCCCAGCCCGGGGACGGCCGTGCTCCGTCCCTCGCCAACGGCCGAGCTTGTGATTCTGAGCTTGCAATGCCGCCAAGCGCCCCCCGCCAGCCCGCCCCCGGTTGTCCACCTCCCGCGAAGCCCAATCGCGAGGCCGCGAGCCGGGCCGTCCACCCACCCGCCCGCCCAGGGCTGGGCTGGGATCGGAGGCCGTGAGCCTCCCGCCCCTGCAGACCCTCCCTGCACTGGCTCCCTCGCCCCCAGCCCCGGGGCCTGAGCCGTCCCCTGTAAGATGCGGGAAGTGTCAGCTCCCGGCGTGGCGGGCAGGCTCAGGGGAGGGGCGCGCATGGTCCGCCAGGGCTGTGGGCCGTGGCGCATTTTCCGACTGTTTGTCCAGCTCTCACTGCCTTCCTTGGTTCCCGGTCCCCCAGCCCATCCGCCATCCCCAGCCCGTGGTCAGGTAGAGAGTGAGCCCCACGCCGCCCCAGGGAGGAGGCGCCAGAGCGCGGGGCAGACGCAAAGTGAAATAAACACTATTTTGACGGCAAAAAAAAAAAAAAAGGGCGGCCGCTCTAGAGTATCCCTCGAGGGGCCCAAG (SEQ ID NO 1)预测的CREAP1氨基酸序列(650个氨基酸)MATSNNPRKFSEKIALHNQKQAEETAAFEEVMKDLSLTRAARLQLQKSQYLQLGPSRGQYYGGSLPNVNQIGSGTMDLPFQPSGFLGEALAAAPVSLTPFQSSGLDTSRTTRHHGLVDRVYRERGRLGSPHRRPLSVDKHGRQADSCPYGTMYLSPPADTSWRRTNSDSALHQSTMTPTQPESFSSGSQDVHQKRVLLLTVPGMEETTSEADKNLSKQAWDTKKTGSRPKSCEVPGINIFPSADQENTTALIPATHNTGGSLPDLTNIHFPSPLPTPLDPEEPTFPALSSSSSTGNLAANLTHLGIGGAGQGMSTPGSSPQHRPAGVSPLSLSTEARRQQASPTLSPLSPITQAVAMDALSLEQQLPYAFFTQAGSQQPPPQPQPPPPPPPASQQPPPPPPPQAPVRLPPGGPLLPSASLTRGPQPPPLAVTVPSSLPQSPPENPGQPSMGIDIASAPALQQYRTSAGSPANQSPTSPVSNQGFSPGSSPQHTSTLGSVFGDAYYEQQMAARQANALSHQLEQFNMMENAISSSSLYSPGSTLNYSQAAMMGLTGSHGSLPDSQQLGYASHSGIPNIILTVTGESPPSLSKELTSSLAGVGDVSFDSDSQFPLDELKIDPLTLDGLHMLNDPDMVLADPATEDTFRMDRL (SEQ ID NO 2)
实施例3RNA印迹和CREAP1蛋白质的体外翻译.
为了研究CREAP1基因在不同人类组织中的表达,我们使用随机标记的CREAP1探针进行了RNA印迹分析。根据RNA印迹法分析,观察到了两种mRNA,2.4Kb和7Kb。2.4Kb条带与编码区大小一致。7.0Kb条带反映了mRNA的备选剪接形式。虽然在大多数人组织中表达,CREAP1 mRNA在脑、心脏、骨骼肌和肾中是丰富的(数据未显示)。
为了测试CREAP1的预测氨基酸序列的精确性,我们使用pCMVSPORT-CREAP1作为模板并且进行了体外转录和翻译反应。之后将体外翻译产物在SDS-PAGE中分辨,可观察到约80Kd的单一CREAP1蛋白质条带,这与它包含650个氨基酸的观点一致(数据未显示)。
实施例4CREAP1通过CREB起作用由于CREAP1强烈激活CRE启动子转录,我们接下来研究了CREAP1是否通过CREB途径起作用。为了解决这个问题,使用由CREB或ATF2转录因子的反式激活结构域和GAL4DNA结合结构域(氨基酸1-147)组成的融合构建体和用稳定整合PathDetect反式-报告子质粒(Stratagene)的HLR细胞系进行了体内激酶测定。在该系统中,只有那些激活CREB或ATF2的反式激活结构域的上游调节子(可能是激酶)能够驱动萤光素酶报道基因的表达。结果表明CREAP1强烈刺激GAL4启动子上的CREB-GAL4融合分子的反式激活并且其活性甚至强于PKA催化亚单位,即磷酸化CREB的规范激酶的活性。有趣地是CREAP1不能够激活ATF2-GAL4融合分子而MEKK(ATF2途径的上游激酶,Stratagene试剂盒手册)能够刺激ATF2融合100倍以上。该结果证明CREAP1是CREB途径特异上游激活剂。
为了进一步证实该观察,两种CREB显性失活构建体(非可磷酸化的S133A突变体或者DNA结合结构域突变体K287L(Clontech))用于共转染测定。实验数据表明或者CREB S133A突变体或者K287L突变体能够完全除去CREAP1对CRE启动子的激活,表明CREAP1特异地作用于CREB信号转导途径的上游并且CREB的磷酸化和DNA结合活性都是CREAP1发信号所需的。
实施例5CREAP1蛋白质分子内结构域的功能分析为了研究CREAP1分子内的功能结构域,通过使用基于PCR的策略将CREAP1蛋白质氨基酸片段1-170、1-356、1-494、1-580和170-650亚克隆入pFlag-CMV4载体并且如上所述在Dual Glo萤光素酶测定中测试了功能。结果表明包含CREAP1的氨基酸1-170的氨基末端片段对于其功能是重要的,因为缺乏该氨基末端的K5(aa 170-650)缺乏几乎全部刺激活性。然而,单独的1-170片段(K1)不足以实现其功能。另一方面,CREAP1的C末端对于其功能不是必要的,因为K4缺失体(缺失氨基酸581-650)保留了几乎全部的野生型活性。K2和K4活性的比较表明氨基酸356-580(具有富含脯氨酸的结构域)对于CREAP1功能是非常重要的,因为从K4除去该部分(这导致产生K2)使CREAP1功能活性降低到1/10(见下表1)。

表1.CREAP片段的功能。
以下材料和方法用于进行下面实施例6-9中列出的实验DNA构建体使用常规方法(Roebuck,J.Interferon and Cytokine Res.19429-438(1999))室内构建的pGL-2-IL-8P-Luc包含有含有IL-8启动子的1.5kb序列所驱动的萤火虫萤光素酶基因。通过连接用Hind III/XhoI消化pGL-2-IL-8P-Luc切割的1.5kb人IL-8启动子DNA并插入到Hind III/XhoI消化的pGL3Basic(Promega)中构建了pGL3B-IL-8P-Luc。
通过将人IL-8基因-1491到+43区域插入pGL3Basic载体(Promega,Inc)构建了pIL-8Luc报告子。PCR产生野生型最小IL-8启动子和点突变。Wu等(Wu等,J.Biol.Chem.,2722396-2403(1997))描述了AP-1、C/EBP、NF-κB中的突变。假定的CRE-样位点的序列TGACATAA突变为TCGATCAA。通过将PCR扩增序列连接入pTAL-Luc(BD Biosciences)制备了携带有CRE样效应元件(pCREL-Luc)的6联体拷贝或发现于人PEPCK和CAPL启动子(pCREL2-Luc)的CRE-样元件TGACACAA 5份拷贝的启动子构建体。所有的技术使用常规方法进行。
IL-8启动子缺失和点突变变体的构建聚合酶链式反应(PCR)用于产生IL-8启动子变体。PCR扩增循环为94℃2分钟,5×[94℃15秒,55℃30秒和72℃15秒]和20×[94℃15秒,65℃30秒和72℃15秒]。Advantage 2 DNA聚合酶(BD Biosciences)用于全部扩增步骤。使用共同反义引物P2.1扩增所有变体,该引物具有核苷酸序列(5’-GCCCAAGCTTTGTGCTCTGCTGTCTCTGAAAG-3’)(SEQID NO 3),其对应人IL-8基因序列+13-+43(Roebuck’J.Interferon andCytokine Res.19429-438(1999)。BamHI限制性酶切位点(下划线)包括于全部有义引物中。将PCR产物进行凝胶纯化并使用Zero Blunt TOPOPCR克隆试剂盒(Invitrogen)连接。用来自pCR-Blunt II-TOPO的HindIII/BamH I切割下序列证实的克隆并连接入Hind III/BamH I消化的pGL3Basic。携带缺乏AP-1位点的截短的最小IL-8启动子的pIL-8p[δAP-1]-Luc是通过用P2.1和S3(5’-GCCCTGAGGGGATGGGCCATCAG-3’)(SEQ ID NO 4)扩增产生的,P2.1和S3是用于产生对应人IL-8基因序列-114-+43的157nt产物的引物。
分别使用wtAP-1(5’-CGCGGATCCGAAGTGTGATGACTCAGGTTTGCCCTG-3’)(SEQID NO 5)和mAP-1(5’-CGCGGATCCGAAGTGTGATATCTCAGGTTTGCCCTG-3’)(SEQID NO 6)和P2.1引物扩增携带野生型或突变AP-1位点的最小IL-8启动子。加下划线的是AP-1位点内突变的核苷酸。两种187nt产物都对应人IL-8基因序列-144-+43。野生型和AP-1突变体分别命名为pIL-8p[wtAP-1]-Luc和pIL-8p[mutAP-1]-Luc。
在2步PCR步骤中制备携带有突变Oct-1/C/EBP和NF-κB位点的IL-8最小启动子变体。在第一步PCR中使用SP3_NF-κBmut(5’-GCCCTGAGGGGATGGGCCATCAGTTGCAAATCGTTAACTTTCCTCTGACATAAT-3’)(SEQ ID NO 7)或SP3_Oct-1mut(5’-GCCCTGAGGGGATGGGCCATCAGCTACGAGTCGTGGAAT-3’)(SEQ ID NO 8)、有义引物和P2.1反义引物,扩增得到分别携带有突变的NF-κB和Oct-1/C/EBP结合位点的157nt产物。加下划线的是NF-κB和Oct-1位点内突变的核苷酸。在第二步PCR中AP-1_Bam有义引物(5’-CGCGGATCCGAAGTGTGATGACTCAGGTTTGCCCTGAGGGGATGGGC-3’)(SEQ ID NO 9)和P2.1反义引物用于再扩增第一步PCR反应的两种产物(每个反应物100fmol)以产生对应人IL-8基因序列-144-+43的187nt cDNA。NF-κB和Oct-1/C/EBP结合位点突变体分别命名为pIL-8p[mutNF-κB]-Luc和pIL-8p[mutOct-1]-Luc。
在三步PCR步骤中制备携带有突变CRE-样效应元件的IL-8最小启动子变体。第一步PCR中,CREmut有义引物(5’-CAGTTGCAAATCGTGGAATTTCCTCTCGATCAATGAAAAGATG-3’)(SEQ ID NO 10)和P2.1反义引物用于产生137nt产物。加下划线的是CRE-样位点内突变的核苷酸。第二步PCR中,SP3_Oct-1wt有义引物(5’-GCCCTGAGGGGATGGGCCATCAGTTGCAAATCGTGGAAT-3’)(SEQ ID NO 11)和P2.1反义引物用于再扩增第一步PCR反应的产物(每个反应物100fmol)产生对应人IL-8基因序列-114-+43的157nt产物。最后,在第三步PCR中,使用AP-1_Bam有义引物和P2.1反义引物并且第二步PCR反应产物作为模板(每个反应物100fmol),使IL-8最小启动子变体5’末端延伸至人IL-8基因-144核苷酸位置处。所得到的用于本研究的构建体命名为pIL-8p[mutCRE_like]-Luc。通过PCR使用CRElike_S(5’-CGCCTGGTACCGAGCTCTG-3’)(SEQ ID NO 12)有义引物和CRElike_AS(5’-ACCCAAGATCTCGAGCCCG-3’)(SEQ ID NO 13)反义引物和模板寡核苷酸(5’-CGCCTGGTACCGAGCTCTGACATAATGACATAATGACATAATGACATAATGACATAATGACATAATTACGCGTGCTAGCCCGGGCTCGAGATCTTGGGT-3’(SEQ ID NO 14),(每个反应物100fmol)扩增制备携带IL-8启动子多联体CRE-样效应元件的启动子构建体。加下划线的是CRE-样效应元件(TGACATAA)的六联体拷贝。PCR扩增参数如上所述。将99个核苷酸的PCR产物用KpnI和BglII切割,凝胶纯化并连接入KpnI/BglII消化的pTAL载体(BD Biosciences)产生pTAL-6×[CRE_like]报告子。
用于高通量筛选的DNA制备将上述阵列化克隆进行复制产生用于存档的多拷贝。一个拷贝用于使用QIAGEN BioRobot 8000(Qiagen,Valencia,CA)产生小量制备的DNA。简而言之,对于每个384-孔板,2μl甘油原种用于接种含有100μl LB液体培养基(Gibco BRL)-8%甘油的Greiner 384-深孔板。然后用带气孔的纸(Qiagen)覆盖Greiner板,用莎伦包装膜包裹并在37℃无摇动孵育~22小时。随后,将5μl培养物从384-孔Greiner板转移至每孔中含有1ml Terrific液体培养基(KD Medical)(+100μg/ml氨苄青霉素)的Qiagen 96-孔深板中。用带气孔的纸覆盖4个Qiagen板并在37℃培养箱中以250转/分钟振荡培养~22小时。以4000转/分钟离心15分钟沉淀细菌细胞,倒出上清液,并使用Qiagen BioRobot 8000处理板以产生DNA制备物。所使用的方案基于制造商的方案‘QIAprep Turbo96 PB(1-4板)’,仅有的修改为使用96-孔UV-透明板(Corning)作为洗脱板。通过在SPECTRAmax 190(Molecular Devices)上测量OD260值确定DNA样品的浓度和产量。然后将所得到的20,702个DNA样品等分试样以产生存档的多拷贝(TE缓冲液中80pg/孔)。对于使用2,368cDNA克隆集合的测定,以每孔6μl在96-孔PCR板(ABGene,Rochester,NY)中产生DNA等分试样,浓度为OPTI-MEM I细胞培养基(Gibco BRL,Carlsbad,CA)中20ng DNA/μl。在384-孔PCR板中以每孔4μl,以OPTI-MEM中7.5ng质粒/μl的浓度产生用于筛选20,702个cDNA收集样品的DNA等分试样。用铝箔密封板并保存于-20℃。
细胞培养将胰酶消化的HeLa细胞(ATCC,Manassas,VA)以105细胞/ml重悬于完全生长培养基(DMEM,Invitrogen),其包含10%胎牛血清(GIBCOBRL Carlsbad,CA Cat#10082-147)和Dulbecco’s改良Eagle培养基中(D-MEM)(GIBCO BRL Carlsbad,CA Cat.#10317-022)的1×抗菌素-抗霉菌素试剂(GIBCO BRL Carlsbad,CA Cat#15240-062),并使用Multidrop384(ThermoLabsystems)以每孔75μl分布于24个白色96-孔板(Corning,Acton,MA)中用于2,368个cDNA克隆收集样品筛选,或者以每孔30分布于51个白色384-孔板(Costar)用于20,702个cDNA克隆集合筛选。在37℃并含5%CO2的组织培养箱中将细胞培养过夜。
高通量转染步骤对于2,368个cDNA克隆收集样品筛选,将330μg pGL3B-IL-8P-Luc报告质粒重悬于50ml锥形管中的33ml OptiMEM I低血清培养基中,报告质粒最终量为每次转染100ng。将管振荡并分成4×8ml等分试样。转染之前,将0.8ml Fugene 6转染试剂(Roche Applied Bioscience)加入每个8ml等分试样中(4μl Fugene 6/μg转染DNA)。通过吸量管上下吹吸几次混合内容物并以75μl/孔分配于96-孔清洁PCR板(ABGene)中。使用BiomekFX吸量装置(pipetting station)(Beckman Coulter,Fullerton,CA)在包含6μl预稀释cDNA的每个子板的每个孔中加入10μl[OptiMEM-报告子-Fugene 6]混合物。板#24的最后一排用于pCMV-Sport6空载体等分试样作为阴性对照或者用于编码对应人MEKK1 AA360-672的序列的pFC-MEKK表达构建体(Stratagene)作为阳性对照。两种质粒都预稀释为20ng/μl并且等分为每孔6μl。室温孵育15分钟后,将13μl最终混合物转移至96-孔HeLa培养板中。将细胞在含5%CO2的空气中37℃孵育48小时。
对于20,702个cDNA克隆集合的筛选,将1.65mg pGL3B-IL-8P-Luc报告质粒重悬于250ml锥形烧瓶(Corning)中的100ml OptiMEM I中,报告质粒的最终量为每次转染50ng。将烧瓶振荡并分为8ml的等份试样。转染之前,将0.65ml Fugene 6转染试剂加入每个8ml等份试样中(3μlFugene/μg转染DNA)。通过吸量管上下吹吸几次混合内容物并以75μl/孔分配于96-孔清洁PCR板(ABGene)中。使用BiomekFX(Beckman)在包含4μl预稀释cDNA的每个384-孔子板的每个孔中加入3μl[OptiMEM-报告子-Fugene 6]混合物。室温孵育15分钟后,将7μl混合物从每个孔转移至384-孔组织培养板中。将细胞在含5%CO2的空气中37℃孵育48小时。
萤光素酶测定按照制造商所提供的方案使用BrightGlo萤光素酶测定系统(Promega,Madison,WI)测定转染48小时后萤火虫萤光素酶活性。简而言之,使用Multidrop 384(Thermo Labystems,Beverly,MA)分别将90μl或40μl新鲜重构的萤光素酶试剂加入到96-孔或384-孔组织培养板的每孔中。孵育2分钟后,按照制造商说明书使用400毫秒积分时间在LUMINOSKANAscent发光计(Thermo Labsystems)上读取发光值。
克隆检索用于采样点证实对于每次初级测定,按照常规方法计算针对群体中位数的Z得分和激活倍数并保存于带注释的可检索数据库中。基于两条标准选择了潜在采样点(1)Z得分大于3.0和(2)激活倍数在2,368和20,702个cDNA克隆集合筛选中分别大于10和5。从甘油原种(重排阵列板的拷贝1)检索2,368个克隆亚阵列的初级测定中作为采样点的克隆得分。通过再转化库中的DNA等份试样回收全部20,702个克隆集合的初级测定的采样点。在XL-10 Gold细菌(Stratagene)中进行转化。将每个克隆在LB培养基琼脂糖平板+抗生素(100μg/ml氨苄青霉素)(KD Medical,Columbia,MD)上划线培养,37℃生长过夜并从每个板挑取3个菌落,生长于深孔96孔板中,每个孔含有995μl Terrific液体培养基(KD Medical)+100μg/ml氨苄青霉素。使用带气孔的胶带覆盖这些深孔板,并在37℃孵育过夜,以300转/分钟转速摇动。如上所述进行DNA小量制备。然后将全部DNA制备物稀释至125ng/μl(在浓度大于125ng/μl的孔中)并取8μl用于DNA序列确证。将剩余DNA稀释至25ng/μl并将6μl DNA转移至子96-孔PCR板(ABGene)中并用于使用上述转染步骤进行验证实验。为了标准化转染效率,每次转染中包括了20ng编码SV40早期启动子控制下的海肾萤光素酶基因的pRL-SV40(Promega)。使用DualGlo萤光素酶测定系统(Promega)按照制造商所提供的方法测定萤火虫和海肾萤光素酶的活性。简而言之,使用Multidrop 384将90μl新鲜重构的萤光素酶试剂加入到96-孔组织培养板每孔中并且,在孵育15分钟后,在LUMINOSKAN Ascent发光计上使用400毫秒积分时间读取发光值。随后将90μl Stop-and-Glo试剂加入到96-孔组织培养板每个孔中并且,在孵育15分钟后,LUMINOSKAN Ascent发光计上使用200毫秒积分时间读取发光值。使用基于不同萤光素酶的启动子构建体pCRE-Luc、p MCS-Luc(Stratagene)、pTAL-Luc(BD Biosciences)、pNF-kB-Luc(BD Biosciences)、pIL-8P-Luc、pRhoBP-Luc(按照常规方法室内制备/BD Biosciences)和pVCAMP-Lue(如Iademarcom,M.F.,J.J.McQuillan,G.D.Rosen和D.C.Dean.1992.J Biol Chem 26716323-9中所述制备)测试所选克隆的特异性。
HeLa细胞中IL-8酶联免疫吸附测定使用上述方案用选自验证并确证采样点的序列的DNA样本以每孔100ng在96孔板(Costar)中转染HeLa细胞。命名为共激活子的DNA样品以25ng每孔进行共转染。空载体pCMV-Sport6用作阴性对照。转染72小时后,使用IL-8酶联免疫吸附测定试剂盒(Sigma)按照所提供的方案测定对应1-5μl条件生长培养基的预稀释等份细胞生长培养基中IL-8含量。作为阳性对照,生长培养基选自使用空载体转染的细胞并且在收集用于IL-8测定的生长培养基之前分别用5ng/mlIL-1和50ng/ml TNFα(R&DSystems)处理16小时。
使用Affymetrix DNA微阵列芯片的基因表达谱使用Targefect F1转染试剂(Targeting Systems,Santee,CA)按照随产品提供的方案用文中所述CREAP1或含有relA(Ruben SM等,Science1991 Mar 22;251(5000)1490-3)、MAP3K11(Hartkamp,J.等,(1999).Cancer Res.59,2195-2202)或ANKRD3(Muto,A.等,(2002)J.Biol.Chem.277,31871-31876)的表达构建体转染HeLa细胞。简而言之,70-80%汇合于T75组织培养瓶中(Falcon)的HeLa细胞用于转染。转染混合物如下制备将20μg所选质粒DNA加入含有8ml Opti-MEM I的50ml锥形管(Falcon)并轻弹该管混合。用pCMV-Sport6空载体提供两种转染。以全速涡旋Targefect F-1贮存液20秒并取40μl加入每个管,再次通过轻弹管混合并在室温孵育30分钟以允许形成转染复合体。用20ml Opti-MEM I培养基洗涤HeLa细胞两次并在每个1T75培养瓶中加入12ml每种转染复合体。37℃孵育4小时后,将8ml含血清的生长培养基加入每个培养瓶。第二天更换培养基。转染56后小时再次更换培养基并且向一个用pCMV-Sport6质粒转染的培养瓶加入50ng/ml的TNFα(R&D Systems)并在37℃继续孵育16小时。转染后72小时将细胞收集于10ml TRIzol试剂(Gibco BRL)中并冻存于-80℃。按照随TRIzol试剂提供的方法分离总RNA。按照常规方法进行双链cDNA探针的合成标记、Affymetrix基因芯片(Gene-Chip)杂交和数据分析(也见Eberwine,J.等,J.Neurosci.21,8310-8314和Hakak,Y.等,(2001)Proc.Natl.Acad.Sci.U.S.A 98,4746-4751)。
实施例6IL8P萤光素酶载体的表征通过细胞因子介导的基因表达的已知调节子测试了由包含人IL-8启动子片段的1.5kB IL-8启动子控制的萤光素酶报告基因的可诱导性。将pNF-κB-Luc(BD Biosciences)和pGL2-IL-8P-Luc报告基因共转染入含有表达构建体的HEK 293细胞,该表达构建体编码按照常规方法使用专有的克隆集合制备的NF-κB通路激活子——截短的MEKK(AA 360-672)(Stratagene)和全长TRAF6 cDNA。用空pCMV-Sport6载体共转染的细胞或者不处理或者用TNFα(50ng/ml,处理16小时)处理。转染后48小时测定萤光素酶活性。pNF-κB-Luc报告子用作阳性对照。
数据表明MEKK、TRAF6和TNFα显著激活IL-8启动子-报告子,分别增加报告子基因活性16、4.9和4.7倍。对于我们专有的cDNA克隆集合的高通量功能筛选,将IL-8启动子序列亚克隆入pGL3Basic载体(Promega),该载体是最初pGL2载体的衍生物,其具有提高的特异性和效率。
实施例7对20,000 cDNA集合进行基于IL-8启动子的功能筛选和采样点活性的验证在384-孔板中将pGL3B-IL-8P-Luc与20,702个单独全长cDNA克隆共转染入HeLa细胞并且如上所述转染后48小时进行了单一报告子测定。将pCMV-Sport6与报告子共转染作为阴性对照。使用BrightGlo报告子测定系统(Promega)测定了萤光素酶活性。确定了IL-8启动子报告子活性的绝对值并且鉴定出分值比pCMV-Sport6质粒对照高出5-倍的克隆(数据未显示)。为了验证这些采样点的身份和活性,如上所述回收克隆,并分离出3个独立的菌落。小量制备DNA用于序列验证和使用IL-8P-Luc报告子进行二次测定(数据未显示)。
对在二次测定中对IL-8P-Luc报告子产生显著激活的各个克隆分离物测试了其激活7种启动子萤光素酶报告子构建体的能力pTAL、NF-kB-Luc、IL-8P-Luc、RhoBP-Luc、VCAMP-Luc(BD Biosciences)(与加入4个CRE效应元件的pTAL相同)。
基于预测或表征基因起始密码子的存在从cDNA 12,905个克隆的单一5’末端序列选择了cDNA克隆,其中cDNA 12,905个克隆是与RefSeq基因相匹配的,其中5,463个基因是有功能注释的。将20,704个cDNA与IL-8启动子控制的萤火虫萤光素酶报告基因(pIL-8-Luc)共转染。64个cDNA诱导报告子大于5倍。所验证的活性cDNA包括28个独特基因的1-3个拷贝。选择了22种非冗余cDNA用于进一步研究。在测定中还对全部集合筛选环AMP效应元件(CRE)或血清效应元件(SRE)驱动的报告子的激活。使用层级聚类(hierarchical clustering)(Eisen)将在初级筛选中使用22种cDNA获得的结果进行归类以确定是否有基因在三个测定中都表现出相关活性。许多基因对于IL-8报告子相对特异。这些基因包括NF-κB的已知的诱导子并且由NF-κB转录因子的亚单位relA(p65)、TNF受体超家族成员1A、TNF相关分子TWEAK/TNFSF12、RIPK2和TRAF6、最新鉴定的NF-κB激活子ACT1和激酶PKK代表。第二组代表AP-1转录因子位点激活子,包括JunD和JNK-诱导的MAP激酶MAP3K12和MAP3K11的多个克隆。还鉴定出-C/EBPβ,已知其直接结合至IL-8启动子NF-IL6位点。因此,初级筛选鉴定出预测通过许多不同途径激活IL-8基因的多种诱导物。
CREAP1属于所获得的采样点。因此数据表明CREAP1是CRE-Luc和IL-8P-Luc构建体的强激活子。事实上,该种迄今未知功能的蛋白质不仅显示为是CRE的最强的激活子(甚至强于两种CRE结合反式激活蛋白CRE-BRa和CREB1(数据未显示)并且证实结果公开于上面提供的实施例中)而且还是这些次级测定中发现的IL-8基因的最强激活子。
实施例8CREAP1强烈激活携带串联IL-8启动子特异CRE-样元件的报道子为了确定是否所述强激活子也诱导内源IL-8基因,用作为NF-κB和AP-1激活子的实例的relA和MAP3K11构建体转染后测定了从HeLa细胞所分泌的IL-8蛋白质的积累。MAP3K11和relA诱导小的增加,但是两者的组合诱导的分泌IL-8的水平比得上用IL-1β——一种已知的IL-8最有效的诱导物——所观察到的结果。该数据表明内源性IL-8基因的调节需要多种信号转导途径的相互作用。
鉴定了几种作用机制仍然不清楚的cDNA。这些包括两种Rho-依赖GTP-GDP增强因子(Rho-GEFs)、p114和ARHGEF1、C16orf15、促甲状腺素细胞胚胎因子1(TEF1)、纤连蛋白(FN1)和核受体家族成员NR2F2。C16orf15编码未知功能的富含脯氨酸蛋白质,其在脑中高水平表达。TEF1是直接通过TEF效应元件起作用的碱性亮氨酸拉链转录因子的成员。FN1是在损伤组织中高水平表达的基质糖蛋白并且它还能够通过AP-1-依赖机制诱导IL-1β。NR2F2在全部测定中都是非常强的激活子并且因此其活性表现为非特异的。
几种最强的IL-8激活子是与CRE-依赖性基因表达相关的。C/EBPβ、JunD、c-jun、CRE结合蛋白质CREB1、CRE-BPa和XBP1发现是CRE-驱动报告子的有效诱导物。还将与收录为KIAA0616和MECT1的序列重叠的cDNA鉴定为上述的CREAP1基因。有意思地是,除了在粘液表皮样癌中编码MECT1前44个氨基酸的序列易位至Mastermind-样基因MAML2(Tonon等,Nat.Genet.,33208-213(2003))外,关于该蛋白质一无所知。
许多最强的IL-8激活子也是CRE激活子或结合蛋白质的这一观察暗示IL-8启动子可能含有未识别的CRE。首先通过使用植物双萜forskolin(Sigma)即腺苷酸环化酶的一种非特异激活剂检测提高的cAMP水平对IL-8启动子的效应对所述暗示进行了测试。简而言之,使用Fugene6转染试剂(Roche)如上所述用pCRE-Luc或pIL-8-Luc与空载体或CRE-BPa表达构建体共转染HEK 293细胞。转染16小时后,将含有500μM IBMX的等体积生长培养基加入孔中。8小时后,向将来自在生长培养基上制备的50μM贮存液的用IBMX预处理的细胞加入forskolin使终浓度达到5μM。在37℃用forskolin处理细胞16小时。使用Dual-Glo测定试剂盒(Promega)测定萤光素酶活性并如上所述进行标准化。数据表示为与用空载体转染的未处理细胞相比的诱导倍数。结果表明forskolin微弱诱导IL-8报告子。共转染在筛选中发现的CRE结合蛋白质CRE-BPa当forskolin处理时协同地激活IL-8启动子。
然后使用标准技术,检测IL-8启动子序列中潜在CRE序列的存在。在IL-8启动子的-69和-62之间发现了具有序列5’-TGACATAA-3’的潜在不对称变体CRE,以前已经将其作为AP-1结合序列提到但其功能还没有报道(Roebuck,J.Interferon and Cytokine Res.19429-438(1999))。我们将该位点命名为“CRE-样效应元件”。带有相同DNA序列的寡核苷酸显示被CREB2很好地结合并且被CREB1很差地结合(Benbrook和Jones,Nucleic Acids Res.,221463-1469(1994))。有趣地是,已提出CREB2作为转录激活子/抑制子起着双重作用。认为结合到“CRE-样效应元件”的CREB2会损害激活蛋白质如CREB的结合并因此抑制CRE-依赖的转录(Karpinski等,Proc.Natl.Acad.Sci.U.S.A.894820-4824(1992))。另一方面,CREB2与其它转录因子如c-Rel、ATF-1或者病毒蛋白质Tax结合能够激活这些情况中的几种基因的转录(Schoch等,Neurochem.Int.38601-608(2001))。
研究了通过MAP3K11和CREAP1诱导IL-8启动子的机制。为了确定是否启动子元件需要由这些基因激活,建立了一系列在IL-8CRE-样调节位点和其它调控位点中带有突变的启动子变体,并测试了MAP3K11、CREAP1或relA的诱导作用。结果表明C/EBP结合位点的突变对任一蛋白质的激活作用没有影响。NF-κB位点突变对MAP3K11或CREAP1的诱导作用具有很小的影响但消除了relA的诱导作用。AP-1位点的突变不显著改变relA的作用但严重降低了MAP3K11的诱导作用。这与MAP3K11激活JNK/SAPK途径和AP-1的能力相一致。令人惊奇地是,该突变还显著降低了CREAP1的激活作用。CRE-样位点的突变急剧降低了或消除了CREAP1和MAP3K11的诱导作用(数据未显示)。
为了确定是否“CRE-样元件”直接对CREAP1或MAP3K11做出反应,检测了这两种基因激活携带多联体CRE-样位点的最小启动子(pCREL-Luc)的能力。另外,我们研究了已知的AP-1诱导物PMA的作用。与CRE报告子(pCRE-Luc)相似,pCREL-Luc被CREAP1强烈激活但不被MAP3K11或PMA处理激活(数据未显示)。该数据表明尽管CREAP1和MAP3K11对于它们的活性都需要完整CRE-样和AP-1位点,它们分别使用作为其主要效应元件的CRE-样或AP-1位点通过不同机制诱导IL-8启动子。
我们进一步测定了是否CREAP1-诱导的pIL-8-Luc报告子活性依赖于CREB。CREAP1和CREB的显性失活形式KCREB(BD Biosciences)的共表达导致CREAP1-诱导的IL-8启动子活性显著降低(数据未显示)。相反,用I-ΚBα组成型活性形式-NF-ΚB途径的有效抑制剂-共转染未影响CREAP1的活性。
为了确定CREAP1与CRE和AP-1结合位点的相互作用是否与相同或不同结构域相关,我们使用常规方法构建了携带从N-和C-末端缺失的CREAP1的几种变体并测试了这些变体影响CREAP1或MAP3K1激活plL-8-Luc报告子的能力。包含59个N-末端氨基酸缺失的突变体(δ59)降低了野生型CREAP1并极大地抑制了MAP3K11诱导IL-8报告子表达的能力(数据未显示)。由于δ59对relA的激活作用没有影响,所以抑制是特异的。δ59还阻断了PMA或者MAP3K11对含有重复AP-1位点的AP-1特异报告子pAP1(PMA)-Luc的激活(数据未显示)。同时δ59不能阻断forskolin刺激的pCRE-Luc报告子(数据未显示)。此数据表明当CREAP1以CREB-依赖方式通过CRE激活表达时,该蛋白质可能与AP-1激活的必需成分直接或间接相互作用。
实施例9用CREAP1瞬时转染的HeLa细胞中的基因表达谱为了确定CREAP1是否调节真正CREB靶的表达,过表达CREAP1后使用DNA微阵列测定了细胞基因的表达。简而言之,使用Targefect F1试剂(Targeting Systems)用pCMV-Sport6、CREAP1瞬时转染HeLa细胞。将一半pCMV-Sport6转染细胞不处理并且用作阴性对照。如上所述进行总RNA分离、标记探针制备和DNA微芯片杂交方案。
有趣地是,结果表明CREAP1转染时HeLa细胞内的基因表达谱明显不同于其它激活子,不同之处在于已知依赖于cAMP/CREB途径的基因特别丰富。具体而言,CREAP1转染诱导7种基因增加10倍(见表2)。其他基因包括CREB和cAMP的众所周知的靶标,包括TSHα、烯醇丙酮酸磷酸羧激酶(PEPCK)、晶体蛋白α-B和EGF-样分子双调蛋白。CREAP1还以较低程度激活CREM(已知cAMP水平上升时被诱导的另一种基因)。诱导c-Jun和AP-1的已知的靶标PAI-2的MAP3K11不影响该组基因(Arts等,1996,Eur.J.Biochem 241393-402)。因此,CREAP1是真正的CREB靶基因的诱导剂。
筛选中所鉴定的每种激活子还能相对较小程度激活(2-5倍)内源性IL-8基因。与使用人工报告基因构建体所观察到的强激活作用相比内源性IL-8基因的弱激活作用可能是由于需要通过上述多种途径激活。我们还使用层级聚类算法分析了HEK293细胞中由CREAP1或蛋白激酶A(PKA)催化亚基过表达时差别调节的几套基因。我们还发现尽管两种蛋白质都通过CREB起作用,但是上调和下调的基因群不完全重叠。数据表明CREAP1可以提供激活转录的众所周知的磷酸化依赖机制的备选机制。

表2通过CREAP1诱导cAMP反应基因。显示了通过Affymetrix基因芯片所检测的由CREAP1最强烈诱导的基因mRNA水平增加的倍数。还显示了IL-8转录物诱导水平的比较。这些基因仅是由CREAP1诱导>10倍的基因并且在重复实验中都发现了。计算了与用对照pCMV-Sport6载体转染后所观察到的表达水平相比较的增加倍数。
由CREAP1最强烈诱导的两种基因是cAMP的已知靶标,这两种基因是烯醇丙酮酸磷酸羧激酶(PEPCK或者PCK1)(Roesler,W.J.Mol.CellEndocrinol.1621-7(2000))和促甲状腺激素α(TSHα)的基因(Kim,D.S等Mol Endocrinol.8528-36(1994))。据报道第三种高度调节的基因即双调蛋白在一些癌细胞系中的表达依赖于PKA(Bianco,C.G.等,Clin.Cancerres.3439-48(1997))并且我们已经鉴定出了在小鼠和人基因中完全保守的近端双调蛋白启动子共有CRE位点(数据未显示)。
两种由CREAP1最高度诱导的内源基因不是cAMP或CREB蛋白质的已知靶标。第一种是CAPL;第二种是趋化因子Exodus-1(也已知为CCL27、MIP-3α或LARC)。有趣地是,Exodus-1基因也是趋化因子并且以与IL-8基因非常相似的方式受到调节,因为据报导近端启动子包含NF-kB、AP-1和NF-IL6/C/EBP位点。CREAP1还以比诱导内源性IL-8基因更大程度诱导Exodus-1基因。还注意到CREAP1是比TNF-α或NF-κB更强的Exodus-1诱导物(数据未显示)。还不知道Exodus-1启动子是否包含未认识的CRE或者CREAP1是否通过所讨论的变体AP-1位点起作用。然而,CREAP1对Exodus-1表达的激活作用表明Exodus-1基因将通过cAMP或其它CREB诱导途径受到调节。
还没有描述CAPL、KIAA0467和DKFZp566K192基因的启动子。我们检查了CAPL启动子的潜在CREAP1-效应元件,对于该启动子没有报导明显的CRE。在PEPCK启动子(核苷酸-249到-256)和CAPL启动子(核苷酸-385到-392)中发现了一种命名为CRE-样2的具有序列5’-TGACACAA-3’的序列。将CRE-样2元件置于最小启动子的上游并测试了CREAP1的诱导作用。该元件足以介导CREAP1的诱导作用。与IL-8启动子相似,IL-8CRE-样和CRE-样2序列都受到升高的cAMP适度激活并且由cAMP和CRE-BPa协同激活。因此,能够通过cAMP途径而不通过CREB1激活CREAP1反应元件,因为IL-8启动子中发现的CRE-样元件和CAPL和PEPCK启动子中发现的CRE-样2元件不可能被CREB1识别。
CREAP是吸引人的药物发现靶标。如果CREAP的功能是通过CREB与其它转录因子的相互作用调节CREB-调节基因特定亚组,那么CREAP是药物发现的吸引人的靶标是特别正确的。由于存在大量CREB反应基因,所以直接影响CREB的任意拮抗剂或激动剂将可能具有多种效应。另一方面,CREAP功能的调节子可能具有阻断基因特定亚组的能力,例如阻断趋化因子例如IL-8和Exodus-1以治疗自身免疫病和炎性疾病、阻断双调蛋白以治疗增殖疾病和阻断PEPCK用于治疗糖尿病,因为全部这些基因都是由CREAP1高度诱导的。
实施例10CREAP2的鉴定将CREAP1的完整氨基酸序列用于公共NCBI数据库的BLASTP检索。最初鉴定了与CREAP1编码区具有显著同源性的两个公共结构域cDNA(XM_117201和FLJ00364)。将XM_117201的核苷酸序列用于专有的cDNA文库EST数据库的BLASTN检索(Altschul S.F.等,NucleicAcids Res.253389-3402(1997))并且鉴定了代表XM_117201公共序列的4种克隆。使用与上述那些公开的方法相似的方法用最初发现由CREAP诱导的CRE-Luc和IL-8p-Luc报告子共转染后对4种克隆进行了功能测试。简而言之,将胰酶消化的HeLa细胞以6×104细胞/ml重悬于完全生长培养基并且以每孔100μl的体积分布于白色96孔板(Costar)。将细胞在37℃并含5%CO2的组织培养箱中培养过夜。将pGL3B-IL-8P-Luc报告子质粒或CRE-Luc报告子(BD Biosciences)以及所测试的cDNA以25ng/ml重悬于OptiMEM I低血清培养基(GIBCO BRL)。然后分别以4μl/孔和3μl/孔将报告子质粒和cDNA分布于96孔清洁PCR板(ABGene)。以每孔10μl体积将包含每次转染1.5μl的Fugene 6试剂(Roche AppliedBioscience)和每次转染20ng的pRL-SV40(Promega)质粒的混合物加入含有预稀释cDNA的96孔PCR板。用移液器混合每孔的内容物并在室温放置10分钟。从每孔中取15μl转染混合物转移至96孔组织培养板。将细胞孵育48小时。
使用DualGlo萤光素酶测定系统(Promega)按照制造商所提供的方案测定萤火虫和海肾萤光素酶的活性。简而言之,用Multidrop 384将115μl新鲜配制的萤光素酶试剂加入到96孔组织培养板的每一个孔中并且,孵育15分钟后在LUMINOSKAN Ascent发光计(Thermo Labsystems)上以400毫秒积分时间读取发光值。随后,将115μl Stop-and-Glo试剂加入到96孔组织培养板的每一个孔中并且,孵育15分钟后在LUMINOSKAN Ascent发光计(Thermo Labsystems)上以200毫秒积分时间读取发光值。以相应萤火虫和海肾萤光素酶活性的比率测定每种所测试的cDNA的活性。
4种克隆中一种克隆显示是有活性的。该克隆的插入片段在一个方向上进行全部测序并显示编码586个氨基酸的ORF,其与XM_117201 cDNA所预测的公共结构域蛋白质XP_117201完全重叠。该克隆注释为CREAP2并编码693个氨基酸的预测蛋白质,其起始密码子在核苷酸177处且TGA编码的终止密码子在2256处。尽管对文献检索表明存在编码部分CREAP2的cDNA,但没有提供包含人CREAP2的全部序列的CDMA并且也未提供该蛋白质的功能。
下面显示了人CREAP2的核苷酸序列。起始密码子定位于核苷酸177并且TGA编码的终止密码子定位在2256,以斜体表示ANTTTTTGTACANAAAAGCAGGCTGTTACCGGTCCGGATTCCCGGGATCTAGGCTGGGGC 60CGGGTTCGCGGTGCTCGCTGAGGCGGCGGTGGCTACGGCTGGAGGAGCCGGGCCGAGGCC 120GCGGCGGAGGCCGCGGCTGGTACTGGGAGGGTGGCAGGGAGGGACGGGGAAGGAAGATGG 180CGACGTCGGGGGCGAACGGGCCTGGTTCGGCCACGGCCTCGGCTTCCAATCCGCGCAAAT 240TTAGTGAGAAGATTGCGCTGCAGAAGCAGCGTCAGGCCGAGGAGACGGCGGCCTTCGAGG 300AGGTGATGATGGACATCGGCTCCACCCGGTTACAGGCCCAAAAACTGCGACTGGCATACA 360CAAGGAGCTCTCATTATGGTGGGTCTCTGCCCAATGTTAACCAGATTGGCTCTGGCCTGG 420CCGAGTTCCAGAGCCCCCTCCACTCACCTTTGGATTCATCTCGGAGCACTCGGCACCATG 480GGCTGGTGGAACGGGTGCAGCGAGATCCTCGAAGAATGGTGTCCCCACTTCGCCGATACA 540
CCCGCCACATTGACAGCTCTCCCTATAGTCCTGCCTACTTATCTCCTCCCCCAGAGTCTA 600GCTGGCGAAGGACGATGGCCTGGGGCAATTTCCCTGCAGAGAAGGGGCAGTTGTTTCGAC 660TACCATCTGCACTTAACAGGACAAGCTCTGACTCTGCCCTTCATACAAGTGTGATGAACC 720CCAGTCCCCAGGATACCTACCCAGGCCCCACACCTCCCAGCATCCTGCCCAGCCGACGTG 780GGGGTATTCTGGATGGTGAAATGGACCCCAAAGTACCTGCTATTGAGGAGAACTTGCTAG 840ATGACAAGCATTTGCTGAAGCCATGGGATGCTAAGAAGCTATCCTCATCCTCTTCCCGAC 900CTCGGTCCTGTGAAGTCCCTGGAATTAACATCTTTCCATCTCCTGACCAGCCTGCCAATG 960TGCCTGTCCTCCCACCTGCCATGAACACGGGGGGCTCCCTACCTGACCTCACCAACCTGC 1020ACTTTCCCCCACCACTGCCCACCCCCCTGGACCCTGAAGAGACAGCCTACCCTAGCCTGA 1080GTGGGGGCAACAGTACCTCCAATTTGACCCACACCATGACTCACCTGGGCATCAGCAGGG 1140GGCATGGGCCTGGGCCCGGCTATGATGCACCAGGACTTCATTCACCTCTCAGCCACCCAT 1200CCCTGCAGTCCTCCCTAAGCAATCCCAACCTCCAGGCTTCCCTGAGCAGTCCTCAGCCCC 1260AGCTTCAGGGCTCCCACAGCCACCCCTCTCTGCCTGCCTCCTCCTTGGCCTGCCATGTAC 1320TGCCCACCACCTCCCTGGGCCACCCCTCACTCAGTGCTCCGGCTCTCTCCTCCTCCTCTT 1380CCTCCTCCTCCACTTCATCTCCTGTTTTGGGCGCCCCCTCTTACCCTGCTTCTACCCCTG 1440GGGCCTCCCCCCACCACCGCCGTGTGCCCCTCAGCCCCCTGAGTTTGCTCGCGGGCCCAG 1500CCGACGCCAGAAGGTCCCAACAGCAGCTGCCCAAACAGTTTTCGCCAACAATGTCACCCA 1560CCTTGTCTTCCATCACTCAGGGCGTCCCCCTGGATACCAGTAAACTGTCCACTGACCAGC 1620GGTTACCCCCCTACCCATACAGCTCCCCAAGTCTGGTTCTGCCTACCCAGCCCCACACCC 1680CAAAGTCTCTACAGCAGCCAGGGCTGCCCTCTCAGTCTTGTTCAGTGCAGTCCTCAGGTG 1740GGCAGCCCCCAGGCAGGCAGTCTCATTATGGGACACCGTACCCACCTGGGCCCAGTGGGC 1800ATGGGCAACAGTCTTACCACCGGCCAATGAGTGACTTCAACCTGGGGAATCTGGAGCAGT 1860TCAGCATGGAGAGCCCATCAGCCAGCCTGGTGCTGGATCCCCCTGGCTTTTCTGAAGGGC 1920CTGGATTTTTAGGGGGTGAGGGGCCAATGGGTGGCCCCCAGGATCCCCACACCTTCAACC 1980ACCAGAACTTGACCCACTGTTCCCGCCATGGCTCAGGGCCTAACATCATCCTCACAGGGG 2040ACTCCTCTCCAGGTTTCTCTAAGGAGATTGCAGCAGCCCTGGCCGGAGTGCCTGGCTTTG 2100AGGTGTCAGCAGCTGGATTGGAGCTAGGGCTTGGGCTAGAAGATGAGCTGCGCATGGAGC 2160CACTGGGCCTGGAAGGGCTAAACATGCTGAGTGACCCCTGTGCCCTGCTGCCTGATCCTG 2220CTGTGGAGGAGTCATTCCGCAGTGACCGGCTCCAATGAGGGCACCTCATCACCATCCCTC 2280TTCTTGGCCCCATCCCCCACCACCATTCCTTTCCTCCCTTCCCCCTGGCAGGTAGAGACT 2340CTACTCTCTGTCCCCAGATCCTCTTTCTAGCATGAATGAAGGATGCCAAGAATGAGAAAA 2400AGCAAGGGGTTTGTCCAGGTGGCCCCTGAANTCTGCGCAAGGGATGGGCCTGNGGGGAAC 2460CTCANGGNNAGGGCCCAANGGCCACTTNNAANCTTTGAACCGTCNGTCTGGNANGGTCNN 2520(SEQ ID NO 15)下面显示了人CREAP2的预测氨基酸序列MATSGANGPGSATASASNPRKFSEKIALQKQRQAEETAAFEEVMMDIGSTRLQAQKLRLAYTRSSHYGGSLPNVNQIGSGLAEFQSPLHSPLDSSRSTRHHGLVERVQRDPRRMVSPLRRYTRHIDSSPYSPAYLSPPPESSWRRTMAWGNFPAEKGQLFRLPSALNRTSSDSALHTSVMNPSPQDTYPGPTPPSILPSRRGGILDGEMDPKVPAIEENLLDDKHLLKPWDAKKLSSSSSRPRSCEVPGINIFPSPDQPANVPVLPPAMNTGGSLPDLTNLHFPPPLPTPLDPEETAYPSLSGGNSTSNLTHTMTHLGISRGHGPGPGYDAPGLHSPLSHPSLQSSLSNPNLQASLSSPQPQLQGSHSHPSLPASSLACHVLPTTSLGHPSLSAPALSSSSSSSSTSSPVLGAPSYPASTPGASPHHRRVPLSPLSLLAGPADARRSQQQLPKQFSPTMSPTLSSITQGVPLDTSKLSTDQRLPPYPYSSPSLVLPTQPHTPKSLQQPGLPSQSCSVQSSGGQPPGRQSHYGTPYPPGPSGHGQQSYHRPMSDFNLGNLEQFSMESPSASLVLDPPGFSEGPGFLGGEGPMGGPQDPHTFNHQNLTHCSRHGSGPNIILTGDSSPGFSKEIAAALAGVPGFEVSAAGLELGLGLEDELRMEPLGLEGLNMLSDPCALLPDPAVEESFRSDRLQ (SEQ ID NO 16)实施例11CREAP3的鉴定使用与上述公开方法相似的方法,通过与公共结构域克隆cDNAFLJ00364的序列相比较在我们专有的cDNA文库EST数据库中发现了一个克隆。由FLJ00364所编码的预测蛋白质缺乏起始密码子ATG并且具有与CREAP1非同源的N-末端序列。公共结构域克隆序列与我们数据库中的相似克隆相比较的结果显示我们专有克隆序列在序列CCGTCATTTCACCAAGC(SEQ ID NO 17)中含有额外的C,其中下划线所标出的为该额外的C。通过与基因组序列进行比较证实了该额外的C。该变化导致由FLJ00364 cDNA所预测的前63个氨基酸的去除,并且高度保守的氨基酸序列EETRAFE(SEQ ID NO 18)起始处的框内另外81个氨基酸替换为CREAP1预测蛋白质序列E23ETAAFE(SEQ ID NO 19)。
进行三轮连续的聚合酶链式反应(PCR)以获得专有克隆的完整ORF。PCR扩增循环为94℃2分钟,23×[94℃15秒,68℃30秒和72℃15秒]和72℃2分钟。使用Advantage 2 DNA聚合酶(BD Biosciences)进行全部扩增步骤。使用具有对应ORF起始部分的核苷酸序列(5’-CCGGAATTCGCCATGGCCGCCTCGCCGGGCTCGGG-3’)(SEQID NO 20)的共同有义引物KIAAhS3_R1扩增全部三种PCR产物。使用常规方法将EcoRI限制性酶切位点包括于引物的5’末端序列。对于最初的PCR,将人基因组DNA(BD Biosciences)用作模板(每个反应2mg),并且反义引物为KIAAhAS2(5’-CCGCGACAGGGTGAGGTCGGTCATGAGCTGCTCGAAGGCCCGCG-3’)(SEQ ID NO 21)。使用苯酚-氯仿混合物抽提142ntPCR产物并用异丙醇沉淀。用冰预冷的70%乙醇洗涤沉淀并重悬于TE缓冲液。取5ng产物用作第二轮PCR反应的模板,使用KIAAhS3_R1有义引物和KIAAhAS3(5’-GAAGCTTCTGAAATTGAACCCGCGACAGGGTGAGGTCGGTCATG-3’)(SEQ ID NO 22)反义引物。将161nt PCR产物进行与最初PCR产物相似的处理并取5ng重悬的DNA作为最后一轮PCR的模板,使用KIAAhS3_R1有义和 KIAAhAS4(5’-TGGTAAGGATCCTCCATGGTACTGTGTAAGGCGCAGTTGCTGAAGCTTCTGAAATTGAACCCG-3’)(SEQ ID NO 23)反义引物。全部引物从SIGMA-Aldrich公司(Saint Louis,MO,USA)获得或者按照常规方法制备。
将202nt产物进行凝胶纯化并用EcoRI和BamHI酶切并插入专有克隆的EcoRI/BamHI消化的质粒中。将重建的全长FLJ00364 cDNA的16个不同的克隆进行序列验证并使用CRE-Luc和IL-8p-Luc报告子如上所述进行功能性测试。将不合PCR-导入的错配并强烈激活两种报告子的#5克隆用于DNA和蛋白质比对并且已经注释为CREAP3。
下面提供了CREAP3的核苷酸序列。斜体显示在核苷酸46的起始密码子和在1905处的TGA终止密码子。值得注意由于基因组序列和专有的克隆序列的比较,已经加入粗体下划线显示的残基288处C。加下划线的CGAGG序列表明专有克隆的5’-末端。以基因组DNA为模板通过PCR扩增该序列上游的核苷酸序列并如上所述重新插入专有克隆。
CREAP3的核苷酸序列NTTTTTTGTACANAAAAGCAGGCTGTTACCGGTCCGGAATTCGCCATGGCCGCCTCGCCG60GGCTCGGGCAGCGCCAACCCGCGGAAGTTCAGTGAGAAGATCGCGCTGCACACGCAGAGA120CAGGCCGAGGAGACGCGGGCCTTCGAGCAGCTCATGACCGACCTCACCCTGTCGCGGGTT 180CAATTTCAGAAGCTTCAGCAACTGCGCCTTACACAGTACCATGGAGGATCCTTACCAAAT240GTGAGCCAGCTGCGGAGCAATGCGTCAGAGTTTCAGCCGTCATTTCACCAAGCTGATAAT 300GTTCGGGGAACCCGCCATCACGGGCTGGTGGAGAGGCCATCCAGGAACCGCTTCCACCCC360CTCCACCGAAGGTCTGGGGACAAGCCAGGGCGACAATTTGATGGTAGTGCTTTTGGAGCC420AATTATTCCTCACAGCCTCTGGATGAGAGTTGGCCAAGGCAGCAGCCTCCTTGGAAAGAC480GAAAAGCATCCTGGGTTCAGGCTGACATCTGCACTTAACAGGACCAATTCTGATTCTGCT540CTTCACACGAGTGCTCTGAGTACCAAGCCCCAGGACCCCTATGGAGGAGGGGGCCAGTCG600
GCCTGGCCTGCCCCATACATGGGGTTTTGTGATGGTGAGAATAATGGACATGGGGAAGTA 660GCATCTTTCCCTGGCCCATTGAAAGAAGAGAATCTGTTAAATGTTCCTAAGCCACTGCCA 720AAACAACTGTGGGAGACCAAGGAGATTCAGTCCCTGTCAGGACGCCCTCGATCCTGTGAT 780GTTGGAGGTGGCAATGCTTTTCCACATAATGGTCAAAACCTAGGCCTCTCACCCTTCTTG 840GGGACTTTGAACACTGGAGGGTCATTGCCAGATCTAACCAACCTCCACTACTCGACACCC 900CTGCCAGCCTCCCTGGACACCACCGACCACCACTTTGGCAGTATGAGTGTGGGGAATAGT 960GTGAACAACATCCCAGCTGCTATGACCCACCTGGGTATAAGAAGCTCCTCTGGTCTCCAG 1020AGTTCTCGGAGTAACCCCTCCATCCAAGCCACGCTCAATAAGACTGTGCTTTCCTCTTCC 1080TTAAATAACCACCCACAGACATCTGTTCCCAACGCATCTGCTCTTCACCCTTCGCTCCGT 1140CTGTTTTCCCTTAGCAACCCATCTCTTTCCACCACAAACCTGAGCGGCCCGTCTCGCCGT 1200CGGCAGCCTCCCGTCAGCCCTCTCACGCTTTCTCCTGGCCCTGAAGCACATCAAGGTTTC 1260AGCAGACAGCTGTCTTCAACCAGCCCACTGGCCCCATATCCTACCTCCCAGATGGTGTCC 1320TCAGACCGAAGCCAACTTTCCTTTCTGCCCACAGAAGCTCAAGCCCAGGTGTCGCCGCCA 1380CCCCCTTACCCTGCACCCCAGGAGCTCACCCAGCCCCTCCTGCAGCAGCCCCGCGCCCCT 1440GAGGCCCCTGCCCAGCAGCCCCAGGCAGCCTCCTCACTGCCACAGTCAGACTTTCAGCTT 1500CTCCCGGCCCAGGGCTCATCTTTGACCAACTTCTTCCCAGATGTGGGTTTTGACCAGCAG 1560TCCATGAGGCCAGGCCCTGCCTTTCCTCAACAGGTGCCTCTGGTGCAACAAGGTTCCCGA 1620GAACTGCAGGACTCTTTTCATTTGAGACCAAGCCCGTATTCCAACTGCGGGAGTCTCCCG 1680AACACCATCCTGCCAGAAGACTCCAGCACCAGCCTGTTCAAAGACCTCAACAGTGCGCTG 1740GCAGGCCTGCCTGAGGTCAGCCTGAACGTGGACACTCCATTTCCACTGGAAGAGGAGCTG 1800CAGATTGAACCCCTGAGCCTGGATGGACTCAACATGTTAAGTGACTCCAGCATGGGCCTG 1860CTGGACCCCTCTGTTGAAGAGACGTTTCGAGCTGACAGACTGTGAACAGAAGGCAGTGGA 1920ACAGAAGAATGTTTTTCTGCAACAGCCAAAATAGAATGGAATAGAATGAAGCCAGCTGAT 1980ACCACGGGCTTTCGTTATCTTGACATAGAAGGAAGCAGTGCCACGGCTCCAGGGTTTCAG 2040ATGAGATCCCATCTCAGACACTGTGGCTTCCTCCAGATCACACAGCTTTGTACTGCCTCT 2100CCCGCCTGTGGCCAAAGTCGTGTTGCAGCAGGCAGGCTGCTTGGAGCTTCCCATGAACTG 2160GAAAGCTCACCTCCACTGCATCTTTTTACTGGCCATCCAGTCAGCCGATGTGTAAGAGTA 2220GGAAATACTGTGTCACTGGAGGCCCTCCGTAGCATTGGG 2259(SEQ ID NO 24)CREAP3 cDNA编码如下显示的619个氨基酸的预测蛋白质,其起始密码子在核苷酸46处而TGA编码的终止密码子在1905处。由CREAP3所编码的不同于公共克隆FLJ00364所预测序列的备选正确的氨基酸序列以下划线标出。粗体显示了在氨基酸551和616位的谷氨酸和丙氨酸。
MAASPGSGSANPRKFSEKIALHTQRQAEETRAFEQLMTDLTLSRVQFQKLQQLRLTQYHGGSLPNVSQLRSNASEFQPSFHQADNVRGTRHHGLVERPSRNRFHPLHRRSGDKPGRQFDGSAFGANYSSQPLDESWPRQQPPWKDEKHPGFRLTSALNRTNSDSALHTSALSTKPQDPYGGGGQSAWPAPYMGFCDGENNGHGEVASFPGPLKEENLLNVPKPLPKQLWETKEIQSLSGRPRSCDVGGGNAFPHNGQNLGLSPFLGTLNTGGSLPDLTNLHYSTPLPASLDTTDHHFGSMSVGNSVNNIPAAMTHLGIRSSSGLQSSRSNPSIQATLNKTVLSSSLNNHPQTSVPNASALHPSLRLFSLSNPSLSTTNLSGPSRRRQPPVSPLTLSPGPEAHQGFSRQLSSTSPLAPYPTSQMVSSDRSQLSFLPTEAQAQVSPPPPYPAPQELTQPLLQQPRAPEAPAQQPQAASSLPQSDFQLLPAQGSSLTNFFPDVGFDQQSMRPGPAFPQQVPLVQQGSRELQDSFHLRPSPYSNCGSLPNTILPEDSSTSLFKDLNSALAGLPEVSLNVDTPFPLEEELQIEPLSLDGLNMLSDSSMGLLDPSVEETFRADRL(SEQ ID NO 25)由于在288位存在上述额外的C,前81个氨基酸在FLJ00364和正确的专有克隆所预测的多肽之间是不同的。
我们认为所显示的由CREAP3所编码的氨基酸序列是正确的,因为其显示与CREAP1和CREAP2广泛同源。简而言之,使用ClustalW将CREAP基因家族序列进行比较。使用Align,2.0版本(Myers E.W.和Miller W.,Bull.Math Biol 515-37(1989))和Blosum 50评分矩阵(CITE)确定氨基酸身份。使用BlastN和Celera CHD数据库(Celera Genomics,Rockville,MD)进行基因组序列比对并且使用掩蔽的共有人序列进行检索。
(文件CHGD_masked_assembly_500k-i)由专有克隆和FLJ00364 cDNA预测的氨基酸序列在两个其它区域不同。如上显示专有克隆包含额外的GAA三联体,这导致在氨基酸551位处加入一个谷氨酸。最后,CREAP3 cDNA中单个核苷酸A/G改变,导致如上所显示的在氨基酸616位苏氨酸/丙氨酸改变。
实施例12从其它物种鉴定CREAP基因果蝇CREAP基因dCREAP的鉴定使用CREAP1和CREAP3编码区按照常规方法进行Genebank蛋白质和DNA序列数据库的BLASTP检索鉴定了单一预测的果蝇基因CG6064。该基因已经命名为dCREAP并且其氨基酸序列显示如下。作为未知功能的预测基因从黑腹果蝇(D.melanogaster)基因组的测序发现了该序列GenBank条目|7293954|gb|AAF49313.1|CG6064-PA[Drosophilamelanogaster](Adams等,Science 287(5461)2185-2195(2000))。dCREAP基因CG6064不含插入片段并预测的797个氨基酸的蛋白质,其比人CREAP略大。
dCREAP DNA序列ATGGCCAATCCGCGCAAGTTCAGCGAGAAGATCGCTCTGCAGAAGCAGAAGCAGGCGGAGGGCACAGCGGAATTCGAGCGGATCATGAAGGAGGTGTATGCCACGAAGAGGGATGAGCCGCCTGCGAATCAGAAGATCCTAGACGGCCTTGTCGGCGGTCAGGAGGTAAGCCAATCCTCGCCAGGCGCAGGCAATGGGACGGGCGGAGGTGGCAGTGGTTCCGGCAGTGGAGCCAGCGGCGGAGGAGCCTCACCAGATGGCCTGGGAGGCGGCGGTGGTTCTCCGACGGCTTATCGAGAATCCCGAGGGCGCAGCGTAGGTGTGGGTCCCATGCGAAGACCGTCGGAGCGCAAGCAGGATCGTTCGCCCTACGGCAGCAGCAGTACGCAACAAACCTTAGACAACGGCCAGCTAAATCCGCATCTTCTTGGTCCACCTACGGCGGAGAGTTTGTGGCGGCGGTCCAGCTCCGATTCGGCGCTGCACCAAAGTGCGCTGGTGGCGGGCTTCAATAGCGACGTGAACTCGATGGGCGCCAACTATCAGCAGCAGCAACATCAGCAACAACAGCAACCGGGCCAGCCAAGATCTCACTCGCCGCACCATGGTATAAACAGGACCATGAGTCCGCAGGCGCAACGGAGGAAGTCGCCGCTACTGCAGCCCCATCAGCTGCAGTTGCAGCAACTGCAACAGCAGCAGCAACAGATGCAACATCAGCATCAGCTGCACCAGCAGCTCCAAATGCAGCAGCTGCAACAGCACCAGCAGCAACACCAGCAGCAGCAGCAACAACAGAACACGCCATACAACAACGCCAAATTCACGAATCCTGTGTTCCGGCCGCTGCAGGATCAGGTCAACTTTGCCAACACCGGCTCCCTGCCCGATCTCACGGCCCTTCAAAACTATGGACCCCAGCAGCAGCAGCAGCAATCCCAGCAACAGCCGTCGCAGCAACAACAGCAGTTGCAGCAAACCCTGTCGCCAGTCATGTCTCCGCACAATCACCGCCGCGAACGGGATCAGTCGCCCAGTCCGTTTAGTCCGGCGGGTGGAGGAGGGGGAGCAGGTCCCGGGTCGCCCTATCAGCAGCAACAGCACTCGCCCACCGGAAACACGCAACAGCAGCAGCAGCAGCACCAACAGCCCAGCAACTCGCCGCACCTGTCCTTTACCAATCTGGCCACCACGCAGGCAGCTGTTACCACATTTAACCCGCTCCCCACGCTGGGTCCGCACAATGCCACCGACTACCGCCAGCCACCGAATCCTCCTAGTCCACGCTCTTCGCCCGGCTTGCTGAGCAGCGTATCGGCCACGGATCTGCACTCCAGTGCACCGGCCAGTCCCATACGCCAGCAGCAACAGGCCCATCAGCAGCAACAGCAGCAGCAACAGGCGCAGCAACAACAGCAACAGTTTGATAACTCCTACAACAGTCTGAATACCTCGTTTCACAATCAGTTTGAGATTTTCTCGCTGGGCGACAGCAATTCCTCGCCGGAACAGCAGGGCTTTGCAAATAATTTCGTGGCCCTCGACTTTGACGACCTGAGTGGCGGCGGAGGTGGTGGCCCAAGCGGGGGCGGCGGCAGCAATGGAGGAGGTCTGACCAACGGTTACAACAAGCCGGAGATGTTGGACTTCAGCGAGCTGAGCGGCAGCCCGGAGGCGAGTGGGAACAACAACCACATGCGGCGAGGAGTGAGCAACCTGAACAACAACGGGTTGAGCAATGGTGTGGTGGGATCCACGCACAACGGCAGCACAAATCTAAATGGAGCGGGAAACAACAATAGCAGTAGTGGAGGTGGCACGGCGCAGGATCCTTTGGGAATAACCACTTCGCCTGTGCCCTCACCCTTGGGCTGCCCCAGTTCACCGCTGCCGATACCGATTCCGATGTCGGCGCAAAGCTCGCCACAGCAGCAGCACCACCATCATCAGCAGCAGCAACAACAGCATCATCAGCAGCAACACCATCAGCAGCAGCAATTATCATTATCTCTGCACCATTCGCCGCATCATTCGCCAATGCATTCGCCGCACCATGGGAATTCACCGCTTTCAAGCAGCTCGCCAGTGAGTCACAATGCC
TGCTCCAACTCCAACGTGGTGATGAACCACCAGCAGCAGCAGCAACAACATCACCACCAGCAACACCATCATCAGGGCTCCTCGCAAAGTCACACGCCGACCACAGCGAATATACCCTCTATTATCTTTAGTGATTACTCCTCCAACGCGGATTATACCAGGGAGATCTTCGACTCCCTCGATCTGGATCTGGGACAGATGGACGTAGCCGGTTTGCAGATGCTGTCCGACCAGAACCCCATCATGATCGCCGATCCCAACATCGAGGATAGTTTTCGACGCGACCTCAACTGATACTATGAGGAGGCTGTTGCGGCCATTGAGAGCGGAGTGCTGCTGGAGGAGGACTACCAGGCGCTGCTCGGATCAGAGGCGCTGGCGGATGAACAGGTGGTCACAGTCGAGGCCGCCGGAGCCGCAGCAGCAGTAGTAACAGTTGAAGAGGCAGCCACAGTTAGCGAGAAGGACAAAAAAGATTTGGAAGTTGTGGAACTTCTGGTGTCCGGTGTTATGGATGACCTGGTGGACTCCAGTGACCTGGACGAGGAAGTGCGCAATTTCTTTTTTTAGGCAGCCAGCAAGTCATTTTTGTCGTTAACACAACTGATGGAATTTTCGTTTTTAACACAGATGAGGAAGTGAATTACGTTTTTTAAACGCATTCACTTGCCATTTCTCGATTAAATGCCATATTACTTAAGCTCAGGATTTACAAGCTTAATGCGAATTAAGTTAATTTCGGAAATGCTGACGAGAGTGATTGCAAAGTTCAAAATTGATACAAATTCACTTCCGCAAATTCATGCTGAAACTGAAAGTTTTCTAACAGTCCTCAATATTGTTATCTCGTTATCGTCCGTGCTTTCGTAGCTAGCTCCTACAACAAAAATAC(SEQ ID NO 26)下面显示了dCREAP预测的氨基酸序列MANPRKFSEKIALQKQKQAEGTAEFERIMKEVYATKRDEPPANQKILDGLVGGQEVSQSSPGAGNGTGGGGSGSGSGASGGGASPDGLGGGGGSPTAYRESRGRSVGVGPMRRPSERKQDRSPYGSSSTQQTLDNGQLNPHLLGPPTAESLWRRSSSDSALHQSALVAGFNSDVNSMGANYQQQQHQQQQQPGQPRSHSPHHGINRTMSPQAQRRKSPLLQPHQLQLQQLQQQQQQMQHQHQLHQQLQMQQLQQHQQQHQQQQQQQNTPYNNAKFTNPVFRPLQDQVNFANTGSLPDLTALQNYGPQQQQQQSQQQPSQQQQQLQQTLSPVMSPHNHRRERDQSPSPFSPAGGGGGAGPGSPYQQQQHSPTGNTQQQQQQHQQPSNSPHLSFTNLATTQAAVTTFNPLPTLGPHNATDYRQPPNPPSPRSSPGLLSSVSATDLHSSAPASPIRQQQQAHQQQQQQQQAQQQQQQFDNSYNSLNTSFHNQFEIFSLGDSNSSPEQQGFANNFVALDFDDLSGGGGGGPSGGGGSNGGGLTNGYNKPEMLDFSELSGSPEASGNNNHMRRGVSNLNNNGLSNGVVGSTHNGSTNLNGAGNNNSSSGGGTAQDPLGITTSPVPSPLGCPSSPLPIPIPMSAQSSPQQQHHHHQQQQQQHHQQQHHQQQQLSLSLHHSPHHSPMHSPHHGNSPLSSSSPVSHNACSNSNVVMNHQQQQQQHHHQQHHHQGSSQSHTPTTANIPSIIFSDYSSNADYTREIFDSLDLDLGQMDVAGLQMLSDQNPIMIADPNIEDSFRRDLN(SEQ ID NO 27)按照以下方法分析了dCREAP的活性使用有义(SEQ ID 37)和反义(SEQ ID 38)引物通过PCR扩增编码dCREAP可读框的2.3kb cDNA。
用于扩增dCREAP ORF cDNA的有义引物(加下划线部分是果蝇Kozak序列CAAC)CAACATGGCCAATCCGCGCAAGTTCAGCGAG(SEQ ID 37)用于扩增dCREAP ORF cDNA的反义引物TCAGTTGAGGTCGCGTCGAAAACTATCCTC(SEQ ID 38)将扩增产物插入果蝇P-元件转化载体pUAST(Brand和Perrimon,Development 118401-415(1993))。最终构建体pUAS-dCREAP用于黑腹果蝇(Drosophila melanogaster)Schneider细胞(S2)中的转染实验。建立萤火虫萤光素酶报告基因,其包含果蝇CRE增强子元件(SEQ ID 39)的4个拷贝(Eresh,S.等人EMBO J.162014-2022(1997))且该报告基因后是hsp70最小启动子。寡核苷酸序列包含果蝇CRE的4个拷贝。加下划线部分是CRE元件的序列GGAGCCTGGCGTCAGAGAGCCTGGCGTCAGAGAGCCTGGCGTCAGAGAGCCTGGCGTCAGAG(SEQ ID 39)在6孔板(Costar)中通过CaPO4方法(Bunch,T.和Goldstein,L.NucleicAcids Res.179761-9782(1989))转染S2细胞。将总共25μg DNA转染入含有4ml细胞(~1×106细胞/ml)的6孔板。18小时后去除转染混合物并且在48小时后进行萤光素酶测定。使用Norbert Perrimon博士所提供的肌动蛋白启动子-Gal4质粒通过共转染激活UAS-转基因。通过与最小热休克启动子(按照常规方法制备)所驱动的hspmin海肾萤光素酶共转染对转染效率进行标准化。使用双-萤光素酶测定试剂盒(Promega)测定萤光素酶活性。作为阴性对照,用CRE-hsp-Luc报告子和空pUAST载体共转染S2细胞。数据计算为与在指定为阴性对照的细胞中所测定的报告基因活性相比的诱导倍数。
结果表明(见表3),与人CREAPS一样,dCREAP也能够调节果蝇中的CRE,因为当存在CRE元件时它能有效地诱导CRE-hsp-Luc报告子的活性。
激活倍数STDEVpUAST/CRE-hsp-Luc 1.020.28dCREAP/hsp-Luc 0.960.15dCREAP/CRE-hsp-Luc 136.04 37.13表3dCREAP有效地诱导CRE-hsp-Luc报告子的活性。使用空pUAST载体或pUAST-dCREAP构建体(dCREAP)和hsp-Luc报告子或携带果蝇CRE4个拷贝的hsp-Luc报告子(CRE-hsp-Luc)共转染S2细胞。转染48小时后测定了萤光素酶活性。
小鼠CREAP1(mCREAP1)基因的鉴定还使用常规方法鉴定了小鼠CREAP1蛋白质。简而言之,按以下顺序装配mCREAP1cDNA核苷酸1-483来自小鼠EST BY752080(这里和下面GenBank登录号);核苷酸484-891来自小鼠EST BM950955;核苷酸892-909来自小鼠基因组DNA序列Celera克隆核苷酸910-981来自小鼠EST CA326891。
核苷酸982-1610来自小鼠EST BM935820。
核苷酸1611-2416来自小鼠EST BI453510。
所得到的mCREAP1核苷酸序列
GGGACGAAGAGTAGGAGTAGGAGGAGGCGGCGAGAAGATGGCGACTTCGAACAATCCGCGGAAATTTAGCGAGAAGATCGCACTGCACAACCAGAAGCAGGCGGAGGAGACGGCGGCCTTCGAGGAGGTCATGAAGGACCTGAGCCTGACGCGGGCCGCGCGGCTTCAGCTGCAGAAGTCCCAGTACCTGCAGCTGGGCCCCAGCCGTGGCCAGTACTACGGTGGGTCCCTGCCCAACGTGAACCAGATTGGAAGCAGCAGCGTGGACCTGGCCTTCCAGACCCCATTTCAGTCCTCAGGCCTGGACACGAGTCGGACCACACGACATCATGGGCTTGTGGACAGAGTATATCGTGAGCGTGGCAGACTTGGCTCCCCGCACCGTCGACCCCTGTCAGTAGACAAGCATGGGCGACAGGCTGACAGCTGCCCCTATGGCACCGTGTACCTCTCGCCTCCTGCGGACACCAGCTGGAGGAGGACCAACTCTGACTCTGCCCTGCACCAGAGCACAATGACACCCAGCCAGGCAGAGTCCTTCACAGGCGGGTCCCAGGATGCGCACCAGAAGAGAGTCTTACTGCTAACTGTCCCAGGAATGGAGGACACCGGGGCTGAGACAGACAAGACCCTTTCTAAGCAGTCATGGGACTCAAAGAAGGCGGGTTCCAGGCCCAAGTCCTGTGAGGTCCCCGGAATCAACATCTTTCCGTCTGCAGACCAGGAGAACACAACAGCCCTGATCCCTGCCACCCACAACACAGGGGGCTCCCTTCCTGACCTCACCAACATCCACTTCGCCTCCCCACTCCCGACACCACTGGACCCTGAGGAGCCTCCGTTCCCTGCTCTCACCAGCTCCAGCAGCACCGGCAGCCTTGCACATCTGGGCGTTGGCGGCGCAGGCGGTATGAACACCCCCAGCTCTTCTCCACAGCACCGGCCAGCAGTCGTCAGCCCCCTGTCCCTGAGCACAGAGGCCAGGCGGCAGCAGGCCCAGCAGGTGTCACCCACCCTGTCTCCGTTGTCACCCATCACTCAGGCCGTGGCTATGGATGCCCTGTCCTTGGAGCAGCAGCTGCCCTATGCCTTCTTCACCCAGACTGGCTCCCAGCAGCCTCCCCCACAGCCCCAGCCACCGCCTCCACCTCCACCGGTATCCCAGCAGCAGCCACCACCTCCACAGGTGTCTGTGGGCCTCCCCCAGGGTGGTCCACTGCTGCCCAGTGCCAGCCTGACTCGGGGGCCCCAGCTGCCACCACTCTCAGTTACTGTACCATCCACTCTTCCCCAGTCCCCTACAGAGAACCCAGGCCAGTCACCAATGGGGATCGATGCCACTTCGGCACCAGCTCTGCAGTACCGCACGAGTGCAGGGTCACCTGCCACCCAGTCTCCCACCTCTCCGGTCTCCAACCAAGGCTTCTCCCCTGGAAGCTCCCCACAGCACACGTCCACCCTGGGCAGCGTGTTTGGGGATGCGTACTATGAGCAGCAGATGACAGCCAGGCAGGCCAATGCTCTGTCNCGCCAGCTGGAGCAGTTCAACATGATGGAGAACGCCATCAGCTCCAGCAGCCTATACAACCCGGGCTCCACACTCAACTATTCCCAGGCTGCCATGATGGGTCTGAGCGGGAGCCACGGGGGCCTACAGGACCCGCAGCAGCTCGGCTACACAGGCCACGGTGGAATCCCCAACATCATCCTCACGGTGACAGGAGAGTCACCACCGAGCCTCTCTAAGGAACTGAGCAGCACACTGGCAGGAGTCAGTGATGTCAGCTTTGATTCGGACCATCAGTTTCCACTGGACGAGCTGAAGATTGACCCTCTGACCCTGGACGGACTCCATATGTTGAATGACCCAGACATGGTTTTAGCCGACCCAGCCACCGAGGACACCTTCCGAATGGACCGCCTGTGAGTGGCTGTGCCCACCAGCCGCCGCTGGTCAGTCTCCAACGGCGCTGCCCCAAACCTGGGGACGGCAATGGCGTCCCCCTTTGCCAACGGCCAAGCTTGTGGTTCTGAGCTTGCAATGCTGCCCAGTGCCCCTGCCAGCCCCCCGCCACCCCGGTCGTTCACCTCCCATGATGCCTGGCGTGCGTGAGGCCGCTGTGTACTAGGCTGGCTATCTGTCTGTCCATCCATCTACCTGGGGTCAGGCTGATGGCCGAGGCTGTGAGTGCCTGGCCCCCATGGATGTTCCCCGTGCTCGCTCCCTCACCCCTCACTGGGGATGTGAGAGCCCTCATCAGATACCCAAAGTGTCACTCACTTCCAGCATGTGCTGTGCAACGGAGGGCCGGGGCGTGGGTGTGGAGCGCCCAGAGGCTTAGGTGCGCCATCCATTCGACTGTTGTCAGCTGTCACTGCCTTCCTCCATCCTGTCCCCCGTCCCACCGCCATCCCT(SEQ ID NO.28)编码mCREAP1蛋白质序列的可读框是由核苷酸25-1914编码。
mCREAP1的蛋白质序列MATSNNPRKFSEKIALHNQKQAEETAAFEEVMKDLSLTRAARLQLQKSQYLQLGPSRGQYYGGSLPNVNQIGSSSVDLAFQTPFQSSGLDTSRTTRHHGLVDRVYRERGRLGSPHRRPLSVDKHGRQADSCPYGTVYLSPPADTSWRRTNSDSALHQSTMTPSQAESFTGGSQDAHQKRVLLLTVPGMEDTGAETDKTLSKQSWDSKKAGSRPKSCEVPGINIFPSADQENTTALIPATHNTGGSLPDLTNIHFASPLPTPLDPEEPPFPALTSSSSTGSLAHLGVGGAGGMNTPSSSPQHRPAVVSPLSLSTEARRQQAQQVSPTLSPLSPITQAVAMDALSLEQQLPYAFFTQTGSQQPPPQPQPPPPPPPVSQQQPPPPQVSVGLPQGGPLLPSASLTRGPQLPPLSVTVPSTLPQSPTENPGQSPMGIDATSAPALQYRTSAGSPATQSPTSPVSNQGFSPGSSPQHTSTLGSVFGDAYYEQQMTARQANALSRQLEQFNMMENAISSSSLYNPGSTLNYSQAAMMGLSGSHGGLQDPQQLGYTGHGGIPNIILTVTGESPPSLSKELSSTLAGVSDVSFDSDHQFPLDELKIDPLTLDGLHMLNDPDMVLADPATEDTFRMDRL(SEQ ID NO29)河豚CREAP1的鉴定在红鳍东方豚中鉴定了CREAP1。使用TBLASTN通过将人CREAP1蛋白质序列与河豚基因组(版本3)进行比对鉴定了该序列。通过比对找到了高度同源的区域。将所找到的序列进一步进行人工编辑。
河豚CREAP1氨基酸序列MASSNNPRKFSEKIALHNQKQAEETAAFEEVMKDLNVTRAARLQLQKTQYLQLGQNRGQYYGGSLPNVNQIGNGNIDLPFQVSNSVLDTSRTTRHHGLVERVYRDRNRISSPHRRPLSVDKHGRQRTNSDSALHQSAMNPKPHEVFAGGSQELQPKRLLLTVPGTEKSESNADKDSQEQSWDDKKSIFPSPDQELNPSVLPAAHNTGGSLPDLTNIQFPPPLSTPLDPEDTVTFPSLSSSNSTGSLTTNLTHLGISVASHGNNGEKNIFFLKTCTSCEDVYDFYFVGIPTSSQTTMTATAQRRQPPVVPLTLTSDLTLQQSPQQLSPTLSSPINITQSMKLSASSLQQYRNQTGSPATQSPTSPVSNQGFSPGSSPQPQHIPVVGSIFGDSFYDQQLALRQTNALSHQVCEDGRRLEITHVRLSRLHAELCFCFSQLEQFNMIENPISSTSLYNQCSTLNYTQAAMMGLTGSSLQDSQQLGYGNHGNIPNIILTISVTGESPPSLSKELTNSLAGVGDVSFDPDTQFPLDELKIDPLTLDGLHMLNDPDMVLADPATEDTFRMDRL(SEQ ID NO.30)河豚CREAP1DNA序列
ATGGCGTCCTCTAACAATCCTCGCAAATTTAGCGAAAAAATCGCACTGCATAACCAGAAACAAGCAGAGGAGACTGCTGCGTTCGAAGAAGTGATGAAGGACCTGAACGTCACAAGGGCTGCCCGGGTAAGACAGCTGCAGTTACAGAAGACCCAGTATTTGCAACTAGGGCAGAATCGTGGACAGTACTATGGAGGCTCACTGCCCAATGTCAATCAGATTGGAAATGGCAACATTGACCTGCCTTTTCAGGTGAGCAGGACAAACTCAGACTCAGCTTTACATCAGAGTGCCATGAATCCAAAGCCCCACGAAGTGTTTGCTGGGGGGTCGCAGGAGCTGCAGCCCAAACGACTGCTGCTAACAGTGCCTGGAACCGAAAAATCGGAATCAAACGCAGACAAAGATTCGCAGGAGCAGTCGTGGGATGACAAAAAGAGTATTTTTCCATCACCAGACCAGGAGTTAAACCCCTCCGTGCTTCCAGCCGCGCACAACACCGGCGGTTCGCTCCCCGACCTGACCAACATCCAGTTCCCTCCTCCACTGTCCACCCCACTGGACCCCGAGGACACCGTCACCTTCCCCTCCCTCAGCTCCTCTAACAGCACAGGCAGTCTGACTACCAACCTCACCCACCTGGGCATCAGTGTGGCCAGCCATGGTAATAACGGAGAGAAAAATATATTTTTTTTAAAAACATGCACTTCATGCGAGGATGTTAAATAATATTACGACTTTTATTTTGTAGGGATTCCCACTTCCTCTCAAACCACCATGACAGCAACAGCACAGCGGCGGCAACCACCCGTGGTCCCCCTCACCCTCACCTCTGACCTGACTCTTCAACAGTCCCCCCAGCAGCTTTCACCCACCCTCTCCTCACCCATTAACATCACACAGAGCATGAAGCTTAGTGCTAGCTAACATTCTTCCCTCCAACAGTACCGCAATCAGACTGGCTCACCAGCCACTCAGTCTCCAACCTCCCCAGTCTCCAATCAAGGCTTCTCCCCCGGCAGCTCGCCTCAACCACAGCACATTCCTGTGGTGGGCAGTATATTTGGGGACTCCTTCTATGATCAGCAGTTGGCTCTGAGGCAGACCAATGCCCTTTCTCATCAGGTGTGTGAGGACGGCCGCAGGTTAGAAATAACACACGTACGTCTCTCACGACTTCACGCCGAGCTTTGTTTTTGTTTTTCTCAGCTGGAGCAGTTCAATATGATAGAGAACCCCATCAGCTCCACCAGCCTGTACAATCAGTGCTCCACCCTTAATTACACACAGGCAGCCATGATGGGCCTCACCGGGAGCAGCCTGCAGGACTCGCAGCAGCTCGGCTACGGCAATCACGGCAACATCCCCAACATCATACTGACAATTTCAGTCACAGGGGAGTCTCCGCCGAGCCTCTCCAAAGAGCTGACCAACTCATTGGCCGGCGTCGGCGACGTCAGCTTTGATCCAGACACGCAGTTTCCTCTGGACGAGCTGAAGATCGACCCGCTGACCTTGGACGGCCTGCACATGCTCAACGACCCAGACATGGTGCTGGCAGACCCCGCCACAGAGGACACGTTCAGGATGGACAGGCTGTAA(SEQ ID NO.31)实施例13人CREAP编码区与来自其它物种的其它CREAP蛋白质的比较如图1中所示通过全部三种CREAP序列编码区的总体比对对这些序列进行了比较。每种蛋白质大小相似,CREAP2略大(与CREAP1和3的分别650和619个氨基酸相比为693个氨基酸)。基于保守性能够将这些蛋白质大致分为3个结构域。第一个是占三分之一的保守氨基末端,与CREAP1的直至氨基酸267(即氨基酸1-267)具有高度同一性。该区域在全部三种CREAP之间大致为33%的同一性。第二个结构域是跨越CREAP1氨基酸289-538的中间区域,该区域脯氨酸、甘氨酸和丝氨酸残基高度丰富。该区域分别对应CREAP1、CREAP2和CREAP3的氨基酸289-529、376-606和235-533。该区域具有很小的氨基酸同一性,但是在氨基酸构成上是相似的。最后,该蛋白质占三分之一的羧基末端(大致对应CREAP1最后78个氨基酸(CREAP1的氨基酸575-650))又是高度保守的,在全部三种蛋白质之间具有38%的氨基酸同一性。
有趣地是,该蛋白质的最保守部分是氨基末端。超过24个氨基酸的80%同一性区域存在于全部三种蛋白质。该区域在果蝇中也是保守的并且对于CREAP功能是必需的并可能代表调节CREAP功能的关键区域。CREAP氨基末端的保守性表明该区域对于其功能是关键的。该观点由如下数据支持,所述数据表明氨基末端250个氨基酸的缺失破坏了CREAP1活性(见上面表1)。
为了进一步鉴定是否绝大部分氨基末端残基都是关键的,在CREAP1中产生了最N-末端59个氨基酸的缺失。用ScaI/XhoI限制性内切酶(RocheApplied Science,Indianapolis,IN,USA)从最初的pCMV-SPORT6质粒切除CREAP1cDNA。ScaI消化的2382nt CREAP1cDNA片段缺失了CREAP1 ORF的177个核苷酸,将该片段进行凝胶纯化并亚克隆入EcoRV/SalI消化的pFLAG-CMV6B载体(BD Biosciences)。分离正确的克隆并按照常规方法进行序列验证。在启动子-报告子测定中试验了该蛋白质(δ59)。与其保守性相一致,这些残基的缺失导致CREAP活性损失80-90%(数据未显示)。
图1中显示了人CREAP1和来自其它物种的同系物的相似性。总体来看,所描述的人CREAP的3个结构域也包含于其它CREAP序列。氨基末端是高度保守的。值得注意地是,人CREAP最氨基末端的保守氨基酸在这些蛋白质中也是高度保守的。
本研究中鉴定的人CREAP1 cDNA编码预测的650个氨基酸的蛋白质。该cDNA与注释为KIAA0616的许多cDNA部分重叠但在所编码蛋白质的预测的c-末端不同。我们能够鉴定N-末端卷曲螺旋(coil-coil)结构域(氨基酸8-54)、富含丝氨酸/谷氨酰胺的结构域(氨基酸289-559)和带强负电荷的C-末端结构域(氨基酸602-643)(数据未显示)。如所显示,连同人CREAP2和CREAP3一起,在小鼠和河豚基因组中发现了编码与CREAP1高度相似的蛋白质的基因。全部人和小鼠CREAP1基因具有90%同一性。所预测的河豚蛋白质长为566个氨基酸并66%相同于人CREAP1。
我们还鉴定了在果蝇基因组中预测的CREAP1样基因。虽然哺乳动物和鱼类CREAP1基因与果蝇序列仅有约20%的同一性,但果蝇序列与其它CREAP1蛋白质具有相似的组织。每种蛋白质包含高度保守的氨基和羧基末端区域以及富含脯氨酸、谷氨酰胺和丝氨酸残基的中央结构域。我们已经命名果蝇预测基因为dCREAP。dCREAP的28个氨基酸的前22个与人CREAP1相同。氨基末端具有与CREB蛋白质中的磷酸化位点相似的绝对保守的共有PKA或PKC共有磷酸化位点(RKFS)。CREB中该丝氨酸(CREB1中的丝氨酸133)的磷酸化作用是通过cAMP诱导CREB依赖基因表达所需的。
DCREAP前32个氨基酸分别69%和84%相同并相似与人CREAP1,这再次支持了该观点,即CREAP的氨基末端对其功能是关键的。另外,dCREAP的中央结构域是具有很小同源性的较低复杂性区域。尽管预测的dCREAP编码区确实具有一些甘氨酸和脯氨酸丰富区,但在谷氨酰胺残基高度丰富方面是独特的。另外,与人CREAP相似,该蛋白质的最羧基末端是与人CREAP1高度保守的(最后30个氨基酸超过30%)。
表4中显示了CREAP基因的相关性。总体而言,人CREAP基因彼此之间比dCREAP更相关。CREAP2稍微地更加相似于CREAP1和CREAP3,比CREAP1和CREAP3之间更相似,但是全部它们之间具有34-39%的同一性。发现全部人CREAP约20%相同于预测的dCREAP基因,尽管如上所示的相似性更多地是由于蛋白质高度保守的氨基和羧基末端。应该注意到在小鼠和人基因组中全部三个CREAP基因是高度保守的(数据未显示)。这表明不同同种型具有唯一和关键的功能。CREAP的进化保守性支持CREAP是CRE活性的关键调节子的观点。


表4来自不同物种的CREAP基因的氨基酸相似性。所显示数据代表全部蛋白质编码区氨基酸同一性百分比并且如上所述进行计算。百分比同一性基于使用ClustalW V1.74的自动比对。
实施例14CREAP2和CREAP3的活性人CREAP基因之间的同源性表明它们是功能上相关的。为了研究这一点,在如上面所公开的共转染测定中测试了CREAP2和CREAP3激活由IL-8启动子和CRE-依赖启动子所驱动的基因表达的能力。简而言之,用空pCMV-SPORT6表达载体或携带CREAP1、CREAP2或CREAP3cDNA的相同载体共转染后,测定了由IL-8启动子或连接至4个CRE拷贝的最小启动子所驱动的萤光素酶报告子的表达水平。结果表明CREAP1与依赖IL-8启动子或-依赖CRE驱动的萤火虫萤光素酶基因的共转染导致萤光素酶活性急剧增加(见表5)。CREAP2或CREAP3的转染也产生了两种报告子的相似的激活。其它实验表明该活性依赖于存在于IL-8启动子中的CRE或CRE-样位点的完整性(数据未显示)。有趣地是,与CREAP1和CREAP2相比,CREAP3始终如一地显示2-4倍的更高水平诱导基因表达。因此,CREAP2和CREAP3是CRE驱动基因表达的有效激活子并且CREAP家族代表保守序列和活性的家族。此外,当过表达于HLR-CREB细胞系(Stratagene)时,全部三个CREAP家族成员都显示了激活CREB-GAL4融合蛋白质的能力,其中该细胞系携带有基因组整合的UAS-Luc报告子,这支持了如下证据,即CREAP蛋白质可以通过与结合启动子的CREB蛋白质相互作用诱导基因表达(数据未显示)。

表5.CREAP基因家族对CRE驱动启动子或白细胞介素-8启动子的诱导作用。用空载体(对照)或编码三种CREAP基因的表达载体共转染由连接至CRE多拷贝上的最小启动子或白细胞介素-8启动子所驱动的萤光素酶表达构建体。萤光素酶的表达水平表示为相对于用空载体共转染所获得的水平。
实施例15CREAP1蛋白质是转录激活子一些观察表明CREAP1是转录共激活因子。首先,尽管我们还不能鉴定CREAP1中任意DNA结合活性,但是每种CREAP蛋白质含有预测的N-末端卷曲螺旋结构域(hCREAP1残基8-54)、富含丝氨酸/谷氨酰胺丰富结构域(hCREAP1残基289-559)和带负电荷的羧基末端。
为了确定CREAP蛋白质是否能够作为转录激活子起作用,将全部3种CREAP同系物的不同区域(CREAP1的氨基酸300-650、CREAP2的氨基酸296-694和CREAP3的氨基酸335-635)与表达为GAL4DNA结合结构域表达为融合蛋白质并且测试了激活连接至GAL4蛋白质结合序列的报告基因(UAS-Luc(pFR-Luc reporter)表达的能力。简而言之,通过PCR扩增所指出的CREAP1、CREAP2和CREAP3区域并亚克隆入pCMV-BD载体(Stratagene)中编码GAL4DNA结合结构域的读框内。如上所述使用Fugene6转染试剂(Roche)以75ng/孔将所选出质粒和空载体(pCMV-SPORT6)转染入HEK 293细胞。用编码由连接至5联体GAL4结合位点(UAS)的最小启动子驱动的萤火虫萤光素酶基因的pFR-Lucreporter(Stratagene)以100ng/孔进行共转染。作为阳性对照,报告子还与编码GAL4-CREB融合蛋白质的质粒(Stratagene)单独或在存在编码蛋白激酶A催化亚基的表达构建体pFC-PKA(Stratagene)时进行共转染以激活CREB激酶可诱导的激活结构域。将诱导倍数与在仅用携带GAL4 DNA结合结构域的表达载体pCMV-BD转染的细胞中所测定的报告子活性进行比较。虽然3种全长CREAP蛋白质不显著影响报告子活性,但包含CREAP1-3羧基末端部分的融合蛋白质有效诱导UAS-Luc的表达,见表6。

表6CREAP1蛋白质是转录激活子的证明。测试了编码全长CREAP1、CREAP2和CREAP3以及单独或与CREAP1、CREAP2和CREAP3C-末端部分融合的Gal4 DNA结合结构域的表达构建体诱导由连接至GAL4DNA结合位点的最小启动子所控制的萤光素酶基因(pFRLuciferase)表达的能力。将所显示的对用与pFR-Luc reporter共转染的pCMV-BD载体所得到的数值标准化。
为了确定CREAP蛋白质是否能够直接激活CREB1蛋白质,将CREAP1、CREAP2和CREAP3表达构建体单独或与GAL4-CREB质粒(Stratagene)一起转染入HLR细胞系(Stratagene),该细胞系携带整合有pFR-Luc reporter拷贝的基因组DNA。简而言之,按照制造商的说明书保持HLR细胞。如上所述使用Fugene6转染试剂(Roche)以75ng/孔用所选出的质粒和空载体(pCMV-BD)或GAL4-CREB质粒进行转染。作为阳性对照,编码蛋白激酶A催化亚基的表达构建体pFC-PKA(Stratagene)也与GAL4-CREB一起共转染。将活化倍数与在用空载体转染的细胞中所测定的报告子活性进行比较。虽然3种全长CREAP蛋白质不显著影响报告子活性,但与3种全长CREAP共转染时GA4L-CREB融合蛋白质的活性上调,表明CREB和CREAP蛋白质相互作用形成活性转录复合体。见下面表7。

表7CREAP1通过激活CREB起作用。测试了全长CREAP1、CREAP2和CREAP3诱导GAL4-CREB融合蛋白质(Stratagene)活性的能力。所给出的数据对使用pCMV-BD载体所得到的数值进行标准化。全部CREAP和PKA显著诱导GAL4-CREB介导的激活。注意到当与来自表6的数据进行比较时,使用阳性对照获得的诱导倍数较低,其中表6的数据是用全部包含报告子的质粒进行瞬时转染所获得的。
为了确定是否CREAP1能够直接与CREB相互作用,使用Fugene6试剂(Roche Applied Science)按照由制造商提供的方案将CREAP1的K1和K5变体(见表1)转染入生长于100mm平皿(Falcon)中的HEK293细胞。转染40小时后,从板上将细胞刮下置于PBS中并在800μl低严紧度缓冲液中进行裂解,所述缓冲液包含10mM HEPES pH 7.6、250mMNaCl、5mM EDTA、1mM DTT、0.1%NP-40和新鲜溶解的蛋白酶抑制剂。使用M2-琼脂糖珠(Sigma)进行免疫沉淀。在4-20%的SDS-PAGE(Invitrogen)上分离所沉淀的蛋白质并转移至硝酸纤维素膜(Invitrogen)上。使用针对CREB的抗体(Cell Signaling Technology)进行蛋白质印迹。作为阴性对照使用了编码带FLAG-标记的人组蛋白脱乙酰基酶(HDAC1)的表达构建体。我们发现包含高度保守卷曲螺旋结构域的CREAP1 N-末端170个氨基酸的片段在体内与内源性CREB1结合。表1中显示的数据证明该区域对于CREAP-介导的CRE激活是绝对必需的。
除了最近鉴定的LIM-only蛋白质家族以外(Fimia,G.等2000,MolCellBiol 20,8613-8622),CREAP家族可以代表CREB共激活子进化保守的分枝。有趣地是,虽然LIM-only蛋白质与CREM——一种已知的CRE抑制剂结合并提供不依赖磷酸化作用和CBP的激活功能,但我们的数据表明CREAP可以与结合至规范CRE位点的CREB1和结合至不被CREB1所识别的CRE-样元件的CREB2相互作用并因此激活不同靶基因库的表达。而且,CREAP1似乎允许表面上结合至CRE和AP-1结合位点的蛋白质之间协同作用。对CREAP1作用的阐明将解释控制对CREB激活子组织选择性反应的机制。
这里描述的实验提出了明显的问题,即CRE-样位点在调节疾病期间IL-8表达中的重要性。虽然先前证明没有CRE或CRE-样位点存在于IL-8启动子,但β2-肾上腺素能受体激动剂(β2-AR)(其发挥作用而增加细胞内cAMP水平)在呼吸道平滑肌细胞中诱导IL-8分泌(Kavelaars A.等J.Neuroimmunol.1997Aug;77(2)211-6)。这尤其重要,因为使用β2-AR激动剂作为支气管扩张剂能够加重气喘并应该与抗炎类固醇结合使用(Cockcroft,D.等,1993;Lancet 342833-837;Knox,A.J 2002;Curr.Pharm Des.1863-1869;Vathenen等,1988Lancet 1554-558))。所给出的数据表明该作用可能直接由于通过CRE-样位点并且也许是CREAP1对IL-8转录的激活作用。
序列表<110>诺瓦提斯公司<120>环AMP效应元件激活蛋白及其相关用途<130>4-32999P2<150>60/463,934<151>2003-04-18<160>39<170>FastSEQ for Windows版本4.0<210>1<211>2878<212>DNA<213>人<400>1ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc 60gtttagtgaa ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa 120gacaccggga ccgatccagc ctccggactc tagcctaggc cgcgggacgg ataacaattt 180cacacaggaa acagctatga ccattaggcc tatttaggtg acactataga acaagtttgt 240acaaaaaagc aggctggtac cggtccggaa ttcccgggag gaggaggagg tggcggcgag 300aagatggcga cttcgaacaa tccgcggaaa ttcagcgaga agatcgcgct gcacaatcag 360aagcaggcgg aggagacggc ggccttcgag gaggtcatga aggacctgag cctgacgcgg 420gccgcgcggc tccagctcca gaaatcccag tacctgcaac tgggccccag ccgaggccag 480tactatggcg ggtccctgcc caacgtgaac cagatcggga gtggcaccat ggacctgccc 540ttccagccca gcggatttct gggggaggccc tggcagcgg ctcctgtctc tctgaccccc 600ttccaatcct cgggcctgga caccagccgg accacccggc accatgggct ggtggacagg 660gtgtaccggg agcgtggccg gctcggctcc ccacaccgcc ggcccctgtc agtggacaaa 720cacggacggc aggccgacag ctgcccctat ggcaccatgt acctctcacc acccgcggac 780accagctgga gaaggaccaa ttctgactcc gccctgcacc agagcacaat gacgcccacg 840cagccagaat cctttagcag tgggtcccag gacgtgcacc agaaaagagt cttactgtta 900acagtcccag gaatggaaga gaccacatca gaggcagaca aaaacctttc caagcaagca 960tgggacacca agaagacggg gtccaggccc aagtcctgtg aggtccccgg aatcaacatc 1020ttcccgtctg ccgaccagga aaacactaca gccctgatcc ccgccaccca caacacaggg 1080gggtccctgc ccgacctgac caacatccac ttcccctccc cgctcccgac cccgctggac 1140cccgaggagc ccaccttccc tgcactgagc agctccagca gcaccggcaa cctcgcggcc 1200
aacctgacgc acctgggcat cggtggcgcc ggccagggaa tgagcacacc tggctcctct 1260ccacagcacc gcccagctgg cgtcagcccc ctgtccctga gcacagaggc aaggcgtcag 1320caggcatcgc ccaccctgtc cccgctgtca cccatcactc aggctgtagc catggacgcc 1380ctgtctctgg agcagcagct gccctacgcc ttcttcaccc aggcgggctc ccagcagcca 1440ccgccgcagc cccagccccc gccgcctcct ccacccgcgt cccagcagcc accacccccg 1500ccacccccac aggcgcccgt ccgcctgccc cctggtggcc ccctgttgcc cagcgccagc 1560ctgactcgtg ggccacagcc gcccccgctt gcagtcacgg taccgtcctc tctcccccag 1620tcccccccag agaaccctgg ccagccatcg atggggatcg acatcgcctc ggcgccggct 1680ctgcagcagt accgcactag cgccggctcc ccggccaacc agtctcccac ctcgccagtc 1740tccaatcaag gcttctcccc agggagctcc ccgcaacaca cttccaccct gggcagcgtg 1800tttggggacg cgtactatga gcagcagatg gcggccaggc aggccaatgc tctgtcccac 1860cagctggagc agttcaacat gatggagaac gccatcagct ccagcagcct gtacagcccg 1920ggctccacac tcaactactc gcaggcggcc atgatgggcc tcacgggcag ccacgggagc 1980ctgccggact cgcagcaact gggatacgcc agccacagtg gcatccccaa catcatcctc 2040acagtgacag gagagtcccc ccccagcctc tctaaagaac tgaccagctc tctggccggg 2100gtcggcgacg tcagcttcga ctccgacagc cagtttcccc tggacgaact caagatcgac 2160cccctgaccc tcgacggact gcacatgctc aacgaccccg acatggttct ggccgaccca 2220gccaccgagg acaccttccg gatggaccgc ctgtgagcgg gcacgccggc accctgccgc 2280tcagccgtcc cgacggcgcc tccccagccc ggggacggcc gtgctccgtc cctcgccaac 2340ggccgagctt gtgattctga gcttgcaatg ccgccaagcg ccccccgcca gcccgccccc 2400ggttgtccac ctcccgcgaa gcccaatcgc gaggccgcga gccgggccgt ccacccaccc 2460gcccgcccag ggctgggctg ggatcggagg ccgtgagcct cccgcccctg cagaccctcc 2520ctgcactggc tccctcgccc ccagccccgg ggcctgagcc gtcccctgta agatgcggga 2580agtgtcagct cccggcgtgg cgggcaggct caggggaggg gcgcgcatgg tccgccaggg 2640ctgtgggccg tggcgcattt tccgactgtt tgtccagctc tcactgcctt ccttggttcc 2700cggtccccca gcccatccgc catccccagc ccgtggtcag gtagagagtg agccccacgc 2760cgccccaggg aggaggcgcc agagcgcggg gcagacgcaa agtgaaataa acactatttt 2820gacggcaaaa aaaaaaaaaa agggcggccg ctctagagta tccctcgagg ggcccaag 2878<210>2<211>650<212>PRT<213>人<400>2Met Ala Thr Ser Asn Asn Pro Arg Lys Phe Ser Glu Lys Ile Ala Leu1 5 10 15His Asn Gln Lys Gln Ala Glu Glu Thr Ala Ala Phe Glu Glu Val Met20 25 30Lys Asp Leu Ser Leu Thr Arg Ala Ala Arg Leu Gln Leu Gln Lys Ser35 40 45Gln Tyr Leu Gln Leu Gly Pro Ser Arg Gly Gln Tyr Tyr Gly Gly Ser50 55 60Leu Pro Asn Val Asn Gln Ile Gly Ser Gly Thr Met Asp Leu Pro Phe
65 70 75 80Gln Pro Ser Gly Phe Leu Gly Glu Ala Leu Ala Ala Ala Pro Val Ser85 90 95Leu Thr Pro Phe Gln Ser Ser Gly Leu Asp Thr Ser Arg Thr Thr Arg100 105 110His His Gly Leu Val Asp Arg Val Tyr Arg Glu Arg Gly Arg Leu Gly115 120 125Ser Pro His Arg Arg Pro Leu Ser Val Asp Lys His Gly Arg Gln Ala130 135 140Asp Ser Cys Pro Tyr Gly Thr Met Tyr Leu Ser Pro Pro Ala Asp Thr145 150 155 160Ser Trp Arg Arg Thr Asn Ser Asp Ser Ala Leu His Gln Ser Thr Met165 170 175Thr Pro Thr Gln Pro Glu Ser Phe Ser Ser Gly Ser Gln Asp Val His180 185 190Gln Lys Arg Val Leu Leu Leu Thr Val Pro Gly Met Glu Glu Thr Thr195 200 205Ser Glu Ala Asp Lys Asn Leu Ser Lys Gln Ala Trp Asp Thr Lys Lys210 215 220Thr Gly Ser Arg Pro Lys Ser Cys Glu Val Pro Gly Ile Asn Ile Phe225 230 235 240Pro Ser Ala Asp Gln Glu Asn Thr Thr Ala Leu Ile Pro Ala Thr His245 250 255Asn Thr Gly Gly Ser Leu Pro Asp Leu Thr Asn Ile His Phe Pro Ser260 265 270Pro Leu Pro Thr Pro Leu Asp Pro Glu Glu Pro Thr Phe Pro Ala Leu275 280 285Ser Ser Ser Ser Ser Thr Gly Asn Leu Ala Ala Asn Leu Thr His Leu290 295 300Gly Ile Gly Gly Ala Gly Gln Gly Met Ser Thr Pro Gly Ser Ser Pro305 310 315 320Gln His Arg Pro Ala Gly Val Ser Pro Leu Ser Leu Ser Thr Glu Ala325 330 335Arg Arg Gln Gln Ala Ser Pro Thr Leu Ser Pro Leu Ser Pro Ile Thr340 345 350Gln Ala Val Ala Met Asp Ala Leu Ser Leu Glu Gln Gln Leu Pro Tyr355 360 365Ala Phe Phe Thr Gln Ala Gly Ser Gln Gln Pro Pro Pro Gln Pro Gln370 375 380Pro Pro Pro Pro Pro Pro Pro Ala Ser Gln Gln Pro Pro Pro Pro Pro385 390 395 400Pro Pro Gln Ala Pro Val Arg Leu Pro Pro Gly Gly Pro Leu Leu Pro405 410 415Ser Ala Ser Leu Thr Arg Gly Pro Gln Pro Pro Pro Leu Ala Val Thr
420 425 430Val Pro Ser Ser Leu Pro Gln Ser Pro Pro Glu Asn Pro Gly Gln Pro435 440 445Ser Met Gly Ile Asp Ile Ala Ser Ala Pro Ala Leu Gln Gln Tyr Arg450 455 460Thr Ser Ala Gly Ser Pro Ala Asn Gln Ser Pro Thr Ser Pro Val Ser465 470 475 480Asn Gln Gly Phe Ser Pro Gly Ser Ser Pro Gln His Thr Ser Thr Leu485 490 495Gly Ser Val Phe Gly Asp Ala Tyr Tyr Glu Gln Gln Met Ala Ala Arg500 505 510Gln Ala Asn Ala Leu Ser His Gln Leu Glu Gln Phe Asn Met Met Glu515 520 525Asn Ala Ile Ser Ser Ser Ser Leu Tyr Ser Pro Gly Ser Thr Leu Asn530 535 540Tyr Ser Gln Ala Ala Met Met Gly Leu Thr Gly Ser His Gly Ser Leu545 550 555 560Pro Asp Ser Gln Gln Leu Gly Tyr Ala Ser His Ser Gly Ile Pro Asn565 570 575Ile Ile Leu Thr Val Thr Gly Glu Ser Pro Pro Ser Leu Ser Lys Glu580 585 590Leu Thr Ser Ser Leu Ala Gly Val Gly Asp Val Ser Phe Asp Ser Asp595 600 605Ser Gln Phe Pro Leu Asp Glu Leu Lys Ile Asp Pro Leu Thr Leu Asp610 615 620Gly Leu His Met Leu Asn Asp Pro Asp Met Val Leu Ala Asp Pro Ala625 630 635 640Thr Glu Asp Thr Phe Arg Met Asp Arg Leu645 650<210>3<211>32<212>DNA<213>人工序列<220>
<223>引物<400>3gcccaagctt tgtgctctgc tgtctctgaa ag32<210>4<211>23
<212>DNA<213>人工序列<220>
<223>引物<400>4gccctgaggg gatgggccat cag 23<210>5<211>36<212>DNA<213>人工序列<220>
<223>引物<400>5cgcggatccg aagtgtgatg actcaggttt gccctg36<210>6<211>36<212>DNA<213>人工序列<220>
<223>引物<400>6cgcggatccg aagtgtgata tctcaggttt gccctg36<210>7<211>54<212>DNA<213>人工序列<220>
<223>引物<400>7gccctgaggg gatgggccat cagttgcaaa tcgttaactt tcctctgaca taat54<210>8<211>39
<212>DNA<213>人工序列<220>
<223>引物<400>8gccctgaggg gatgggccat cagctacgag tcgtggaat 39<210>9<211>47<212>DNA<213>人工序列<220>
<223>引物<400>9cgcggatccg aagtgtgatg actcaggttt gccctgaggg gatgggc47<210>10<211>43<212>DNA<213>人工序列<220>
<223>引物<400>10cagttgcaaa tcgtggaatt tcctctcgat caatgaaaag atg43<210>11<211>39<212>DNA<213>人工序列<220>
<223>引物<400>11gccctgaggg gatgggccat cagttgcaaa tcgtggaat 39<210>12<211>19
<212>DNA<213>人工序列<220>
<223>引物<400>12cgcctggtac cgagctctg 19<210>13<211>19<212>DNA<213>人工序列<220>
<223>引物<400>13acccaagatc tcgagcccg 19<210>14<211>99<212>DNA<213>人工序列<220>
<223>引物<400>14cgcctggtac cgagctctga cataatgaca taatgacata atgacataat gacataatga 60cataattacg cgtgctagcc cgggctcgag atcttgggt99<210>15<211>2520<212>DNA<213>人<220>
<221>修饰碱基<222>(0)...(0)<221>misc feature<222>2,13,2431,2453,2465,2468,2469,2479,2488,2489,2492,2505,2512,2514,2519,2520
<223>n=A,T,C或G<400>15antttttgta canaaaagca ggctgttacc ggtccggatt cccgggatct aggctggggc 60cgggttcgcg gtgctcgctg aggcggcggt ggctacggct ggaggagccg ggccgaggcc 120gcggcggagg ccgcggctgg tactgggagg gtggcaggga gggacgggga aggaagatgg 180cgacgtcggg ggcgaacggg cctggttcgg ccacggcctc ggcttccaat ccgcgcaaat 240ttagtgagaa gattgcgctg cagaagcagc gtcaggccga ggagacggcg gccttcgagg 300aggtgatgat ggacatcggc tccacccggt tacaggccca aaaactgcga ctggcataca 360caaggagctc tcattatggt gggtctctgc ccaatgttaa ccagattggc tctggcctgg 420ccgagttcca gagccccctc cactcacctt tggattcatc tcggagcact cggcaccatg 480ggctggtgga acgggtgcag cgagatcctc gaagaatggt gtccccactt cgccgataca 540cccgccacat tgacagctct ccctatagtc ctgcctactt atctcctccc ccagagtcta 600gctggcgaag gacgatggcc tggggcaatt tccctgcaga gaaggggcag ttgtttcgac 660taccatctgc acttaacagg acaagctctg actctgccct tcatacaagt gtgatgaacc 720ccagtcccca ggatacctac ccaggcccca cacctcccag catcctgccc agccgacgtg 780ggggtattct ggatggtgaa atggacccca aagtacctgc tattgaggag aacttgctag 840atgacaagca tttgctgaag ccatgggatg ctaagaagct atcctcatcc tcttcccgac 900ctcggtcctg tgaagtccct ggaattaaca tctttccatc tcctgaccag cctgccaatg 960tgcctgtcct cccacctgcc atgaacacgg ggggctccct acctgacctc accaacctgc 1020actttccccc accactgccc acccccctgg accctgaaga gacagcctac cctagcctga 1080gtgggggcaa cagtacctcc aatttgaccc acaccatgac tcacctgggc atcagcaggg 1140ggcatgggcc tgggcccggc tatgatgcac caggacttca ttcacctctc agccacccat 1200ccctgcagtc ctccctaagc aatcccaacc tccaggcttc cctgagcagt cctcagcccc 1260agcttcaggg ctcccacagc cacccctctc tgcctgcctc ctccttggcc tgccatgtac 1320tgcccaccac ctccctgggc cacccctcac tcagtgctcc ggctctctcc tcctcctctt 1380cctcctcctc cacttcatct cctgttttgg gcgccccctc ttaccctgct tctacccctg 1440gggcctcccc ccaccaccgc cgtgtgcccc tcagccccct gagtttgctc gcgggcccag 1500ccgacgccag aaggtcccaa cagcagctgc ccaaacagtt ttcgccaaca atgtcaccca 1560ccttgtcttc catcactcag ggcgtccccc tggataccag taaactgtcc actgaccagc 1620ggttaccccc ctacccatac agctccccaa gtctggttct gcctacccag ccccacaccc 1680caaagtctct acagcagcca gggctgccct ctcagtcttg ttcagtgcag tcctcaggtg 1740ggcagccccc aggcaggcag tctcattatg ggacaccgta cccacctggg cccagtgggc 1800atgggcaaca gtcttaccac cggccaatga gtgacttcaa cctggggaat ctggagcagt 1860tcagcatgga gagcccatca gccagcctgg tgctggatcc ccctggcttt tctgaagggc 1920ctggattttt agggggtgag gggccaatgg gtggccccca ggatccccac accttcaacc 1980accagaactt gacccactgt tcccgccatg gctcagggcc taacatcatc ctcacagggg 2040actcctctcc aggtttctct aaggagattg cagcagccct ggccggagtg cctggctttg 2100aggtgtcagc agctggattg gagctagggc ttgggctaga agatgagctg cgcatggagc 2160cactgggcct ggaagggcta aacatgctga gtgacccctg tgccctgctg cctgatcctg 2220ctgtggagga gtcattccgc agtgaccggc tccaatgagg gcacctcatc accatccctc 2280ttcttggccc catcccccac caccattcct ttcctccctt ccccctggca ggtagagact 2340ctactctctg tccccagatc ctctttctag catgaatgaa ggatgccaag aatgagaaaa 2400agcaaggggt ttgtccaggt ggcccctgaa ntctgcgcaa gggatgggcc tgnggggaac 2460
ctcanggnna gggcccaang gccacttnna anctttgaac cgtcngtctg gnanggtcnn 2520<210>16<211>693<212>PRT<213>人<400>16Met Ala Thr Ser Gly Ala Asn Gly Pro Gly Ser Ala Thr Ala Ser Ala1 5 10 15Ser Asn Pro Arg Lys Phe Ser Glu Lys Ile Ala Leu Gln Lys Gln Arg20 25 30Gln Ala Glu Glu Thr Ala Ala Phe Glu Glu Val Met Met Asp Ile Gly35 40 45Ser Thr Arg Leu Gln Ala Gln Lys Leu Arg Leu Ala Tyr Thr Arg Ser50 55 60Ser His Tyr Gly Gly Ser Leu Pro Asn Val Asn Gln Ile Gly Ser Gly65 70 75 80Leu Ala Glu Phe Gln Ser Pro Leu His Ser Pro Leu Asp Ser Ser Arg85 90 95Ser Thr Arg His His Gly Leu Val Glu Arg Val Gln Arg Asp Pro Arg100 105 110Arg Met Val Ser Pro Leu Arg Arg Tyr Thr Arg His Ile Asp Ser Ser115 120 125Pro Tyr Ser Pro Ala Tyr Leu Ser Pro Pro Pro Glu Ser Ser Trp Arg130 135 140Arg Thr Met Ala Trp Gly Asn Phe Pro Ala Glu Lys Gly Gln Leu Phe145 150 155 160Arg Leu Pro Ser Ala Leu Asn Arg Thr Ser Ser Asp Ser Ala Leu His165 170 175Thr Ser Val Met Asn Pro Ser Pro Gln Asp Thr Tyr Pro Gly Pro Thr180 185 190Pro Pro Ser Ile Leu Pro Ser Arg Arg Gly Gly Ile Leu Asp Gly Glu195 200 205Met Asp Pro Lys Val Pro Ala Ile Glu Glu Asn Leu Leu Asp Asp Lys210 215 220His Leu Leu Lys Pro Trp Asp Ala Lys Lys Leu Ser Ser Ser Ser Ser225 230 235 240Arg Pro Arg Ser Cys Glu Val Pro Gly Ile Asn Ile Phe Pro Ser Pro245 250 255Asp Gln Pro Ala Asn Val Pro Val Leu Pro Pro Ala Met Asn Thr Gly260 265 270Gly Ser Leu Pro Asp Leu Thr Asn Leu His Phe Pro Pro Pro Leu Pro
275 280 285Thr Pro Leu Asp Pro Glu Glu Thr Ala Tyr Pro Ser Leu Ser Gly Gly290 295 300Asn Ser Thr Ser Asn Leu Thr His Thr Met Thr His Leu Gly Ile Ser305 310 315 320Arg Gly His Gly Pro Gly Pro Gly Tyr Asp Ala Pro Gly Leu His Ser325 330 335Pro Leu Ser His Pro Ser Leu Gln Ser Ser Leu Ser Asn Pro Asn Leu340 345 350Gln Ala Ser Leu Ser Ser Pro Gln Pro Gln Leu Gln Gly Ser His Ser355 360 365His Pro Ser Leu Pro Ala Ser Ser Leu Ala Cys His Val Leu Pro Thr370 375 380Thr Ser Leu Gly His Pro Ser Leu Ser Ala Pro Ala Leu Ser Ser Ser385 390 395 400Ser Ser Ser Ser Ser Thr Ser Ser Pro Val Leu Gly Ala Pro Ser Tyr405 410 415Pro Ala Ser Thr Pro Gly Ala Ser Pro His His Arg Arg Val Pro Leu420 425 430Ser Pro Leu Ser Leu Leu Ala Gly Pro Ala Asp Ala Arg Arg Ser Gln435 440 445Gln Gln Leu Pro Lys Gln Phe Ser Pro Thr Mer Ser Pro Thr Leu Ser450 455 460Ser Ile Thr Gln Gly Val Pro Leu Asp Thr Ser Lys Leu Ser Thr Asp465 470 475 480Gln Arg Leu Pro Pro Tyr Pro Tyr Ser Ser Pro Ser Leu Val Leu Pro485 490 495Thr Gln Pro His Thr Pro Lys Ser Leu Gln Gln Pro Gly Leu Pro Ser500 505 510Gln Ser Cys Ser Val Gln Ser Ser Gly Gly Gln Pro Pro Gly Arg Gln515 520 525Ser His Tyr Gly Thr Pro Tyr Pro Pro Gly Pro Ser Gly His Gly Gln530 535 540Gln Ser Tyr His Arg Pro Met Ser Asp Phe Asn Leu Gly Asn Leu Glu545 550 555 560Gln Phe Ser Met Glu Ser Pro Ser Ala Ser Leu Val Leu Asp Pro Pro565 570 575Gly Phe Ser Glu Gly Pro Gly Phe Leu Gly Gly Glu Gly Pro Met Gly580 585 590Gly Pro Gln Asp Pro His Thr Phe Asn His Gln Asn Leu Thr His Cys595 600 605Ser Arg His Gly Ser Gly Pro Asn Ile Ile Leu Thr Gly Asp Ser Ser610 615 620Pro Gly Phe Ser Lys Glu Ile Ala Ala Ala Leu Ala Gly Val Pro Gly
625 630 635 640Phe Glu Val Ser Ala Ala Gly Leu Glu Leu Gly Leu Gly Leu Glu Asp645 650 655Glu Leu Arg Met Glu Pro Leu Gly Leu Glu Gly Leu Asn Met Leu Ser660 665 670Asp Pro Cys Ala Leu Leu Pro Asp Pro Ala Val Glu Glu Ser Phe Arg675 680 685Ser Asp Arg Leu Gln690<210>17<211>17<212>DNA<213>人<400>17ccgtcatttc accaagc 17<210>18<211>7<212>PRT<213>人<400>18Glu Glu Thr Arg Ala Phe Glu1 5<210>19<211>7<212>PRT<213>未知<220>
<223>预测的蛋白质<400>19Glu Glu Thr Ala Ala Phe Glu1 5<210>20<211>34
<212>DNA<213>人工序列<220>
<223>引物<400>20ccggaattcg ccatggccgc ctcgccgggc tcgg 34<210>2l<211>44<212>DNA<213>人工序列<220>
<223>引物<400>21ccgcgacagg gtgaggtcgg tcatgagctg ctcgaaggcc cgcg 44<210>22<211>44<212>DNA<213>人工序列<220>
<223>引物<400>22gaagcttctg aaattgaacc cgcgacaggg tgaggtcggt catg 44<210>23<211>63<212>DNA<213>人工序列<220>
<223>引物<400>23tggtaaggat cctccatggt actgtgtaag gcgcagttgc tgaagcttc tgaaattgaac 60ccg 63<210>24
<211>2259<212>DNA<213>人<220>
<221>misc_feature<222>1,13<223>n=A,T,C或G<400>24nttttttgta canaaaagca ggctgttacc ggtccggaat tcgccatggc cgcctcgccg 60ggctcgggca gcgccaaccc gcggaagttc agtgagaaga tcgcgctgca cacgcagaga 120caggccgagg agacgcgggc cttcgagcag ctcatgaccg acctcaccct gtcgcgggtt 180caatttcaga agcttcagca actgcgcctt acacagtacc atggaggatc cttaccaaat 240gtgagccagc tgcggagcaa tgcgtcagag tttcagccgt catttcacca agctgataat 300gttcggggaa cccgccatca cgggctggtg gagaggccat ccaggaaccg cttccacccc 360ctccaccgaa ggtctgggga caagccaggg cgacaatttg atggtagtgc ttttggagcc 420aattattcct cacagcctct ggatgagagt tggccaaggc agcagcctcc ttggaaagac 480gaaaagcatc ctgggttcag gctgacatct gcacttaaca ggaccaattc tgattctgct 540cttcacacga gtgctctgag taccaagccc caggacccct atggaggagg gggccagtcg 600gcctggcctg ccccatacat ggggttttgt gatggtgaga ataatggaca tggggaagta 660gcatctttcc ctggcccatt gaaagaagag aatctgttaa atgttcctaa gccactgcca 720aaacaactgt gggagaccaa ggagattcag tccctgtcag gacgccctcg atcctgtgat 780gttggaggtg gcaatgcttt tccacataat ggtcaaaacc taggcctctc acccttcttg 840gggactttga acactggagg gtcattgcca gatctaacca acctccacta ctcgacaccc 900ctgccagcct ccctggacac caccgaccac cactttggca gtatgagtgt ggggaatagt 960gtgaacaaca tcccagctgc tatgacccac ctgggtataa gaagctcctc tggtctccag 1020agttctcgga gtaacccctc catccaagcc acgctcaata agactgtgct ttcctcttcc 1080ttaaataacc acccacagac atctgttccc aacgcatctg ctcttcaccc ttcgctccgt 1140ctgttttccc ttagcaaccc atctctttcc accacaaacc tgagcggccc gtctcgccgt 1200cggcagcctc ccgtcagccc tctcacgctt tctcctggcc ctgaagcaca tcaaggtttc 1260agcagacagc tgtcttcaac cagcccactg gccccatatc ctacctccca gatggtgtcc 1320tcagaccgaa gccaactttc ctttctgccc acagaagctc aagcccaggt gtcgccgcca 1380cccccttacc ctgcacccca ggagctcacc cagcccctcc tgcagcagcc ccgcgcccct 1440gaggcccctg cccagcagcc ccaggcagcc tcctcactgc cacagtcaga ctttcagctt 1500ctcccggccc agggctcatc tttgaccaac ttcttcccag atgtgggttt tgaccagcag 1560tccatgaggc caggccctgc ctttcctcaa caggtgcctc tggtgcaaca aggttcccga 1620gaactgcagg actcttttca tttgagacca agcccgtatt ccaactgcgg gagtctcccg 1680aacaccatcc tgccagaaga ctccagcacc agcctgttca aagacctcaa cagtgcgctg 1740gcaggcctgc ctgaggtcag cctgaacgtg gacactccat ttccactgga agaggagctg 1800cagattgaac ccctgagcct ggatggactc aacatgttaa gtgactccag catgggcctg 1860ctggacccct ctgttgaaga gacgtttcga gctgacagac tgtgaacaga aggcagtgga 1920acagaagaat gtttttctgc aacagccaaa atagaatgga atagaatgaa gccagctgat 1980accacgggct ttcgttatct tgacatagaa ggaagcagtg ccacggctcc agggtttcag 2040
atgagatccc atctcagaca ctgtggcttc ctccagatca cacagctttg tactgcctct 2100cccgcctgtg gccaaagtcg tgttgcagca ggcaggctgc ttggagcttc ccatgaactg 2160gaaagctcac ctccactgca tctttttact ggccatccag tcagccgatg tgtaagagta 2220ggaaatactg tgtcactgga ggccctccgt agcattggg2259<210>25<211>619<212>PRT<213>人<400>25Met Ala Ala Ser Pro Gly Ser Gly Ser Ala Asn Pro Arg Lys Phe Ser1 5 10 15Glu Lys Ile Ala Leu His Thr Gln Arg Gln Ala Glu Glu Thr Arg Ala20 25 30Phe Glu Gln Leu Met Thr Asp Leu Thr Leu Ser Arg Val Gln Phe Gln35 40 45Lys Leu Gln Gln Leu Arg Leu Thr Gln Tyr His Gly Gly Ser Leu Pro50 55 60Asn Val Ser Gln Leu Arg Ser Asn Ala Ser Glu Phe Gln Pro Ser Phe65 70 75 80His Gln Ala Asp Asn Val Arg Gly Thr Arg His His Gly Leu Val Glu85 90 95Arg Pro Ser Arg Asn Arg Phe His Pro Leu His Arg Arg Ser Gly Asp100 105 110Lys Pro Gly Arg Gln Phe Asp Gly Ser Ala Phe Gly Ala Asn Tyr Ser115 120 125Ser Gln Pro Leu Asp Glu Ser Trp Pro Arg Gln Gln Pro Pro Trp Lys130 135 140Asp Glu Lys His Pro Gly Phe Arg Leu Thr Ser Ala Leu Asn Arg Thr145 150 155 160Asn Ser Asp Ser Ala Leu His Thr Ser Ala Leu Ser Thr Lys Pro Gln165 170 175Asp Pro Tyr Gly Gly Gly Gly Gln Ser Ala Trp Pro Ala Pro Tyr Met180 185 190Gly Phe Cys Asp Gly Glu Asn Asn Gly His Gly Glu Val Ala Ser Phe195 200 205Pro Gly Pro Leu Lys Glu Glu Asn Leu Leu Asn Val Pro Lys Pro Leu210 215 220Pro Lys Gln Leu Trp Glu Thr Lys Glu Ile Gln Ser Leu Ser Gly Arg225 230 235 240Pro Arg Ser Cys Asp Val Gly Gly Gly Asn Ala Phe Pro His Asn Gly245 250 255Gln Asn Leu Gly Leu Ser Pro Phe Leu Gly Thr Leu Asn Thr Gly Gly
260 265 270Ser Leu Pro Asp Leu Thr Asn Leu His Tyr Ser Thr Pro Leu Pro Ala275 280 285Ser Leu Asp Thr Thr Asp His His Phe Gly Ser Met Ser Val Gly Asn290 295 300Ser Val Asn Asn Ile Pro Ala Ala Met Thr His Leu Gly Ile Arg Ser305 310 315 320Ser Ser Gly Leu Gln Ser Ser Arg Ser Asn Pro Ser Ile Gln Ala Thr325 330 335Leu Asn Lys Thr Val Leu Ser Ser Ser Leu Asn Asn His Pro Gln Thr340 345 350Ser Val Pro Asn Ala Ser Ala Leu His Pro Ser Leu Arg Leu Phe Ser355 360 365Leu Ser Asn Pro Ser Leu Ser Thr Thr Asn Leu Ser Gly Pro Ser Arg370 375 380Arg Arg Gln Pro Pro Val Ser Pro Leu Thr Leu Ser Pro Gly Pro Glu385 390 395 400Ala His Gln Gly Phe Ser Arg Gln Leu Ser Ser Thr Ser Pro Leu Ala405 410 415Pro Tyr Pro Thr Ser Gln Met Val Ser Ser Asp Arg Ser Gln Leu Ser420 425 430Phe Leu Pro Thr Glu Ala Gln Ala Gln Val Ser Pro Pro Pro Pro Tyr435 440 445Pro Ala Pro Gln Glu Leu Thr Gln Pro Leu Leu Gln Gln Pro Arg Ala450 455 460Pro Glu Ala Pro Ala Gln Gln Pro Gln Ala Ala Ser Ser Leu Pro Gln465 470 475 480Ser Asp Phe Gln Leu Leu Pro Ala Gln Gly Ser Ser Leu Thr Asn Phe485 490 495Phe Pro Asp Val Gly Phe Asp Gln Gln Ser Met Arg Pro Gly Pro Ala500 505 510Phe Pro Gln Gln Val Pro Leu Val Gln Gln Gly Ser Arg Glu Leu Gln515 520 525Asp Ser Phe His Leu Arg Pro Ser Pro Tyr Ser Asn Cys Gly Ser Leu530 535 540Pro Asn Thr Ile Leu Pro Glu Asp Ser Ser Thr Ser Leu Phe Lys Asp545 550 555 560Leu Asn Ser Ala Leu Ala Gly Leu Pro Glu Val Ser Leu Asn Val Asp565 570 575Thr Pro Phe Pro Leu Glu Glu Glu Leu Gln Ile Glu Pro Leu Ser Leu580 585 590Asp Gly Leu Asn Met Leu Ser Asp Ser Ser Met Gly Leu Leu Asp Pro595 600 605Ser Val Glu Glu Thr Phe Arg Ala Asp Arg Leu
610 615<210>26<211>2992<212>DNA<213>黑腹果蝇(drosophila melanogaster)<400>26atggccaatc cgcgcaagtt cagcgagaag atcgctctgc agaagcagaa gcaggcggag 60ggcacagcgg aattcgagcg gatcatgaag gaggtgtatg ccacgaagag ggatgagccg 120cctgcgaatc agaagatcct agacggcctt gtcggcggtc aggaggtaag ccaatcctcg 180ccaggcgcag gcaatgggac gggcggaggt ggcagtggtt ccggcagtgg agccagcggc 240ggaggagcct caccagatgg cctgggaggc ggcggtggtt ctccgacggc ttatcgagaa 300tcccgagggc gcagcgtagg tgtgggtccc atgcgaagac cgtcggagcg caagcaggat 360cgttcgccct acggcagcag cagtacgcaa caaaccttag acaacggcca gctaaatccg 420catcttcttg gtccacctac ggcggagagt ttgtggcggc ggtccagctc cgattcggcg 480ctgcaccaaa gtgcgctggt ggcgggcttc aatagcgacg tgaactcgat gggcgccaac 540tatcagcagc agcaacatca gcaacaacag caaccgggcc agccaagatc tcactcgccg 600caccatggta taaacaggac catgagtccg caggcgcaac ggaggaagtc gccgctactg 660cagccccatc agctgcagtt gcagcaactg caacagcagc agcaacagat gcaacatcag 720catcagctgc accagcagct ccaaatgcag cagctgcaac agcaccagca gcaacaccag 780cagcagcagc aacaacagaa cacgccatac aacaacgcca aattcacgaa tcctgtgttc 840cggccgctgc aggatcaggt caactttgcc aacaccggct ccctgcccga tctcacggcc 900cttcaaaact atggacccca gcagcagcag cagcaatccc agcaacagcc gtcgcagcaa 960caacagcagt tgcagcaaac cctgtcgcca gtcatgtctc cgcacaatca ccgccgcgaa 1020cgggatcagt cgcccagtcc gtttagtccg gcgggtggag gagggggagc aggtcccggg 1080tcgccctatc agcagcaaca gcactcgccc accggaaaca cgcaacagca gcagcagcag 1140caccaacagc ccagcaactc gccgcacctg tcctttacca atctggccac cacgcaggca 1200gctgttacca catttaaccc gctccccacg ctgggtccgc acaatgccac cgactaccgc 1260cagccaccga atcctcctag tccacgctct tcgcccggct tgctgagcag cgtatcggcc 1320acggatctgc actccagtgc accggccagt cccatacgcc agcagcaaca ggcccatcag 1380cagcaacagc agcagcaaca ggcgcagcaa caacagcaac agtttgataa ctcctacaac 1440agtctgaata cctcgtttca caatcagttt gagattttct cgctgggcga cagcaattcc 1500tcgccggaac agcagggctt tgcaaataat ttcgtggccc tcgactttga cgacctgagt 1560ggcggcggag gtggtggccc aagcgggggc ggcggcagca atggaggagg tctgaccaac 1620ggttacaaca agccggagat gttggacttc agcgagctga gcggcagccc ggaggcgagt 1680gggaacaaca accacatgcg gcgaggagtg agcaacctga acaacaacgg gttgagcaat 1740ggtgtggtgg gatccacgca caacggcagc acaaatctaa atggagcggg aaacaacaat 1800agcagtagtg gaggtggcac ggcgcaggat cctttgggaa taaccacttc gcctgtgccc 1860tcacccttgg gctgccccag ttcaccgctg ccgataccga ttccgatgtc ggcgcaaagc 1920tcgccacagc agcagcacca ccatcatcag cagcagcaac aacagcatca tcagcagcaa 1980caccatcagc agcagcaatt atcattatct ctgcaccatt cgccgcatca ttcgccaatg 2040cattcgccgc accatgggaa ttcaccgctt tcaagcagct cgccagtgag tcacaatgcc 2100
tgctccaact ccaacgtggt gatgaaccac cagcagcagc agcaacaaca tcaccaccag 2160caacaccatc atcagggctc ctcgcaaagt cacacgccga ccacagcgaa tataccctct 2220attatcttta gtgattactc ctccaacgcg gattatacca gggagatctt cgactccctc 2280gatctggatc tgggacagat ggacgtagcc ggtttgcaga tgctgtccga ccagaacccc 2340atcatgatcg ccgatcccaa catcgaggat agttttcgac gcgacctcaa ctgatactat 2400gaggaggctg ttgcggccat tgagagcgga gtgctgctgg aggaggacta ccaggcgctg 2460ctcggatcag aggcgctggc ggatgaacag gtggtcacag tcgaggccgc cggagccgca 2520gcagcagtag taacagttga agaggcagcc acagttagcg agaaggacaa aaaagatttg 2580gaagttgtgg aacttctggt gtccggtgtt atggatgacc tggtggactc cagtgacctg 2640gacgaggaag tgcgcaattt ctttttttag gcagccagca agtcattttt gtcgttaaca 2700caactgatgg aattttcgtt tttaacacag atgaggaagt gaattacgtt ttttaaacgc 2760attcacttgc catttctcga ttaaatgcca tattacttaa gctcaggatt tacaagctta 2820atgcgaatta agttaatttc ggaaatgctg acgagagtga ttgcaaagtt caaaattgat 2880acaaattcac ttccgcaaat tcatgctgaa actgaaagtt ttctaacagt cctcaatatt 2940gttatctcgt tatcgtccgt gctttcgtag ctagctccta caacaaaaat ac 2992<210>27<211>797<212>PRT<213>黑腹果蝇<400>27Met Ala Asn Pro Arg Lys Phe Ser Glu Lys Ile Ala Leu Gln Lys Gln1 5 10 15Lys Gln Ala Glu Gly Thr Ala Glu Phe Glu Arg Ile Met Lys Glu Val20 25 30Tyr Ala Thr Lys Arg Asp Glu Pro Pro Ala Asn Gln Lys Ile Leu Asp35 40 45Gly Leu Val Gly Gly Gln Glu Val Ser Gln Ser Ser Pro Gly Ala Gly50 55 60Asn Gly Thr Gly Gly Gly Gly Ser Gly Ser Gly Ser Gly Ala Ser Gly65 70 75 80Gly Gly Ala Ser Pro Asp Gly Leu Gly Gly Gly Gly Gly Ser Pro Thr85 90 95Ala Tyr Arg Glu Ser Arg Gly Arg Ser Val Gly Val Gly Pro Met Arg100 105 110Arg Pro Ser Glu Arg Lys Gln Asp Arg Ser Pro Tyr Gly Ser Ser Ser115 120 125Thr Gln Gln Thr Leu Asp Asn Gly Gln Leu Asn Pro His Leu Leu Gly130 135 140Pro Pro Thr Ala Glu Ser Leu Trp Arg Arg Ser Ser Ser Asp Ser Ala145 150 155 160Leu His Gln Ser Ala Leu Val Ala Gly Phe Asn Ser Asp Val Asn Ser165 170 175
Met Gly Ala Asn Tyr Gln Gln Gln Gln His Gln Gln Gln Gln Gln Pro180 185 190Gly Gln Pro Arg Ser His Ser Pro His His Gly Ile Asn Arg Thr Met195 200 205Ser Pro Gln Ala Gln Arg Arg Lys Ser Pro Leu Leu Gln Pro His Gln210 215 220Leu Gln Leu Gln Gln Leu Gln Gln Gln Gln Gln Gln Met Gln His Gln225 230 235 240His Gln Leu His Gln Gln Leu Gln Met Gln Gln Leu Gln Gln His Gln245 250 255Gln Gln His Gln Gln Gln Gln Gln Gln Gln Asn Thr Pro Tyr Asn Asn260 265 270Ala Lys Phe Thr Asn Pro Val Phe Arg Pro Leu Gln Asp Gln Val Asn275 280 285Phe Ala Asn Thr Gly Ser Leu Pro Asp Leu Thr Ala Leu Gln Asn Tyr290 295 300Gly Pro Gln Gln Gln Gln Gln Gln Ser Gln Gln Gln Pro Ser Gln Gln305 310 315 320Gln Gln Gln Leu Gln Gln Thr Leu Ser Pro Val Met Ser Pro His Asn325 330 335His Arg Arg Glu Arg Asp Gln Ser Pro Ser Pro Phe Ser Pro Ala Gly340 345 350Gly Gly Gly Gly Ala Gly Pro Gly Ser Pro Tyr Gln Gln Gln Gln His355 360 365Ser Pro Thr Gly Asn Thr Gln Gln Gln Gln Gln Gln His Gln Gln Pro370 375 380Ser Asn Ser Pro His Leu Ser Phe Thr Asn Leu Ala Thr Thr Gln Ala385 390 395 400Ala Val Thr Thr Phe Asn Pro Leu Pro Thr Leu Gly Pro His Asn Ala405 410 415Thr Asp Tyr Arg Gln Pro Pro Asn Pro Pro Ser Pro Arg Ser Ser Pro420 425 430Gly Leu Leu Ser Ser Val Ser Ala Thr Asp Leu His Ser Ser Ala Pro435 440 445Ala Ser Pro Ile Arg Gln Gln Gln Gln Ala His Gln Gln Gln Gln Gln450 455 460Gln Gln Gln Ala Gln Gln Gln Gln Gln Gln Phe Asp Asn Ser Tyr Asn465 470 475 480Ser Leu Asn Thr Ser Phe His Asn Gln Phe Glu Ile Phe Ser Leu Gly485 490 495Asp Ser Asn Ser Ser Pro Glu Gln Gln Gly Phe Ala Asn Asn Phe Val500 505 510Ala Leu Asp Phe Asp Asp Leu Ser Gly Gly Gly Gly Gly Gly Pro Ser515 520 525
Gly Gly Gly Gly Ser Asn Gly Gly Gly Leu Thr Asn Gly Tyr Asn Lys530 535 540Pro Glu Met Leu Asp Phe Ser Glu Leu Ser Gly Ser Pro Glu Ala Ser545 550 555 560Gly Asn Asn Asn His Met Arg Arg Gly Val Ser Asn Leu Asn Asn Asn565 570 575Gly Leu Ser Asn Gly Val Val Gly Ser Thr His Asn Gly Ser Thr Asn580 585 590Leu Asn Gly Ala Gly Asn Asn Asn Ser Ser Ser Gly Gly Gly Thr Ala595 600 605Gln Asp Pro Leu Gly Ile Thr Thr Ser Pro Val Pro Ser Pro Leu Gly610 615 620Cys Pro Ser Ser Pro Leu Pro Ile Pro Ile Pro Met Ser Ala Gln Ser625 630 635 640Ser Pro Gln Gln Gln His His His His Gln Gln Gln Gln Gln Gln His645 650 655His Gln Gln Gln His His Gln Gln Gln Gln Leu Ser Leu Ser Leu His660 665 670His Ser Pro His His Ser Pro Met His Ser Pro His His Gly Asn Ser675 680 685Pro Leu Ser Ser Ser Ser Pro Val Ser His Asn Ala Cys Ser Asn Ser690 695 700Asn Val Val Met Asn His Gln Gln Gln Gln Gln Gln His His His Gln705 710 715 720Gln His His His Gln Gly Ser Ser Gln Ser His Thr Pro Thr Thr Ala725 730 735Asn Ile Pro Ser Ile Ile Phe Ser Asp Tyr Ser Ser Asn Ala Asp Tyr740 745 750Thr Arg Glu Ile Phe Asp Ser Leu Asp Leu Asp Leu Gly Gln Met Asp755 760 765Val Ala Gly Leu Gln Met Leu Ser Asp Gln Asn Pro Ile Met Ile Ala770 775 780Asp Pro Asn Ile Glu Asp Ser Phe Arg Arg Asp Leu Asn785 790 795<210>28<211>2416<212>DNA<213>小鼠<220>
<221>misc feature<222>1528
<223>n =A,T,C或G<400>28gggacgaaga gtaggagtag gaggaggcgg cgagaagatg gcgacttcga acaatccgcg 60gaaatttagc gagaagatcg cactgcacaa ccagaagcag gcggaggaga cggcggcctt 120cgaggaggtc atgaaggacc tgagcctgac gcgggccgcg cggcttcagc tgcagaagtc 180ccagtacctg cagctgggcc ccagccgtgg ccagtactac ggtgggtccc tgcccaacgt 240gaaccagatt ggaagcagca gcgtggacct ggccttccag accccatttc agtcctcagg 300cctggacacg agtcggacca cacgacatca tgggcttgtg gacagagtat atcgtgagcg 360tggcagactt ggctccccgc accgtcgacc cctgtcagta gacaagcatg ggcgacaggc 420tgacagctgc ccctatggca ccgtgtacct ctcgcctcct gcggacacca gctggaggag 480gaccaactct gactctgccc tgcaccagag cacaatgaca cccagccagg cagagtcctt 540cacaggcggg tcccaggatg cgcaccagaa gagagtctta ctgctaactg tcccaggaat 600ggaggacacc ggggctgaga cagacaagac cctttctaag cagtcatggg actcaaagaa 660ggcgggttcc aggcccaagt cctgtgaggt ccccggaatc aacatctttc cgtctgcaga 720ccaggagaac acaacagccc tgatccctgc cacccacaac acagggggct cccttcctga 780cctcaccaac atccacttcg cctccccact cccgacacca ctggaccctg aggagcctcc 840gttccctgct ctcaccagct ccagcagcac cggcagcctt gcacatctgg gcgttggcgg 900cgcaggcggt atgaacaccc ccagctcttc tccacagcac cggccagcag tcgtcagccc 960cctgtccctg agcacagagg ccaggcggca gcaggcccag caggtgtcac ccaccctgtc 1020tccgttgtca cccatcactc aggccgtggc tatggatgcc ctgtccttgg agcagcagct 1080gccctatgcc ttcttcaccc agactggctc ccagcagcct cccccacagc cccagccacc 1140gcctccacct ccaccggtat cccagcagca gccaccacct ccacaggtgt ctgtgggcct 1200cccccagggt ggtccactgc tgcccagtgc cagcctgact cgggggcccc agctgccacc 1260actctcagtt actgtaccat ccactcttcc ccagtcccct acagagaacc caggccagtc 1320accaatgggg atcgatgcca cttcggcacc agctctgcag taccgcacga gtgcagggtc 1380acctgccacc cagtctccca cctctccggt ctccaaccaa ggcttctccc ctggaagctc 1440cccacagcac acgtccaccc tgggcagcgt gtttggggat gcgtactatg agcagcagat 1500gacagccagg caggccaatg ctctgtcncg ccagctggag cagttcaaca tgatggagaa 1560cgccatcagc tccagcagcc tatacaaccc gggctccaca ctcaactatt cccaggctgc 1620catgatgggt ctgagcggga gccacggggg cctacaggac ccgcagcagc tcggctacac 1680aggccacggt ggaatcccca acatcatcct cacggtgaca ggagagtcac caccgagcct 1740ctctaaggaa ctgagcagca cactggcagg agtcagtgat gtcagctttg attcggacca 1800tcagtttcca ctggacgagc tgaagattga ccctctgacc ctggacggac tccatatgtt 1860gaatgaccca gacatggttt tagccgaccc agccaccgag gacaccttcc gaatggaccg 1920cctgtgagtg gctgtgccca ccagccgccg ctggtcagtc tccaacggcg ctgccccaaa 1980cctggggacg gcaatggcgt ccccctttgc caacggccaa gcttgtggtt ctgagcttgc 2040aatgctgccc agtgcccctg ccagcccccc gccaccccgg tcgttcacct cccatgatgc 2100ctggcgtgcg tgaggccgct gtgtactagg ctggctatct gtctgtccat ccatctacct 2160ggggtcaggc tgatggccga ggctgtgagt gcctggcccc catggatgtt ccccgtgctc 2220gctccctcac ccctcactgg ggatgtgaga gccctcatca gatacccaaa gtgtcactca 2280cttccagcat gtgctgtgca acggagggcc ggggcgtggg tgtggagcgc ccagaggctt 2340aggtgcgcca tccattcgac tgttgtcagc tgtcactgcc ttcctccatc ctgtcccccg 2400tcccaccgcc atccct 2416
<210>29<211>629<212>PRT<213>小鼠<400>29Met Ala Thr Ser Asn Asn Pro Arg Lys Phe Ser Glu Lys Ile Ala Leu1 5 10 15His Asn Gln Lys Gln Ala Glu Glu Thr Ala Ala Phe Glu Glu Val Met20 25 30Lys Asp Leu Ser Leu Thr Arg Ala Ala Arg Leu Gln Leu Gln Lys Ser35 40 45Gln Tyr Leu Gln Leu Gly Pro Ser Arg Gly Gln Tyr Tyr Gly Gly Ser50 55 60Leu Pro Asn Val Asn Gln Ile Gly Ser Ser Ser Val Asp Leu Ala Phe65 70 75 80Gln Thr Pro Phe Gln Ser Ser Gly Leu Asp Thr Ser Arg Thr Thr Arg85 90 95His His Gly Leu Val Asp Arg Val Tyr Arg Glu Arg Gly Arg Leu Gly100 105 110Ser Pro His Arg Arg Pro Leu Ser Val Asp Lys His Gly Arg Gln Ala115 120 125Asp Ser Cys Pro Tyr Gly Thr Val Tyr Leu Ser Pro Pro Ala Asp Thr130 135 140Ser Trp Arg Arg Thr Asn Ser Asp Ser Ala Leu His Gln Ser Thr Met145 150 155 160Thr Pro Ser Gln Ala Glu Ser Phe Thr Gly Gly Ser Gln Asp Ala His165 170 175Gln Lys Arg Val Leu Leu Leu Thr Val Pro Gly Met Glu Asp Thr Gly180 185 190Ala Glu Thr Asp Lys Thr Leu Ser Lys Gln Ser Trp Asp Ser Lys Lys195 200 205Ala Gly Ser Arg Pro Lys Ser Cys Glu Val Pro Gly Ile Asn Ile Phe210 215 220Pro Ser Ala Asp Gln Glu Asn Thr Thr Ala Leu Ile Pro Ala Thr His225 230 235 240Asn Thr Gly Gly Ser Leu Pro Asp Leu Thr Asn Ile His Phe Ala Ser245 250 255Pro Leu Pro Thr Pro Leu Asp Pro Glu Glu Pro Pro Phe Pro Ala Leu260 265 270Thr Ser Ser Ser Ser Thr Gly Ser Leu Ala His Leu Gly Val Gly Gly275 280 285Ala Gly Gly Met Asn Thr Pro Ser Ser Ser Pro Gln His Arg Pro Ala
290 295 300Val Val Ser Pro Leu Ser Leu Ser Thr Glu Ala Arg Arg Gln Gln Ala305 310 315 320Gln Gln Val Ser Pro Thr Leu Ser Pro Leu Ser Pro Ile Thr Gln Ala325 330 335Val Ala Met Asp Ala Leu Ser LeuGlu Gln Gln Leu Pro Tyr Ala Phe340 345 350Phe Thr Gln Thr Gly Ser Gln Gln Pro Pro Pro Gln Pro Gln Pro Pro355 360 365Pro Pro Pro Pro Pro Val Ser Gln Gln Gln Pro Pro Pro Pro Gln Val370 375 380Ser Val Gly Leu Pro Gln Gly Gly Pro Leu Leu Pro Ser Ala Ser Leu385 390 395 400Thr Arg Gly Pro Gln Leu Pro Pro Leu Ser Val Thr Val Pro Ser Thr405 410 415Leu Pro Gln Ser Pro Thr Glu Asn Pro Gly Gln Ser Pro Met Gly Ile420 425 430Asp Ala Thr Ser Ala Pro Ala Leu Gln Tyr Arg Thr Ser Ala Gly Ser435 440 445Pro Ala Thr Gln Ser Pro Thr Ser Pro Val Ser Asn Gln Gly Phe Ser450 455 460Pro Gly Ser Ser Pro Gln His Thr Ser Thr Leu Gly Ser Val Phe Gly465 470 475 480Asp Ala Tyr Tyr Glu Gln Gln Met Thr Ala Arg Gln Ala Asn Ala Leu485 490 495Ser Arg Gln Leu Glu Gln Phe Asn Met Met Glu Asn Ala Ile Ser Ser500 505 510Ser Ser Leu Tyr Asn Pro Gly Ser Thr Leu Asn Tyr Ser Gln Ala Ala515 520 525Met Met Gly Leu Ser Gly Ser His Gly Gly Leu Gln Asp Pro Gln Gln530 535 540Leu Gly Tyr Thr Gly His Gly Gly Ile Pro Asn Ile Ile Leu Thr Val545 550 555 560Thr Gly Glu Ser Pro Pro Ser Leu Ser Lys Glu Leu Ser Ser Thr Leu565 570 575Ala Gly Val Ser Asp Val Ser Phe Asp Ser Asp His Gln Phe Pro Leu580 585 590Asp Glu Leu Lys Ile Asp Pro Leu Thr Leu Asp Gly Leu His Met Leu595 600 605Asn Asp Pro Asp Met Val Leu Ala Asp Pro Ala Thr Glu Asp Thr Phe610 615 620Arg Met Asp Arg Leu625
<210>30<211>566<212>PRT<213>红鳍东方豚(fugu rubripres)<400>30Met Ala Ser Ser Asn Asn Pro Arg Lys Phe Ser Glu Lys Ile Ala Leu1 5 10 15His Asn Gln Lys Gln Ala Glu Glu Thr Ala Ala Phe Glu Glu Val Met20 25 30Lys Asp Leu Asn Val Thr Arg Ala Ala Arg Leu Gln Leu Gln Lys Thr35 40 45Gln Tyr Leu Gln Leu Gly Gln Asn Arg Gly Gln Tyr Tyr Gly Gly Ser50 55 60Leu Pro Asn Val Asn Gln Ile Gly Asn Gly Asn Ile Asp Leu Pro Phe65 70 75 80Gln Val Ser Asn Ser Val Leu Asp Thr Ser Arg Thr Thr Arg His His85 90 95Gly Leu Val Glu Arg Val Tyr Arg Asp Arg Asn Arg Ile Ser Ser Pro100 105 110His Arg Arg Pro Leu Ser Val Asp Lys His Gly Arg Gln Arg Thr Asn115 120 125Ser Asp Ser Ala Leu His Gln Ser Ala Met Asn Pro Lys Pro His Glu130 135 140Val Phe Ala Gly Gly Ser Gln Glu Leu Gln Pro Lys Arg Leu Leu Leu145 150 155 160Thr Val Pro Gly Thr Glu Lys Ser Glu Ser Asn Ala Asp Lys Asp Ser165 170 175Gln Glu Gln Ser Trp Asp Asp Lys Lys Ser Ile Phe Pro Ser Pro Asp180 185 190Gln Glu Leu Asn Pro Ser Val Leu Pro Ala Ala His Asn Thr Gly Gly195 200 205Ser Leu Pro Asp Leu Thr Asn Ile Gln Phe Pro Pro Pro Leu Ser Thr210 215 220Pro Leu Asp Pro Glu Asp Thr Val Thr Phe Pro Ser Leu Ser Ser Ser225 230 235 240Asn Ser Thr Gly Ser Leu Thr Thr Asn Leu Thr His Leu Gly Ile Ser245 250 255Val Ala Ser His Gly Asn Asn Gly Glu Lys Asn Ile Phe Phe Leu Lys260 265 270Thr Cys Thr Ser Cys Glu Asp Val Tyr Asp Phe Tyr Phe Val Gly Ile275 280 285Pro Thr Ser Ser Gln Thr Thr Met Thr Ala Thr Ala Gln Arg Arg Gln
290 295 300Pro Pro Val Val Pro Leu Thr Leu Thr Ser Asp Leu Thr Leu Gln Gln305 310 315 320Ser Pro Gln Gln Leu Ser Pro Thr Leu Ser Ser Pro Ile Asn Ile Thr325 330 335Gln Ser Met Lys Leu Ser Ala Ser Ser Leu Gln Gln Tyr Arg Asn Gln340 345 350Thr Gly Ser Pro Ala Thr Gln Ser Pro Thr Ser Pro Val Ser Asn Gln355 360 365Gly Phe Ser Pro Gly Ser Ser Pro Gln Pro Gln His Ile Pro Val Val370 375 380Gly Ser Ile Phe Gly Asp Ser Phe Tyr Asp Gln Gln Leu Ala Leu Arg385 390 395 400Gln Thr Asn Ala Leu Ser His Gln Val Cys Glu Asp Gly Arg Arg Leu405 410 415Glu Ile Thr His Val Arg Leu Ser Arg Leu His Ala Glu Leu Cys Phe420 425 430Cys Phe Ser Gln Leu Glu Gln Phe Asn Met Ile Glu Asn Pro Ile Ser435 440 445Ser Thr Ser Leu Tyr Asn Gln Cys Ser Thr Leu Asn Tyr Thr Gln Ala450 455 460Ala Met Met Gly Leu Thr Gly Ser Ser Leu Gln Asp Ser Gln Gln Leu465 470 475 480Gly Tyr Gly Asn His Gly Asn Ile Pro Asn Ile Ile Leu Thr Ile Ser485 490 495Val Thr Gly Glu Ser Pro Pro Ser Leu Ser Lys Glu Leu Thr Asn Ser500 505 510Leu Ala Gly Val Gly Asp Val Ser Phe Asp Pro Asp Thr Gln Phe Pro515 520 525Leu Asp Glu Leu Lys Ile Asp Pro Leu Thr Leu Asp Gly Leu His Met530 535 540Leu Asn Asp Pro Asp Met Val Leu Ala Asp Pro Ala Thr Glu Asp Thr545 550 555 560Phe Arg Met Asp Arg Leu565<210>31<211>1602<212>DNA<213>红鳍东方豚<400>31atggcgtcct ctaacaatcc tcgcaaattt agcgaaaaaa tcgcac tgca taaccagaaa 60
caagcagagg agactgctgc gttcgaagaa gtgatgaagg acctgaacgt cacaagggct 120gcccgggtaa gacagctgca gttacagaag acccagtatt tgcaactagg gcagaatcgt 180ggacagtact atggaggctc actgcccaat gtcaatcaga ttggaaatgg caacattgac 240ctgccttttc aggtgagcag gacaaactca gactcagctt tacatcagag tgccatgaat 300ccaaagcccc acgaagtgtt tgctgggggg tcgcaggagc tgcagcccaa acgactgctg 360ctaacagtgc ctggaaccga aaaatcggaa tcaaacgcag acaaagattc gcaggagcag 420tcgtgggatg acaaaaagag tatttttcca tcaccagacc aggagttaaa cccctccgtg 480cttccagccg cgcacaacac cggcggttcg ctccccgacc tgaccaacat ccagttccct 540cctccactgt ccaccccact ggaccccgag gacaccgtca ccttcccctc cctcagctcc 600tctaacagca caggcagtct gactaccaac ctcacccacc tgggcatcag tgtggccagc 660catggtaata acggagagaa aaatatattt tttttaaaaa catgcacttc atgcgaggat 720gttaaataat attacgactt ttattttgta gggattccca cttcctctca aaccaccatg 780acagcaacag cacagcggcg gcaaccaccc gtggtccccc tcaccctcac ctctgacctg 840actcttcaac agtcccccca gcagctttca cccaccctct cctcacccat taacatcaca 900cagagcatga agcttagtgc tagctaacat tcttccctcc aacagtaccg caatcagact 960ggctcaccag ccactcagtc tccaacctcc ccagtctcca atcaaggctt ctcccccggc 1020agctcgcctc aaccacagca cattcctgtg gtgggcagta tatttgggga ctccttctat 1080gatcagcagt tggctctgag gcagaccaat gccctttctc atcaggtgtg tgaggacggc 1140cgcaggttag aaataacaca cgtacgtctc tcacgacttc acgccgagct ttgtttttgt 1200ttttctcagc tggagcagtt caatatgata gagaacccca tcagctccac cagcctgtac 1260aatcagtgct ccacccttaa ttacacacag gcagccatga tgggcctcac cgggagcagc 1320ctgcaggact cgcagcagct cggctacggc aatcacggca acatccccaa catcatactg 1380acaatttcag tcacagggga gtctccgccg agcctctcca aagagctgac caactcattg 1440gccggcgtcg gcgacgtcag ctttgatcca gacacgcagt ttcctctgga cgagctgaag 1500atcgacccgc tgaccttgga cggcctgcac atgctcaacg acccagacat ggtgctggca 1560gaccccgcca cagaggacac gttcaggatg gacaggctgt aa1602<210>32<211>170<212>PRT<213>人<400>32Met Ala Thr Ser Asn Asn Pro Arg Lys Phe Ser Glu Lys Ile Ala Leu1 5 10 15His Asn Gln Lys Gln Ala Glu Glu Thr Ala Ala Phe Glu Glu Val Met20 25 30Lys Asp Leu Ser Leu Thr Arg Ala Ala Arg Leu Gln Leu Gln Lys Ser35 40 45Gln Tyr Leu Gln Leu Gly Pro Ser Arg Gly Gln Tyr Tyr Gly Gly Ser50 55 60Leu Pro Asn Val Asn Gln Ile Gly Ser Gly Thr Met Asp Leu Pro Phe65 70 75 80Gln Pro Ser Gly Phe Leu Gly Glu Ala Leu Ala Ala Ala Pro Val Ser
85 90 95Leu Thr Pro Phe Gln Ser Ser Gly Leu Asp Thr Ser Arg Thr Thr Arg100 105 110His His Gly Leu Val Asp Arg Val Tyr Arg Glu Arg Gly Arg Leu Gly115 120 125Ser Pro His Arg Arg Pro Leu Ser Val Asp Lys His Gly Arg Gln Ala130 135 140Asp Ser Cys Pro Tyr Gly Thr Met Tyr Leu Ser Pro Pro Ala Asp Thr145 150 155 160Ser Trp Arg Arg Thr Asn Ser Asp Ser Ala165 170<210>33<211>356<212>PRT<213>人<400>33Met Ala Thr Ser Asn Asn Pro Arg Lys Phe Ser Glu Lys Ile Ala Leu1 5 10 15His Asn Gln Lys Gln Ala Glu Glu Thr Ala Ala Phe Glu Glu Val Met20 25 30Lys Asp Leu Ser Leu Thr Arg Ala Ala Arg Leu Gln Leu Gln Lys Ser35 40 45Gln Tyr Leu Gln Leu Gly Pro Ser Arg Gly Gln Tyr Tyr Gly Gly Ser50 55 60Leu Pro Asn Val Asn Gln Ile Gly Ser Gly Thr Met Asp Leu Pro Phe65 70 75 80Gln Pro Ser Gly Phe Leu Gly Glu Ala Leu Ala Ala Ala Pro Val Ser85 90 95Leu Thr Pro Phe Gln Ser Ser Gly Leu Asp Thr Ser Arg Thr Thr Arg100 105 110His His Gly Leu Val Asp Arg Val Tyr Arg Glu Arg Gly Arg Leu Gly115 120 125Ser Pro His Arg Arg Pro Leu Ser Val Asp Lys His Gly Arg Gln Ala130 135 140Asp Ser Cys Pro Tyr Gly Thr Met Tyr Leu Ser Pro Pro Ala Asp Thr145 150 155 160Ser Trp Arg Arg Thr Asn Ser Asp Ser Ala Leu His Gln Ser Thr Met165 170 175Thr Pro Thr Gln Pro Glu Ser Phe Ser Ser Gly Ser Gln Asp Val His180 185 190Gln Lys Arg Val Leu Leu Leu Thr Val Pro Gly Met Glu Glu Thr Thr
195 200 205Ser Glu Ala Asp Lys Asn Leu Ser Lys Gln Ala Trp Asp Thr Lys Lys210 215 220Thr Gly Ser Arg Pro Lys Ser Cys Glu Val Pro Gly Ile Asn Ile Phe225 230 235 240Pro Ser Ala Asp Gln Glu Asn Thr Thr Ala Leu Ile Pro Ala Thr His245 250 255Asn Thr Gly Gly Ser Leu Pro Asp Leu Thr Asn Ile His Phe Pro Ser260 265 270Pro Leu Pro Thr Pro Leu Asp Pro Glu Glu Pro Thr Phe Pro Ala Leu275 280 285Ser Ser Ser Ser Ser Thr Gly Asn Leu Ala Ala Asn Leu Thr His Leu290 295 300Gly Ile Gly Gly Ala Gly Gln Gly Met Ser Thr Pro Gly Ser Ser Pro305 310 315 320Gln His Arg Pro Ala Gly Val Ser Pro Leu Ser Leu Ser Thr Glu Ala325 330 335Arg Arg Gln Gln Ala Ser Pro Thr Leu Ser Pro Leu Ser Pro Ile Thr340 345 350Gln Ala Val Ala355<210>34<211>494<212>PRT<213>人<400>34Met Ala Thr Ser Asn Asn Pro Arg Lys Phe Ser Glu Lys Ile Ala Leu1 5 10 15His Asn Gln Lys Gln Ala Glu Glu Thr Ala Ala Phe Glu Glu Val Met20 25 30Lys Asp Leu Ser Leu Thr Arg Ala Ala Arg Leu Gln Leu Gln Lys Ser35 40 45Gln Tyr Leu Gln Leu Gly Pro Ser Arg Gly Gln Tyr Tyr Gly Gly Ser50 55 60Leu Pro Asn Val Asn Gln Ile Gly Ser Gly Thr Met Asp Leu Pro Phe65 70 75 80Gln Pro Ser Gly Phe Leu Gly Glu Ala Leu Ala Ala Ala Pro Val Ser85 90 95Leu Thr Pro Phe Gln Ser Ser Gly Leu Asp Thr Ser Arg Thr Thr Arg100 105 110His His Gly Leu Val Asp Arg Val Tyr Arg Glu Arg Gly Arg Leu Gly
115 120 125Ser Pro His Arg Arg Pro Leu Ser Val Asp Lys His Gly Arg Gln Ala130 135 140Asp Ser Cys Pro Tyr Gly Thr Met Tyr Leu Ser Pro Pro Ala Asp Thr145 150 155 160Ser Trp Arg Arg Thr Asn Ser Asp Ser Ala Leu His Gln Ser Thr Met165 170 175Thr Pro Thr Gln Pro Glu Ser Phe Ser Ser Gly Ser Gln Asp Val His180 185 190Gln Lys Arg Val Leu Leu Leu Thr Val Pro Gly Met Glu Glu Thr Thr195 200 205Ser Glu Ala Asp Lys Asn Leu Ser Lys Gln Ala Trp Asp Thr Lys Lys210 215 220Thr Gly Ser Arg Pro Lys Ser Cys Glu Val Pro Gly Ile Asn Ile Phe225 230 235 240Pro Ser Ala Asp Gln Glu Asn Thr Thr Ala Leu Ile Pro Ala Thr His245 250 255Asn Thr Gly Gly Ser Leu Pro Asp Leu Thr Asn Ile His Phe Pro Ser260 265 270Pro Leu Pro Thr Pro Leu Asp Pro Glu Glu Pro Thr Phe Pro Ala Leu275 280 285Ser Ser Ser Ser Ser Thr Gly Asn Leu Ala Ala Asn Leu Thr His Leu290 295 300Gly Ile Gly Gly Ala Gly Gln Gly Met Ser Thr Pro Gly Ser Ser Pro305 310 315 320Gln His Arg Pro Ala Gly Val Ser Pro Leu Ser Leu Ser Thr Glu Ala325 330 335Arg Arg Gln Gln Ala Ser Pro Thr Leu Ser Pro Leu Ser Pro Ile Thr340 345 350Gln Ala Val Ala Met Asp Ala Leu Ser Leu Glu Gln Gln Leu Pro Tyr355 360 365Ala Phe Phe Thr Gln Ala Gly Ser Gln Gln Pro Pro Pro Gln Pro Gln370 375 380Pro Pro Pro Pro Pro Pro Pro Ala Ser Gln Gln Pro Pro Pro Pro Pro385 390 395 400Pro Pro Gln Ala Pro Val Arg Leu Pro Pro Gly Gly Pro Leu Leu Pro405 410 415Ser Ala Ser Leu Thr Arg Gly Pro Gln Pro Pro Pro Leu Ala Val Thr420 425 430Val Pro Ser Ser Leu Pro Gln Ser Pro Pro Glu Asn Pro Gly Gln Pro435 440 445Ser Met Gly Ile Asp Ile Ala Ser Ala Pro Ala Leu Gln Gln Tyr Arg450 455 460Thr Ser Ala Gly Ser Pro Ala Asn Gln Ser Pro Thr Ser Pro Val Ser
465 470 475 480Asn Gln Gly Phe Ser Pro Gly Ser Ser Pro Gln His Thr Ser485 490<210>35<211>580<212>PRT<213>人<400>35Met Ala Thr Ser Asn Asn Pro Arg Lys Phe Ser Glu Lys Ile Ala Leu1 5 10 15His Asn Gln Lys Gln Ala Glu Glu Thr Ala Ala Phe Glu Glu Val Met20 25 30Lys Asp Leu Ser Leu Thr Arg Ala Ala Arg Leu Gln Leu Gln Lys Ser35 40 45Gln Tyr Leu Gln Leu Gly Pro Ser Arg Gly Gln Tyr Tyr Gly Gly Ser50 55 60Leu Pro Asn Val Asn Gln Ile Gly Ser Gly Thr Met Asp Leu Pro Phe65 70 75 80Gln Pro Ser Gly Phe Leu Gly Glu Ala Leu Ala Ala Ala Pro Val Ser85 90 95Leu Thr Pro Phe Gln Ser Ser Gly Leu Asp Thr Ser Arg Thr Thr Arg100 105 110His His Gly Leu Val Asp Arg Val Tyr Arg Glu Arg Gly Arg Leu Gly115 120 125Ser Pro His Arg Arg Pro Leu Ser Val Asp Lys His Gly Arg Gln Ala130 135 140Asp Ser Cys Pro Tyr Gly Thr Met Tyr Leu Ser Pro Pro Ala Asp Thr145 150 155 160Ser Trp Arg Arg Thr Asn Ser Asp Ser Ala Leu His Gln Ser Thr Met165 170 175Thr Pro Thr Gln Pro Glu Ser Phe Ser Ser Gly Ser Gln Asp Val His180 185 190Gln Lys Arg Val Leu Leu Leu Thr Val Pro Gly Met Glu Glu Thr Thr195 200 205Ser Glu Ala Asp Lys Asn Leu Ser Lys Gln Ala Trp Asp Thr Lys Lys210 215 220Thr Gly Ser Arg Pro Lys Ser Cys Glu Val Pro Gly Ile Asn Ile Phe225 230 235 240Pro Ser Ala Asp Gln Glu Asn Thr Thr Ala Leu Ile Pro Ala Thr His245 250 255Asn Thr Gly Gly Ser Leu Pro Asp Leu Thr Asn Ile His Phe Pro Ser
260 265 270Pro Leu Pro Thr Pro Leu Asp Pro Glu Glu Pro Thr Phe Pro Ala Leu275 280 285Ser Ser Ser Ser Ser Thr Gly Asn Leu Ala Ala Asn Leu Thr His Leu290 295 300Gly Ile Gly Gly Ala Gly Gln Gly Met Ser Thr Pro Gly Ser Ser Pro305 310 315 320Gln His Arg Pro Ala Gly Val Ser Pro Leu Ser Leu Ser Thr Glu Ala325 330 335Arg Arg Gln Gln Ala Ser Pro Thr Leu Ser Pro Leu Ser Pro Ile Thr340 345 350Gln Ala Val Ala Met Asp Ala Leu Ser Leu Glu Gln Gln Leu Pro Tyr355 360 365Ala Phe Phe Thr Gln Ala Gly Ser Gln Gln Pro Pro Pro Gln Pro Gln370 375 380Pro Pro Pro Pro Pro Pro Pro Ala Ser Gln Gln Pro Pro Pro Pro Pro385 390 395 400Pro Pro Gln Ala Pro Val Arg Leu Pro Pro Gly Gly Pro Leu Leu Pro405 410 415Ser Ala Ser Leu Thr Arg Gly Pro Gln Pro Pro Pro Leu Ala Val Thr420 425 430Val Pro Ser Ser Leu Pro Gln Ser Pro Pro Glu Asn Pro Gly Gln Pro435 440 445Ser Met Gly Ile Asp Ile Ala Ser Ala Pro Ala Leu Gln Gln Tyr Arg450 455 460Thr Ser Ala Gly Ser Pro Ala Asn Gln Ser Pro Thr Ser Pro Val Ser465 470 475 480Asn Gln Gly Phe Ser Pro Gly Ser Ser Pro Gln His Thr Ser Thr Leu485 490 495Gly Ser Val Phe Gly Asp Ala Tyr Tyr Glu Gln Gln Met Ala Ala Arg500 505 510Gln Ala Asn Ala Leu Ser His Gln Leu Glu Gln Phe Asn Met Met Glu515 520 525Asn Ala Ile Ser Ser Ser Ser Leu Tyr Ser Pro Gly Ser Thr Leu Asn530 535 540Tyr Ser Gln Ala Ala Met Met Gly Leu Thr Gly Ser His Gly Ser Leu545 550 555 560Pro Asp Ser Gln Gln Leu Gly Tyr Ala Ser His Ser Gly Ile Pro Asn565 570 575Ile Ile Leu Thr580<210>36
<211>481<212>PRT<213>人<400>36Ala Leu His Gln Ser Thr Met Thr Pro Thr Gln Pro Glu Ser Phe Ser1 5 10 15Ser Gly Ser Gln Asp Val His Gln Lys Arg Val Leu Leu Leu Thr Val20 25 30Pro Gly Met Glu Glu Thr Thr Ser Glu Ala Asp Lys Asn Leu Ser Lys35 40 45Gln Ala Trp Asp Thr Lys Lys Thr Gly Ser Arg Pro Lys Ser Cys Glu50 55 60Val Pro Gly Ile Asn Ile Phe Pro Ser Ala Asp Gln Glu Asn Thr Thr65 70 75 80Ala Leu Ile Pro Ala Thr His Asn Thr Gly Gly Ser Leu Pro Asp Leu85 90 95Thr Asn Ile His Phe Pro Ser Pro Leu Pro Thr Pro Leu Asp Pro Glu100 105 110Glu Pro Thr Phe Pro Ala Leu Ser Ser Ser Ser Ser Thr Gly Asn Leu115 120 125Ala Ala Asn Leu Thr His Leu Gly Ile Gly Gly Ala Gly Gln Gly Met130 135 140Ser Thr Pro Gly Ser Ser Pro Gln His Arg Pro Ala Gly Val Ser Pro145 150 155 160Leu Ser Leu Ser Thr Glu Ala Arg Arg Gln Gln Ala Ser Pro Thr Leu165 170 175Ser Pro Leu Ser Pro Ile Thr Gln Ala Val Ala Met Asp Ala Leu Ser180 185 190Leu Glu Gln Gln Leu Pro Tyr Ala Phe Phe Thr Gln Ala Gly Ser Gln195 200 205Gln Pro Pro Pro Gln Pro Gln Pro Pro Pro Pro Pro Pro Pro Ala Ser210 215 220Gln Gln Pro Pro Pro Pro Pro Pro Pro Gln Ala Pro Va lArg Leu Pro225 230 235 240Pro Gly Gly Pro Leu Leu Pro Ser Ala Ser Leu Thr Arg Gly Pro Gln245 250 255Pro Pro Pro Leu Ala Val Thr Val Pro Ser Ser Leu Pro Gln Ser Pro260 265 270Pro Glu Asn Pro Gly Gln Pro Ser Met Gly Ile Asp Ile Ala Ser Ala275 280 285Pro Ala Leu Gln Gln Tyr Arg Thr Ser Ala Gly Ser Pro Ala Asn Gln290 295 300Ser Pro Thr Ser Pro Val Ser Asn Gln Gly Phe Ser Pro Gly Ser Ser
305 310 315 320Pro Gln His Thr Ser Thr Leu Gly Ser Val Phe Gly Asp Ala Tyr Tyr325 330 335Glu Gln Gln Met Ala Ala Arg Gln Ala Asn Ala Leu Ser His Gln Leu340 345 350Glu Gln Phe Asn Met Met Glu Asn Ala Ile Ser Ser Ser Ser Leu Tyr355 360 365Ser Pro Gly Ser Thr Leu Asn Tyr Ser Gln Ala Ala Met Met Gly Leu370 375 380Thr Gly Ser His Gly Ser Leu Pro Asp Ser Gln Gln Leu Gly Tyr Ala385 390 395 400Ser His Ser Gly Ile Pro Asn Ile Ile Leu Thr Val Thr Gly Glu Ser405 410 415Pro Pro Ser Leu Ser Lys Glu Leu Thr Ser Ser Leu Ala Gly Val Gly420 425 430Asp Val Ser Phe Asp Ser Asp Ser Gln Phe Pro Leu Asp Glu Leu Lys435 440 445Ile Asp Pro Leu Thr Leu Asp Gly Leu His Met Leu Asn Asp Pro Asp450 455 460Met Val Leu Ala Asp Pro Ala Thr Glu Asp Thr Phe Arg Met Asp Arg465 470 475 480Leu<210>37<211>30<212>DNA<213>人工序列<220>
<223>引物<400>37caacatggcc aatccgcgca agttcagcga 30<210>38<211>29<212>DNA<213>人工序列<220>
<223>引物
<400>38tcagttgagg tcgcgtcgaa aactatcct29<210>39<211>62<212>DNA<213>黑腹果蝇<400>39ggagcctggc gtcagagagc ctggcgtcag agagcctggc gtcagagagc ctggcgtcag 60ag6权利要求
1.预防、治疗或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的方法,其包括将有效量的CREAP调节子施用于需要其的受试者。
2.权利要求1的方法,其中所述病理状况是神经变性疾病。
3.权利要求1的方法,其中所述病理状况是自身免疫病。
4.权利要求1的方法,其中所述病理状况是炎性疾病。
5.权利要求1的方法,其中所述病理状况选自阿尔茨海默氏病、帕金森氏病、亨廷顿病、骨关节炎、银屑病、气喘、COPD、类风湿性关节炎、癌症、糖尿病、高血压和慢性痛。
6.权利要求1的方法,其中所述CREAP调节子抑制任意一种或多种选自CREAP1、CREAP2或CREAP3的CREAP蛋白质的活性。
7.权利要求6的方法,其中所述CREAP调节子包括一种或多种针对CREAP蛋白质的抗体或其片段,其中所述抗体或其片段能够抑制所述CREAP蛋白质的活性。
8.权利要求6的方法,其中所述调节子包括CREAP蛋白质的一种或多种肽模拟物,其中所述肽模拟物能够抑制所述CREAP蛋白质的活性。
9.权利要求1的方法,其中所述CREAP调节子抑制选自CREAP1、CREAP2或CREAP3的任意一种或多种CREAP蛋白质的表达。
10.权利要求9的方法,其中所述CREAP调节子包括一种或多种选自反义寡核苷酸、三股螺旋DNA、核酶、RNA适体和双链或单链RNA的物质,其中所述物质设计为抑制CREAP蛋白质的表达。
11.预防、治疗或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的方法,其包括将包含有效量CREAP调节子的药物组合物施用于需要其的受试者。
12.权利要求11的方法,其中所述病理状况是神经变性疾病。
13.权利要求11的方法,其中所述病理状况是自身免疫病。
14.权利要求11的方法,其中所述病理状况是炎性疾病。
15.权利要求11的方法,其中所述病理状况选自阿尔茨海默氏病、帕金森氏病、亨廷顿病、骨关节炎、银屑病、气喘、COPD、类风湿性关节炎、癌症、糖尿病、高血压和慢性痛。
16.权利要求11的方法,其中所述CREAP调节子抑制任意一种或多种选自CREAP1、CREAP2或CREAP3的CREAP蛋白质的活性。
17.权利要求11的方法,其中所述CREAP调节子包括一种或多种针对CREAP蛋白质的抗体或其片段,其中所述抗体或其片段能够抑制所述CREAP蛋白质的活性。
18.权利要求11的方法,其中所述CREAP调节子包括CREAP蛋白质的一种或多种肽模拟物,其中所述肽模拟物能够抑制所述CREAP蛋白质的活性。
19.权利要求11的方法,其中所述CREAP调节子抑制选自CREAP1、CREAP2或CREAP3的任意一种或多种CREAP蛋白质的表达。
20.权利要求19的方法,其中所述CREAP调节子包括一种或多种选自反义寡核苷酸、三股螺旋DNA、核酶、RNA适体和双链或单链RNA的物质,其中所述物质设计为抑制CREAP蛋白质的表达。
21.鉴定用于预防、治疗或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关的病理状况的调节子的方法,其包括测定候选调节子抑制CREAP蛋白质活性的能力。
22.权利要求21的方法,其中所述CREAP蛋白质选自CREAP1、CREAP2或CREAP3。
23.权利要求21的方法,其中所述方法进一步包括测定所鉴定的CREAP抑制调节子逆转在所述病理状况的体外、先体外后体内或体内模型中和/或患有所述病理状况的受试者的临床研究中所观察到的病理效应的能力。
24.权利要求21的方法,其中所述病理状况是神经变性疾病。
25.权利要求21的方法,其中所述病理状况是自身免疫病。
26.权利要求21的方法,其中所述病理状况是炎性疾病。
27.权利要求21的方法,其中所述病理状况选自阿尔茨海默氏病、帕金森氏病、亨廷顿病、骨关节炎、银屑病、气喘、COPD、类风湿性关节炎、癌症、糖尿病、高血压和慢性痛。
28.鉴定用于预防、治疗或缓解与CRE-依赖性基因表达异常激活或异常趋化因子激活相关的病理状况的调节子的方法,其包括测定候选调节子抑制CREAP蛋白质表达的能力。
29.权利要求28的方法,其中所述CREAP蛋白质选自CREAP1、CREAP2或CREAP3。
30.权利要求28的方法,其中所述方法进一步包括测定所鉴定的CREAP抑制调节子逆转在所述病理状况的体外、先体外后体内或体内模型中和/或患有所述病理状况的受试者的临床研究中所观察到的病理效应的能力。
31.权利要求28的方法,其中所述病理状况是神经变性疾病。
32.权利要求28的方法,其中所述病理状况是自身免疫病。
33.权利要求28的方法,其中所述病理状况是炎性疾病。
34.权利要求28的方法,其中所述病理状况选自阿尔茨海默氏病、帕金森氏病、亨廷顿病、骨关节炎、银屑病、气喘、COPD、类风湿性关节炎、癌症、糖尿病、高血压和慢性痛。
35.药物组合物,其包含有效量的一种或多种CREAP调节子以预防、治疗或缓解需要其的患者中与CRE-依赖性基因表达异常激活或异常趋化因子激活相关的病理状况。
36.根据权利要求35的药物组合物,其中所述病理状况是神经变性疾病。
37.根据权利要求35的药物组合物,其中所述病理状况是自身免疫病。
38.根据权利要求35的药物组合物,其中所述病理状况是炎性疾病。
39.根据权利要求35的药物组合物,其中所述病理状况选自阿尔茨海默氏病、帕金森氏病、亨廷顿病、骨关节炎、银屑病、气喘、COPD、类风湿性关节炎、癌症、糖尿病、高血压和慢性痛。
40.根据权利要求35的药物组合物,其中所述CREAP调节子抑制选自CREAP1、CREAP2或CREAP3的任意一种或多种CREAP蛋白质的活性。
41.权利要求40的药物组合物,其中所述CREAP调节子包括一种或多种针对CREAP蛋白质的抗体或其片段,其中所述抗体或其片段能够抑制所述CREAP蛋白质的活性。
42.权利要求40的药物组合物,其中所述CREAP调节子包括CREAP蛋白质的一种或多种肽模拟物,其中所述肽模拟物能够抑制所述CREAP蛋白质的活性。
43.根据权利要求35的药物组合物,其中所述CREAP调节子抑制选自CREAP1、CREAP2或CREAP3的任意一种或多种CREAP蛋白质的表达。
44.权利要求43的药物组合物,其中所述CREAP调节子包括一种或多种选自反义寡核苷酸、三股螺旋DNA、核酶、RNA适体和双链或单链RNA的物质,其中所述物质设计为抑制CREAP基因表达。
45.诊断患有与CRE-依赖性基因表达异常激活或异常趋化因子激活相关病理状况并且可能是使用CREAP调节子进行治疗的适宜候选者的受试者的方法,其包括测定来自所述受试者的生物样品中CREAP蛋白质的mRNA水平,其中与对照相比具有增加的mRNA水平的受试者是进行CREAP调节子治疗的适宜候选者。
46.权利要求45的方法,其中所述CREAP蛋白质选自CREAP1、CREAP2或CREAP3。
47.诊断患有与CRE-依赖性基因表达异常激活或趋化因子异常激活相关病理状况并且可能是使用CREAP调节子进行治疗的适宜候选者的受试者的方法,该方法包括检测来自所述受试者的生物样品中CREAP蛋白质的水平,其中与对照相比具有升高水平的受试者是进行CREAP调节子治疗的适宜候选者。
48.权利要求47的方法,其中所述CREAP蛋白质选自CREAP1、CREAP2或CREAP3。
49.预防、治疗或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关病理状况的方法,其包括(a)测定受试者体内CREAP mRNA和/或蛋白质水平;和,(b)将足以预防、治疗或缓解所述病理状况的CREAP调节子施用于与对照相比具有升高水平的CREAP mRNA和/或蛋白质水平的受试者。
50.权利要求49的方法,其中所述病理状况是神经变性疾病。
51.权利要求49的方法,其中所述病理状况是自身免疫病。
52.权利要求49的方法,其中所述病理状况是炎性疾病。
53.权利要求49的方法,其中所述病理状况选自阿尔茨海默氏病、帕金森氏病、亨廷顿病、骨关节炎、银屑病、气喘、COPD、类风湿性关节炎、癌症、糖尿病、高血压和慢性痛。
54.用于检测生物样品中CREAP蛋白质的mRNA水平和/或蛋白质水平的诊断试剂盒,所述试剂盒包括(a)CREAP的多核苷酸或其片段;(b)与(a)中的多核苷酸互补的核苷酸序列;(c)CREAP多肽,或其片段;(d)针对CREAP多肽的抗体;或(e)CREAP蛋白质的肽模拟物其中组分(a)、(b)、(c)、(d)或(e)可以包含等同成分。
55.权利要求54的方法,其中所述CREAP蛋白质选自CREAP1、CREAP2或CREAP3。
56.分离的多肽,其包含选自SEQ ID NOs2、16和25的CREAP氨基酸序列。
57.分离的核酸序列,其包含编码权利要求56的多肽的核酸序列。
58.分离的多肽,其由选自SEQ ID NOs2、16和25的CREAP氨基酸序列组成。
59.分离的核酸序列,其包含编码权利要求58的多肽的核酸序列。
60.分离的CREAP多肽,其由生物体的CREAP基因编码。
61.分离的DNA,其包含编码权利要求60的CREAP多肽的核酸序列。
62.载体分子,包含根据权利要求57的分离核酸的片段。
63.根据权利要求62的载体分子,其包含任意一种或多种转录控制序列。
64.宿主细胞,其包含根据权利要求63的载体分子。
65.抗体或其片段,所述抗体或其片段特异结合包含显示于权利要求56的氨基酸序列的多肽或者所述多肽的片段。
66.根据权利要求65的抗体片段,其是Fab或F(ab′)2部分。
67.根据权利要求65的抗体,其是多克隆抗体。
68.根据权利要求65的抗体,其是单克隆抗体。
69.产生如权利要求56中所定义的多肽的方法,其包括在足以在宿主细胞中表达下述多肽的条件下培养其中整合表达载体的宿主细胞,该表达载体包含外源来源的多核苷酸,该多核苷酸编码包含选自SEQ ID NOs2、16和25的氨基酸序列的多肽,从而导致产生所表达的多肽。
70.根据权利要求69的方法,所述方法进一步包括回收所述细胞产生的多肽。
71.根据权利要求69的方法,其中所述外源来源的多核苷酸包含选自SEQID NOs1、15和24的核苷酸序列。
72.产生如权利要求56中所定义的多肽的方法,其包括在足以在宿主细胞中表达下述多肽的条件下培养其中整合表达载体的宿主细胞,该表达载体包含外源来源的多核苷酸,该多核苷酸编码包含选自SEQ ID NOs2、16和25的氨基酸序列的多肽,从而导致产生所表达的多肽。
73.根据权利要求72的方法,所述方法进一步包括回收所述细胞产生的多肽。
74.根据权利要求72的方法,其中所述外源来源的多核苷酸包含选自SEQID NOs1、15和24的核苷酸序列。
75.载体分子,其包含选自编码人CREAP蛋白质片段氨基酸区域1-267、289-538、356-580和575-650的核酸序列。
全文摘要
本发明公开了新近鉴定的环AMP效应元件激活蛋白(CREAP蛋白质)。文中涉及到所述蛋白质是用于研发新的治疗剂以预防、治疗或缓解与CRE-依赖性基因表达异常激活或趋化因子异常激活相关病理状况的适宜的药物靶标。本发明涉及预防、治疗或缓解所述病理状况的方法和包含对CREAP蛋白质活性和/或CREAP基因表达具有抑制作用的调节子的药物组合物。本发明还涉及鉴定用于治疗所述病理状况的化合物的方法,其包括鉴定能够抑制CREAP蛋白质活性和/或CREAP基因表达的化合物。
文档编号C07K16/18GK1764722SQ200480008108
公开日2006年4月26日 申请日期2004年3月25日 优先权日2003年3月26日
发明者V·尤格恩科, M·A·拉博, 宋川峥, 张文军, 朱健 申请人:诺瓦提斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1