脊椎动物端粒酶基因和蛋白质及其用途的制作方法

文档序号:452873阅读:412来源:国知局
专利名称:脊椎动物端粒酶基因和蛋白质及其用途的制作方法
技术领域
本发明通常涉及端粒酶,特别涉及人的端粒酶基因和蛋白质及其在诊断和治疗中的用途。
背景技术
非环状的染色体需要一种特化机制,用于在每次细胞分裂后维持染色体的末端,因为负责染色体DNA复制的聚合酶不能完全复制线性DNA分子,因而产生“末端复制问题”。为了解决这一问题,真核细胞依赖于一种酶,即端粒酶,将短的、特别是富含G的、相对保守的重复序列增加到染色体的末端。这些重复结构被称为端粒。
端粒的存在是细胞生存所必需的。即使缺少了一个端粒也会导致酵母(一种真核细胞)中的细胞循环停滞(Sandell和Zakian,细胞(Cell)75729,1993)。端粒在复制中缩短;端粒酶修复端粒。因此,如预料的那样,端粒酶的活性首先在活跃分裂的细胞中被检测到。象这样,端粒酶的活性在单细胞生物中是组成型存在,而在更复杂的生物中是被调节的,在胚系、胚胎组织和细胞以及肿瘤细胞中相对丰富。与此相反,在正常的人类体细胞中很难检测到端粒酶的活性。而且,不仅复制的终止会造成端粒酶减少,最新的数据显示端粒酶抑制可能是这个过渡期的一个关键事件。端粒酶与复制活性之间似乎直接的关系促使人们猜想端粒酶抑制剂可能是一种“通用的”癌症治疗物,基本上对所有的肿瘤类型都有效,而端粒酶的刺激物则可能克服所观察到的正常细胞的自然衰老。
受这些模型的激励,在分离与克隆端粒酶的过程中已经对端粒酶进行了大量的描述。已表明端粒延长的机制主要在于端粒重复序列的富含G的链。这条向染色体的3’端延伸的富含G的链是由端粒酶延伸的,其是来自RNA组分的一种核糖核蛋白质,在此作为模板。已经分离并克隆了这种复合体的不同组分。复合体的RNA组分已被从许多不同的生物中分离并克隆,包括人(Feng等人,科学(Science)2691236,1995)、小鼠和其他哺乳动物、酿酒酵母(Saccharomyces cerevisiae)、四膜虫(Tetrahymena)、Euplotes、以及Oxytricha(参考Singer和Gottschling,科学,266404,1994;Lingner等人,基因与发育(Genes & Develop.)81984,1994;以及Romero和Blackburn,细胞,67343,1994)。蛋白质组分相对难分离。最近,已经测定了几种蛋白质组分的核苷酸序列(从四膜虫中分离的一个80kD/95kD二聚体蛋白质,WO96/19580;和从人体分离的一个67kD蛋白质,WO97/08314)。
本发明公开了端粒酶的核苷酸和氨基酸序列、这些序列在诊断和治疗中的用途,并提供其它相关的优点。
发明概述一方面,本发明通常提供分离的编码脊椎动物端粒酶(及其变体)的核酸分子。脊椎动物的代表性例子包括哺乳动物如人、古老的猴子(例如猕猴、黑猩猩和狒狒)、狗、大鼠和小鼠,以及非哺乳动物类生物如鸟类。在一个优选实施方案中,提供了编码脊椎动物端粒酶的核酸分子,该核酸分子含有

图1中所示的序列,或者在严谨条件下可与图1中所示序列的互补序列杂交,前提是该核酸分子不是EST AA281296。
在另一个优选实施方案中,核酸分子含有图11中所示的任何序列或编码图11中所示的任何氨基酸序列,或者在正常严谨条件下可与其序列的互补序列杂交,前提是该核酸分子不是EST AA281296。在其它实施方案中,核酸分子含有图10中所示的任何序列,或在正常严谨条件下可与其序列的互补序列杂交。
另一方面,本发明提供了含有图1所示的序列的10至100个连续核苷酸的寡核苷酸或其互补序列,以及图10所示序列的10至100个连续核苷酸的寡核苷酸或其互补序列。寡核苷酸可用可检测的标记物进行标记。
而在另一方面,本发明提供了一种表达载体,它含有一个与人端粒酶核酸分子有效相连的异源启动子。该载体可选自细菌载体、逆转录病毒载体、腺病毒载体和酵母载体。还提供了含有这些载体的宿主细胞。
另一方面,本发明提供一种分离的含有人端粒酶蛋白质的蛋白质。该蛋白质可含有图1所示的氨基酸序列或其变体,或含有图11所示的任一氨基酸序列或其变体。在一个相关方面,该蛋白质是人端粒酶蛋白质的一部分,它可衍生自图1或11所示的序列。在优选实施方案中,该蛋白质长度为10至100个氨基酸。
在其它方面,本发明提供了可与人端粒酶蛋白质或其部分蛋白质特异结合的抗体。
在一个优选方面,本发明提供了能够在正常严谨条件下与编码人端粒酶的核酸分子特异杂交的寡核苷酸(例如核酸探针或引物)。在某些实施方案中,核酸分子具有可检测的标记。在某些实施方案中,核酸分子是根据不能与图1所示的1624-2012位核苷酸杂交而选择的。在本发明的某些实施方案中,核酸探针或引物可能与野生型端粒酶序列有一个或多个核苷酸的差别。
在一个相关方面,本发明提供了能够特异扩增编码人端粒酶的核酸分子的全部或部分的一对寡核苷酸引物。在特定实施方案中,核酸分子含有图1、图11中所示的序列或其互补序列。在优选实施方案中,这对引物能够特异扩增含有1区、α区、β区、2区、3区、X区或Y区的全部或部分的序列。在一个相关方面,本发明提供可与1区、α区、β区、2区、3区、X区或Y区中的核酸序列特异杂交的寡核苷酸。
本发明还提供了在患者身上诊断癌症的方法。这些方法包括制备肿瘤cDNA,并利用特异扩增人端粒酶核酸序列的引物扩增肿瘤cDNA,其中端粒酶核酸序列的检测是癌症诊断的一个指征。可以比较检测序列的数量同正常对照细胞中扩增的端粒酶序列的数量,其中与对照相比端粒酶核酸序列的增加是癌症诊断的指征。
而在另一方面,本发明提供了一种测定细胞中端粒酶RNA表达模式的方法,包括从由细胞中分离的mRNA中制备cDNA,利用权利要求35的引物扩增cDNA,由此测定端粒酶RNA表达的模式。在优选实施方案中,本方法还包括通过与具有1区、α区、β区、2区、3区、X区或Y区的所有或部分序列的寡核苷酸杂交而检测扩增产物。这些方法可用于诊断患者的癌症,其中RNA的表达模式是癌症诊断的指示。
本发明还提供非人类转基因动物,其细胞中含有人端粒酶基因,该基因与能够使其表达的启动子有效地相连。在优选实施方案中,该动物是小鼠而启动子是组织特异性的。在一个相关方面,本发明提供一种小鼠,其细胞中的内源性端粒酶基因通过与无功能的端粒酶基因进行同源重组而被破坏,其中该小鼠不能表达内源性端粒酶。
本发明还提供人端粒酶活性的抑制剂,以及鉴定端粒酶活性抑制剂的方法,其中该抑制剂与端粒酶结合而且不是核苷类似物。抑制剂可能是一种与人端粒酶mRNA互补的反义核酸、核酶等等。该抑制剂可用于治疗癌症。
本发明还提供了鉴定端粒酶活性效应物的方法,包括一般步骤(a)向端粒酶蛋白质、RNA组分和模板的混合物中加入候选效应物,其中端粒酶蛋白质是由按上述分离的核酸分子编码的;(b)检测端粒酶的活性,以及(c)比较步骤(b)的活性与没有候选效应物的对照混合物的活性,由此鉴定效应物。在其它实施方案中,效应物是一种抑制剂。而在其它实施方案中核酸分子编码人端粒酶。
参考下列详述和附图,本发明的这些方面和其它方面将显而易见。另外,下面列出了各种参考,它们详细描述了某些方法或组合物(例如质粒,等等),并且因此被完整地引入本文作为参考。
附图简述图1A-E表示人端粒酶的DNA序列(SEQ ID NO)及预测的氨基酸序列(SEQ ID NO)。
图2表示Euplotes aediculatus p123(SEQ ID NO)、酵母(EST2)(SEQ ID NO)和人(HT1)端粒酶蛋白质(氨基酸29-1132)序列的对比。图中指出了逆转录酶基元。三种蛋白质的高度同源区定义为端粒酶区。这些序列是用ClustalW对比的。
图3是Northern分析的扫描图象,表示端粒酶催化亚单位在LIM1215结肠癌细胞中表达,而在CCD原代成纤维细胞中不表达。一个大约3.8kb的mRNA与hT1探针杂交。另外一个高分子量的交叉杂交的mRNA在上面加箭头表示。指出了与polyA+RNA制备物中核糖体(RNA)的交叉杂交。相同的印迹还与来自GAPDH作为上样对照(下面一组)的探针杂交。分子量标记的大小以kb表示。
图4是Southern分析的扫描图象,表示端粒酶催化亚单位是由单基因编码的,并且不能在LIM 1215细胞中扩增。用hT1基因探针探测从人周围血细胞和LIM 1215细胞系中分离的基因组DNA。印迹还含有稀释的探针质粒作为检测敏感性的对照。质粒大约被稀释为10、5和1个基因组当量。H,HindIII;E,EcoRI;P,Pst I;X,XbaI;B,BamHI。
图5表示从不同组织中合成的cDNA的扩增结果。扩增是利用来自hT1 cDNA序列的引物进行的,hT1 cDNA序列横跨hT1基因中的内含子,将扩增产物印迹并用来自hT1序列的放射性标记寡核苷酸探测。还在同样的样品上用来自作为上样对照的β-肌动蛋白基因的一对引物进行扩增。ahT1 cDNA对照;b人基因组DNA对照;c无模板对照;d正常结肠RNA;e正常睾丸RNA;f.正常淋巴细胞RNA;g黑素瘤RNA(脑转移);h黑素瘤RNA(皮下踝转移);i黑素瘤RNA(肝转移);j黑素瘤RNA(肺转移);k黑素瘤RNA(腋淋巴结转移);l黑素瘤RNA(皮肤转移);m乳腺癌RNA;n乳腺癌RNA;o乳腺癌RNA;p乳腺癌RNA。
图6表示的结果说明hT1在转捩期前(pre-crisis)细胞和转捩期后(post-crisis)细胞系中的表达。上图利用初始EST内的引物进行的嵌套扩增。下图利用β-肌动蛋白 引物进行的对照RT-PCR。aBET-3K第7代细胞(p7)(转捩期前);bBET-3K第32代细胞(转捩期后);cBFT-3K第14代细胞(转捩期前);dBFT-3K第22代细胞(转捩期后);3BFT-3B第15代细胞(转捩期前);fBFT-3B第29代细胞(转捩期后);gGM897(ALT);hIIICF/c(ALT);iIIICF-T/B1(ALT);j无模板对照。
图7A-C表示hT1转录物的几种不同的剪接模式。A,六种剪接变体的示意图。B,几个鉴定的RNA变体的组合。C,RNA变体的推测的外显子/内含子接点的序列。在A部分标出了变体。给出了变体3的完整DNA序列(及所翻译的蛋白质)(SEQ ID NO)。标出了相应于一个可能的c-Abl/SH3结合位点的氨基酸。推测的外显子/内含子用标出,序列坐标(coordinate)如图1。推测的剪接外显子为小写字母而推测的未剪接的内含子为大写字母。
图8表示在不同的肿瘤样品中hT1转录物的各种剪接模式。利用HT2026F和HT2482R引物,在由HT1875F和HT2781R引物产生的原代RT-PCR产物上进行嵌套扩增(14个循环)。a肺癌;b淋巴瘤;c肺癌;d成神经管细胞瘤;e淋巴瘤;f.淋巴瘤;gT47D;h嗜铬细胞瘤;i淋巴瘤;j神经胶质瘤;k淋巴瘤;l无模板对照。
图9表示从LIM 1215cDNA合成的cDNA的扩增结果。如图中所示,逆转录基元A被从含有序列α的剪接变体中删除掉。引物组合有a,HTM2028F+HT2356R;b,HT2026F+HT2482R;c,HTM2028F+HT2482R;d,HT2026F+HT2482R。
图10A-B表示端粒酶变体区域的DNA序列。
图11A-W表示作为示范的变体端粒酶蛋白质的DNA和氨基酸序列。
图12是端粒酶活性分析的扫描图象。
图13A-D表示质粒pAK128.4的示意图及该质粒的DNA序列。
图14A-E表示质粒pAK128.7的示意图及该质粒的DNA序列。
图15A-D表示质粒pAK128.14的示意图及该质粒的DNA序列。
发明详述在开始阐述本发明之前,对此处用到的某些术语加以定义会有助于理解本发明。
如此处所用的,“野生型端粒酶”通常指一种多肽,它向染色体的末端酶促合成含有简单重复序列(例如CCCTAA,参考Zakian,科学2701601,1995)的核酸序列。已推测出一个代表性的人野生型端粒酶的氨基酸序列,并示于图1(SEQ ID NO.)。在本发明中,应当理解本发明的端粒酶不仅包括野生型蛋白质,还包括野生型蛋白质序列的变体(包括等位基因)。这些变体不必表现出酶促功能。简单地说,这些变体可以是由天然多态性造成的,包括RNA剪接变体,通过遗传重组形成,或是通过重组方法学合成的,而且,这种变体与野生型蛋白质的区别可以是一个或多个氨基酸的替换、插入、缺失、重排等等。典型地,当变体是合成的时,氨基酸替换是保守的,就是说,氨基酸替换在极性、非极性、芳香的、带电荷的等等相同组中的氨基酸。在逆转录酶基元区与野生型序列同源的区域内,变体与野生型具有至少90%的氨基酸序列同一性,在某些实施方案中,具有大于92%、95%,或97%的同一性。在逆转录酶基元区以外,变体优选地具有75%的氨基酸同一性,在某些实施方案中,具有至少80%、85%、90%、92%、95%或97%的同一性。
本领域的技术人员将知晓,一个编码端粒酶的核苷酸序列可以不同于附图中的野生型序列;这是由于密码子的简并性、核苷酸多态性,或氨基酸的差异造成的。在其它实施方案中,变体应在正常严谨的条件下优先与野生型核苷酸序列杂交,杂交条件大约是比天然双链的Tm值低25-30℃(例如1M Na+,65℃;5X SSPE,0.5%SDS,5X Denhardt氏溶液,65℃或同等条件;通常参考Sambrook等人,《分子克隆实验手册》(Molecular CloningA laboratory Manual),第二版,冷泉港出版,1987;Ausubel等人,《现代分子生物学技术》(Current Protocols in MolecularBiology),Greene出版公司,1987)。其它短寡核苷酸的Tm值可通过下面的公式计算出Tm=81.5+0.41%(G+C)-log(Na+)。低严谨杂交是在大约低于Tm值40℃的条件下进行的,而高严谨杂交是在大约低于Tm值10℃的条件下进行的。在逆转录酶基元区变体优选地与野生型序列具有至少75%的同一性,优选地至少80%、85%同一性,而最优选地具有至少90%的核苷酸同一性。
如此处所用的,“启动子”指含有指导与其相连基因转录的元件的一种核苷酸序列。最低条件是,启动子含有RNA聚合酶结合位点。更为典型的是,在真核生物中,启动子序列含有控制基因表达的速度和时间的其它转录因子的结合位点。这种位点包括TATA盒、CAAT盒、POU盒、AP1结合位点等等。启动子区还可以含有增强子元件。当一启动子与一基因相连以使该基因得以转录时,就称为“有效连接”。
“分离的核酸分子”指一种多核苷酸分子,其形式为独立的片段或一个较大的核酸构件的一个成分,是从其来源细胞中分离的(包括它正常所在的染色体)至少曾经为基本上纯的形式。核酸分子可以包括各种核苷酸,包括DNA、RNA、核苷酸类似物,或其组合。I.端粒酶、端粒酶基因和基因产物如上所述,本发明提供了涉及脊椎动物端粒酶基因和基因产物的组合物,以及利用这些基因和基因产物的方法。根据此处提供的公开内容,端粒酶基因可从表达端粒酶的各种细胞类型中分离到,包括无限增殖化细胞或转化细胞。如此处所例举的,来自人细胞的编码端粒酶的cDNA和变体被鉴定、分离,并表征。通过用编码端粒酶的表达载体转化的宿主细胞可以很容易地生产端粒酶蛋白质。A.端粒酶基因的分离如此处所述,本发明提供编码端粒酶的基因。在本发明的一个实施方案中,一个编码人端粒酶的基因可以利用从EST序列中设计的引物对通过cDNA文库扩增而鉴定。EST序列GenBank Accession No.AA281296,是通过与Euplotes aediculatus端粒酶基因(GenBankAccession No.U95964;Lingner等人,科学276561,1997)的序列同一性和相似性鉴定的。Euplotes端粒酶基因和EST的序列对比显示大约38%的氨基酸同一性和59%的氨基酸相似性。
端粒酶基因可从基因组DNA或cDNA中分离到。当需要启动子区或其它侧翼区时,优选基因组DNA。在染色体载体如YAC(酵母人工染色体)、细菌载体如λEMBL3、λgt10、粘粒或质粒中构建的基因组DNA文库,和在细菌载体(例如λZAPII)、质粒或其它载体中构建的cDNA文库都是适合筛选的。这种文库可以利用本领域的方法和技术进行构建(参考Sambrook等人,《分子克隆实验手册》,冷泉港出版,1989)和从商业渠道购买(例如,Clontech公司,Palo Alto,CA)。DNA可以从脊椎动物细胞中分离,如人细胞、小鼠细胞,其它啮齿类动物或灵长类动物细胞、鸟类细胞等等。
在一个实施方案中,端粒酶基因是利用cDNA文库的DNA为模板通过扩增分离的。利用报道的EST序列,可以分离人端粒酶。简单地说,就是根据EST核苷酸序列设计几套扩增引物。这种引物的例子列于表2(还可参考实施例1)。从具有高端粒酶活性的细胞中制备的cDNA文库的扩增是优选的。此处描述的引物扩增了一个片段,该片段具有从来自LIM1215 cDNA文库的EST序列预测的长度。LIM1215是一人结肠癌细胞系。通过DNA序列分析证实该片段的性质。
利用于一个可与EST引物之一相连的载体序列杂交的引物,在反应中扩增了含有附加序列的DNA片段。通过利用克隆位点任意一侧的载体引物,与EST引物结合使用,分离了一个衍生自h-TEL(人端粒酶)的3’区的1.6kb片段和一个衍生自5’区的0.7kb片段。利用一对EST序列内部引物,通过扩增证实了这些片段含有端粒酶编码序列。将这两个片段克隆到pBluescript并进行DNA序列分析。附加的DNA序列是通过C-RACE和扩增技术得到cDNA的5’端,以及通过从cDNA文库中杂交并分离克隆获得的。
一个对照人端粒酶的编译DNA序列和预测的氨基酸序列示于图1。如图中所示,对照端粒酶的编码区为3396个碱基长并有一段大约620个碱基长的3’非翻译区。预测的氨基酸序列为1132个氨基酸长并被描绘为四个主要结构域N-端、基本、逆转录酶(RT)和C-端。而且,人端粒酶含有与其它端粒酶(例如来自Euplotes和S.pombe的端粒酶)和逆转录酶同源的区域。这些基元在本文和在Kilian等人(人类分子遗传学(Human Molecular Genetics),122011-2019,1997)中被鉴定为结构域1、2、A、B、C和D,在Nakamura等人(科学,277955-959)中为结构域1、2、A、B′、C、D和E,而在Meyerson等人(细胞,90785-795,1997)中为基元1-6。不管采用的名称如何,这些基元都含有氨基酸621-626(基元1)和631-634(基元2)、708-720(基元A)、827-839(基元B)、863-871(基元C),以及895-902(基元D)。因为这些基元的边界是根据与其它端粒酶的相似性和同一性确定的,所以各个基元的功能性边界可能不同。
另外,对照端粒酶序列的变体是通过扩增获得的,这在本文中有描述。其DNA和预测的氨基酸序列示于图11中,并在下面有更详细的讨论。简单地说,这些变体中的一些变体编码被截短的蛋白质,而其它变体具有不同的C-端序列。这些变体似乎是由于不同的RNA剪接造成的,因为端粒酶似乎是人类中的一个单拷贝基因(见实施例2)。
或者,其它方法也可用于获得编码端粒酶的核酸分子。例如,通过利用抗体或可与端粒酶反应的抗体进行筛选,从表达文库中获得编码端粒酶的核酸分子(参考Sambrook等人,《分子克隆实验手册》,第二版,冷泉港出版,NY,1987;Ausubel等人,《现代分子生物学技术》,Greene出版公司和Wiley-Interscience公司,NY,1995)。在另一个实施方案中,编码端粒酶的核酸分子可以通过杂交筛选cDNA文库或基因组文库获得。用于杂交筛选的寡核苷酸可以根据此处提供的人端粒酶的DNA序列进行设计。用于筛选的寡核苷酸通常至少11个碱基长,更常用的是至少20或25个碱基长。在一个实施方案中,寡核苷酸为20-30个碱基长。这样的寡核苷酸可以通过自动化方式合成。为了便于检测,寡核苷酸可以方便地加以标记,通常是在5’端用一个报告分子,如一种放射性核素(如32p)、酶标记、蛋白质标记、荧光标记或生物素标记。根据载体的不同,文库通常为菌落或噬菌体,并将重组DNA转移到尼龙膜或硝酸纤维素膜上。杂交条件根据寡核苷酸的长度和GC含量加以调整。经过变性、中和,和将DNA固定到膜上,使膜与标记探针杂交。合适的杂交条件可以在Sambrook等人,同上,Ausubel等人,同上中找到,而且杂交溶液中可以含有添加剂如四甲基氯化铵或其它离液剂或亲水剂以增加杂交的特异性(参考PCT/US97/17413)。杂交后,利用合适的检测方法显示出杂交菌落或噬菌体,并且随后将其分离并增殖。候选菌落或扩增片段可以通过任何一种方法来证实其含有端粒酶DNA。例如,候选菌落可以与第二个非重叠探针杂交或进行DNA序列分析。通过这些方法,适用于本发明的含有端粒酶基因或基因片段的菌落就被分离出来。
端粒酶DNA还可以通过cDNA或基因组DNA扩增获得。用于扩增全长cDNA的寡核苷酸引物优选地衍生自位于编码区的5’或3’端的序列。基因组序列的扩增将利用跨越内含子序列的引物,并且采用适于长扩增产物的条件(参考Promega目录)。简单地说,用作扩增引物的寡核苷酸优选地不能具有自我互补序列,其3’端也不能有互补序列(以防止引物二聚体的形成)。优选地,引物具有约50%的GC含量并且具有限制性位点以便于克隆。通常,引物为15至50个核苷酸长,更优选地20至35个核苷酸长。引物与cDNA或基因组DNA退火并进行足够的扩增循环以产生可检测的产物,优选地是一种可以容易地通过凝胶电泳和染色观察到的产物。扩增片段被纯化并插入到载体(例如,病毒、噬菌粒或质粒载体,例如λgt10或pBS(m13+))中并增殖。
来自许多品种的端粒酶基因可以利用此处提供的组合物进行分离。对于密切相关的品种,人的序列或其部分序列可用作探针筛选基因组或cDNA文库。例如,含有催化位点(大约相应于图1的605-915位氨基酸)的端粒酶基因的一个片段可被标记,并用作探针筛选从小鼠、灵长类动物、大鼠、狗、或其它脊椎动物、温血动物、或哺乳动物类构建的文库。在正常严谨条件下进行一个初始杂交可以得到编码端粒酶的克隆或片段。如果没有观察到杂交,可以进行松(低)严谨条件杂交。改变杂交严谨度的指导方法可以从Sambrook等人,同上,以及其它众所周知的途径中获得。这样的探针还可以用于进化上具有多样性的品种如果蝇,尽管杂交条件通常更为松弛。
其它方法也可以用于从非人品种中分离端粒酶基因。这些方法包括,但不限于,利用来自保守区(如逆转录酶基元)的引物进行扩增,利用来自端粒酶的不同区域(包括逆转录酶区)的简并引物进行扩增,利用抗体探测表达文库,利用端粒酶RNA探测表达文库等等。通过氨基酸相似性和/或核酸同一性鉴定一基因序列为端粒酶基因。通常,氨基酸相似性,是鉴定端粒酶所优选的,它允许有保守性的差别。对于不同的品种,氨基酸相似性通常至少为30%,优选地至少40%或至少50%。核酸同一性可能较低所以难以评价。几种方便易得的计算机分析程序,如BLASTN和BLASTP,有助于确定基因和基因产物的相关性。候选的端粒酶基因的检测是利用此处描述的一种功能分析方法或其它相当的方法检测其酶活性。B.变体端粒酶基因此处提供的端粒酶核酸或氨基酸序列的变体(包括等位基因),可以很容易地从天然变体(如多态性,剪接变体,突变体)中分离、合成、或构建。根据用途不同,突变体可以构建成表现不同的或有缺陷的端粒酶功能。特别有用的端粒酶基因编码一种缺少酶活性但具有显性失活表型的蛋白质。而且端粒酶变体缺失一种或多种已知的端粒酶活性,包括逆转录酶活性、溶核活性、端粒结合活性、dNTP结合活性,以及端粒酶RNA(hTR)结合活性。
本领域的技术人员知道现在已经建立了许多形成突变体的方法(通常参考,Sambrook等人,同上;Ausubel等人,同上)。简单地说,形成少量核苷酸替换突变体的优选方法是利用跨越待突变的碱基并含有突变的碱基的寡核苷酸。寡核苷酸可与互补单链核酸杂交,而第二条链从寡核苷酸处延伸合成。相似地,缺失和/或插入突变体可以通过各种任何已知的一种方法进行构建。例如,将基因用限制性酶消化并重新连接,这样一些序列被删除,或者与分离的具有粘性末端的片段相连,这样就产生了具有插入或大的替换的突变体。在另一个实施方案中,变体是通过“外显子重排(exon shuffling)”形成的(参考美国专利No.5,605,793)。变体序列还可以通过“分子进化(Molecular Evolution)”技术形成(参考美国专利No.5,723,323)。其它形成变体序列的方法可以在如Sambrook等人(同上)和Ausubel等人(同上)中找到。变体序列的验证通常是通过限制性酶作图、序列分析、或探针杂交进行的,尽管其它方法也可以采用。将双链核酸转化宿主细胞,通常是大肠杆菌,但是其它原核生物、酵母、或大型真核生物也可以采用。标准的筛选技术,例如核酸杂交、扩增、以及DNA序列分析,将鉴定突变体序列。
在优选实施方案中,变体端粒酶的酶活性失活并赋予宿主细胞以显性失活的表型。不管实际机制如何,当显性失活的端粒酶在宿主细胞中表达时,天然有活性的端粒酶就被失活。在催化结构域中,逆转录酶基元具有保守的天冬氨酸残基。人端粒酶还含有这些重要的残基Asp712,Asp718,Asp868,和Asp869。这些天冬氨酸残基的一个或多个突变为非保守性的氨基酸(例如丙氨酸)将可能破坏酶促活性或影响端粒的缩短。对于每个这样的突变体,检测其显性失活现象。在某些实施方案中,优选的突变体是显性失活的并引起老化的表型。其它显性失活变体可以通过删除一个或多个逆转录酶基元或改变某些区域而形成,这些区域与DNA引发(priming)(如基元E)、RNA组分结合位点、模板结合位点、金属离子结合位点(如基元C)等等有关。
在其它实施方案中,编码端粒酶的核酸分子可以与另一个核酸分子融合在一起。我们将会看到,融合伴侣基因在某些实施方案中会贡献出一个编码区。于是,可能需要仅仅利用端粒酶的催化位点(例如氨基酸609-915)、单个逆转录酶基元(上述的)、此处描述的任何剪接变体端粒酶、端粒酶RNA结合位点等等。融合伴侣选择部分取决于应用的目的。融合伴侣可被用于改变端粒酶的特异性、提供一个报告基因功能、提供一个用于鉴定或纯化技术的标签序列,等等。报告序列或标签序列可以是任何一种蛋白质,它使得可以方便地并敏感地测量或分离基因产物,而不干扰端粒酶的功能。对于报告基因功能,β-葡糖醛酸糖苷酶(美国专利No5,268,463)、绿色荧光蛋白质和β-半乳糖苷酶都是很容易得到的DNA序列。肽标签是一个短的序列,通常衍生自天然蛋白质,可以被抗体或其它分子所识别。肽标签包括FLAG、Glu-Glu标签(Chiron公司,Emeryville,CA)KT3标签(Chiron公司)、T7基因10标签(Invitrogen,La Jolla,CA)、T7主要衣壳蛋白质标签(Novagen,Madison,WI)、His6(六组氨酸)、以及HSV标签(Novagen)。除了标签以外,其他类的蛋白质或肽,例如谷胱甘肽-S-转移酶也可以采用。C.由端粒酶基因衍生的片段和寡核苷酸另外,可以分离或构建部分端粒酶基因或基因片段以用于本发明。例如,通过众所周知的方法可以从模板DNA,如质粒DNA中分离到限制性片段,而DNA片段,包括限制性片段可以通过扩增产生。而且,寡核苷酸可以经合成或从重组DNA分子中分离到。本领域的技术人员知道,还有其它方法也可用于获得具有至少部分端粒酶序列的DNA或RNA分子。而且,对于特殊的应用,这些核酸可以通过本领域已知的技术,利用放射性标记(例如,32P、33P、35S、125I、131I、3H、14C)、荧光标记(例如,FITC、Cy5、RITC、Texas红)、化学发光标记、酶、生物素等等进行标记。
获得这些片段的方法在本领域是众所周知的。特别适用于本发明的端粒酶部分含有催化位点、单个逆转录酶基元、推测的内含子序列(参考图10)等等。寡核苷酸通常是通过自动化方式合成的;合成的方法和仪器是很容易得到的(例如应用生物系统公司,CA)。寡核苷酸可以含有非天然形成的核苷酸,例如核苷酸类似物、被修饰的骨架(如肽骨架)、核苷酸衍生物(如生物素化的核苷酸),等等。如此处所用的,寡核苷酸是指至少约7个核苷酸并通常不超过约100个核苷酸的核酸序列。通常,寡核苷酸大约为10至50个碱基之间,更常用的是大约18至35个碱基之间。寡核苷酸可以是单链的,或在某些情况下是双链的。如此处所用的,部分核酸是指含有比完整的母核酸序列少的多核苷酸。例如,端粒酶编码序列的一部分含有少于全长的端粒酶序列。一个“部分”通常至少是约7个核苷酸,也可以多至10、20、25或更多的核苷酸。一个片段是指具有任意长度的多核苷酸分子,并可以包括寡核苷酸,尽管常用但并不限于,术语寡核苷酸用于指短的多核苷酸,而术语片段用于指长的多核苷酸。
被用作扩增引物和杂交筛选探针的寡核苷酸可以根据此处给出的人端粒酶的DNA序列进行设计。用于扩增全长cDNA的寡核苷酸引物优选地衍生自5’和3’端的序列。选择扩增特定区域的引物用于形成大小容易检测的产物。在优选实施方案中,选择位于要进行其它RNA剪接的序列侧翼的引物。在优选实施方案中,选择了一套引物,使得跨越被剪接进(spliced-in)的序列的产物和跨越被剪接出(spliced-out)的序列的产物都具有合适的大小,在相同的条件下可被检出。在其它实施方案中,用两套引物检测其它剪接的RNA。例如一套引物位于剪接结合部侧翼以检测被剪接出的产物。第二套引物非常靠近结合部(这样被剪接出的扩增产物与引物二聚体具有相同的大小或比引物二聚体略长)或一套或多套引物来自被剪接进序列(这样被剪接出的RNA不会产生任何产物)。
扩增引物优选地没有自我互补序列,其3’端也没有互补序列(以防止形成引物二聚体)。优选地,引物具有大约50%的GC含量并含有限制性位点以便于克隆。扩增引物通常至少15个碱基并且通常不长于50个碱基,尽管在一些情况和条件下可使用更短的或更长的引物。更为常用的引物为17至40个碱基长、17至35个碱基长、或20至30个碱基长。引物与cDNA或基因组DNA退火并进行足够的扩增循环,通常是20至40个循环,以产生通过凝胶电泳和染色或通过杂交容易检测的产物。扩增片段被纯化并插入载体如λgt10或pBS(M13+)中,增殖、分离并进行DNA序列分析,进行杂交等等。
适用于筛选基因组、cDNA或其它类型(如突变体端粒酶序列)文库,探测Southern、Northern、或Northwestern印迹、扩增产物等等的寡核苷酸杂交探针可以根据此处提供的序列进行设计。用于杂交的寡核苷酸通常至少11个碱基长,一般长度少于100个碱基,优选至少15个碱基长,至少20个碱基长,至少25个碱基长,而优选地为20-70、25-50、或30-40个碱基长。为了便于检测,寡核苷酸可以被方便地予以标记,通常在5’端用报告分子,如放射性核素(如32P)、酶标记、蛋白质标记、荧光标记、或生物素进行标记(参考Ausubel等人,和Sambrook等人,同上)。根据载体的不同,文库通常为菌落或噬菌体,而重组DNA被转移到尼龙膜或硝酸纤维素膜上。经过变性、中和、并将DNA固定到膜上,使膜与标记探针杂交,并洗膜。利用合适的检测方法会显示出杂交菌落或噬菌体,然后将其分离并增殖。将核酸转移至膜上并进行杂交的方法是众所周知的。在某些实施方案中,加入杂交溶液的添加剂,例如离液剂(如四甲基氯化铵)或亲水剂(如三氯乙酸铵;参考PCT/US97/17413)以增加杂交的敏感性和特异性。如果在经过了与杂交条件相当的条件下(此处表示为低于Tm值的度数)的洗膜后,探针仍然保持在可检测的退火状态下,该探针就特异地与核酸杂交。D.人端粒酶的剪接变体除了图1的对照端粒酶DNA和蛋白质序列以外,还观察到几种RNA剪接变体。尽管一些变体反映了不完全加工的mRNA,值得注意的是这种变体在预先选择的多腺嘌呤化mRNA的RNA样品(LIM1215)中非常丰富。这些发现,以及它们在RT结构域中的成簇情况,说明插入变体似乎更反映了hT1蛋白质表达的调节情况。例如,外显子被删除的变体(参考α,β,图7)似乎是编码变体蛋白质的不同成熟类型。支持不同蛋白质的其它证据来自LIM1215 cDNA文库中的cDNA克隆的序列分析,与对照序列相比该文库含有缺失和插入。
至少有七种推测的内含子保留在mRNA中(参考图7,它列出了7个内含子中的6个)。内含子是独立保留的,因此,一个特定的mRNA可以没有、有任何1个、两个、等等直至7个内含子。由7个独立剪接形成的不同mRNA的最大数目是27,或128个不同的mRNA。这些内含子的DNA序列示于图10中。最靠近5’端的内含子,称为序列“X”,其长度未知,并且只列出了部分序列。
对照端粒酶序列(图1)包括内含子α和内含子β。在下面的讨论中,各个内含子的存在与否及其位置所起的作用均基于这是唯一的改变。我们将会看到,一个特定的内含子可以改变翻译产物的序列,而不管其它内含子是被剪接进还是剪接出。例如,内含子1的存在产生一个移码和截短的蛋白质,而不管内含子α、β、2或3是被剪接进还是被剪接出。
内含子“X”的存在产生一个截短的蛋白质,它含有大约600个N-端氨基酸,缺少所有的逆转录酶基元。在222位碱基上内含子“Y”的存在产生一个终止在内含子外三个密码子内的移码的蛋白质。因为Y内含子富含GC(大约为78%),测序很困难,所以内含子Y引起大约35个氨基酸的插入而不是移码。
位于1950位核苷酸的内含子1为38bp长,它在mRNA上的存在引起移码,并最终翻译出一个截短的蛋白质(终止密码子在1973位核苷酸)。这个截短的蛋白质仅含逆转录酶结构域1和2。
内含子α位于2131-2166碱基之间,常常观察到它从端粒酶mRNA中被剪接出去。从这样一个RNA翻译的蛋白质缺失了12个氨基酸,即失去了逆转录酶基元A。这个基元似乎是逆转录酶功能所必须的;在酵母EST2蛋白质中这个结构域内的单个氨基酸的突变产生具有显性失活功能的蛋白质,并且导致细胞老化和端粒缩短。
在2286-2468位删除β-外显子的另一个变体序列编码一个截短的蛋白质,这是由于在与2269位碱基相连的2287位碱基处发生了阅读移码,因此在2605位碱基处形成终止密码子。这个变体蛋白质具有逆转录酶的结构域1、2、A、B和部分C,但缺少另一个基元;除了逆转录酶结构域基元,在hT1的β插入序列中鉴定的另一个序列基元(AVRIRGKS)与P-环基元共有序列AXXXXGK(S)相匹配(Saraste等人,生化科学进展(Trends Biochem.Sci.)15430-434,1990)。该基元见于大量的蛋白质家族中,包括许多激酶、细菌dnaA、recA、recF、mutS和结合ATP的解旋酶(Devereaux等人,核酸研究(Nucl.Acids Res.),12387-395,1984)。因此P-环仅仅存在于大多数所分析的RNA样品中h-TEL的一个亚群中,而在几种肿瘤样品中完全不存在(图8)。
2843碱基处的内含子2含有一个框内终止密码,产生一个具有完整的逆转录酶结构域区但失去了C-末端的截短的蛋白质。因为C-末端可能起调控作用,所以该蛋白质的活性可能会受到影响。当保留内含子3时,也产生一个较小的蛋白质,因为此内含子含有一个框内终止密码子。所以,此蛋白质的C-末端序列被改变了。此种蛋白质可能具有的活性现在还不知道。HIV-1逆转录酶的晶体结构显示,缺少RNAase结构域的较短的蛋白质(p51)受到了C-末端向催化裂隙的“结合”折叠的抑制。如果假设hT1采取与HIV-RT相似的结构,那么C-末端hT1蛋白质变体将反映出相似的调控机制。
除了缺少对照C-末端结构域的变体外,在2157碱基处具有内含子3的变体表达一个不同的C-末端结构域。而且,由内含子3提供的编码区具有潜在的SH3结合位点,SGQPEMEPPRRPSGCVG,这个序列与在如共济失调毛细血管扩张突变的(ATM)蛋白质中发现的共有序列c-AblSH3结合肽(PXXXXPXXP)相匹配。另一个这种基元的例子见于hT1蛋白质的N-末端内,该肽序列为HAGPPSTSRPPRPWDTP。在端粒酶cDNA中发现了其它不同的C-末端结构域;EST12462(GenBankAccession No.AA299878)直至2157位碱基具有大约50个碱基的相同序列,然后开始与对照端粒酶序列以及内含子不同。这个新序列在50个碱基内具有一个内部终止密码子,这将产生一个截短的C-末端。
在一个ALT细胞系中检测到的变体(图6,泳道i)说明了hT1的碱性结构域可能至少在某些ALT细胞系中对于ALT机制有所贡献。有趣的是,这个ALT细胞系表达hTR基因。ALT的一个可能的机制似乎涉及在TRAP分析中失活的调节失常的端粒酶组分。
下表概括了剪接变体和所形成的蛋白质。为了简便起见,对于每个形成的蛋白质仅列出了一种变体。而且如上所述,Y内含子的存在似乎引起移码,从而形成截短的蛋白质,但是不引起插入。因此,Y内含子的每个阅读框都存在,而此表的构建似乎插入不造成截短的蛋白质。这些内含子的一个独立的组合会产生128种不同的mRNA序列。表1中的变体的DNA和氨基酸序列示于图11。
表1

E.载体、宿主细胞和表达与产生蛋白质的方法端粒酶蛋白质可在多种宿主生物体中表达。在一个实施方案中,端粒酶是在细菌,如大肠杆菌中表达的,已经构建了许多大肠杆菌表达载体,这些载体都是容易获得的。其它合适的宿主生物体包括其它细菌种类,以及真核生物,如酵母(例如酿酒酵母)、哺乳动物细胞(如CHO和COS-7)、和昆虫细胞(例如Sf9)。
将编码端粒酶、端粒酶的一部分、一个变体、其融合蛋白质等等的DNA序列引入到适合于宿主的表达载体中。在某些实施方案中,将端粒酶插入到一种载体中以便产生一种融合蛋白质。端粒酶序列衍生自一个现存的片段、cDNA克隆、或是经合成的序列。合成的一个优选方法是利用一套位于该编码区或其所需部分侧翼的引物,从cDNA中扩增该基因。如上面所讨论,端粒酶序列可以含有具有多密码子的各氨基酸的不同的密码子。选择最适合宿主种类的不同的密码子。通常还在引物序列中插入限制位点,这些位点是根据载体上的克隆位点加以选择的。如果需要的话,可以将翻译起始密码子和终止密码子设计到引物序列中。
最低要求是,载体必须含有启动子序列。载体中可以含有其它调控序列。这些序列包括转录终止信号序列、分泌信号序列、复制起点、选择性标记等等。这些调控序列彼此有效地结合在一起以进行转录或翻译。
此处用于端粒酶表达的质粒含有为了在宿主细胞(如细菌)中表达该蛋白质而设计的启动子。合适的启动子来源广泛而且在本领域众所周知。诱导型或组成型启动子是优选的。用于在细菌中表达的这些启动子包括T7噬菌体和其它噬菌体的启动子,例如T3、T5和SP6,以及trp、lpp,和lac操纵子。还可以采用杂合启动子(参考美国专利No.4,551,433),例如tac和trc。用于在真核细胞中表达的启动子包括P10或杆状病毒/昆虫细胞表达系统的多角体基因启动子(参考美国专利Nos.5,243,041,5,266,317,4,745,051,及5,169,784)、MMTV LTR、CMV IE启动子、RSVLTR、SV40、金属硫蛋白质启动子(参考美国专利No.4,870,009)以及其它诱导型启动子。为了表达该蛋白质,将启动子与端粒酶蛋白质的编码区有效地连接起来。
控制端粒酶转录的启动子本身可以受到阻遏子的控制。在一些系统中,通过改变细胞的生理条件可以使启动子去阻遏,例如,通过加入一个能够竞争性结合阻遏子的分子、或者通过改变生长培养基的温度。优选的阻遏子蛋白质包括,但不限于,负责IPTG诱导的大肠杆菌lacI阻遏子、温度敏感型λcI857阻遏子等等。大肠杆菌阻遏子是优选的。
在其它优选实施方案中,载体还含有转录终止序列,终止序列中有一段序列,它提供一种信号,通过聚合酶识别所选启动子而终止转录,以及/或者提供聚腺苷酸化的信号序列。
优选,载体能够在宿主细胞中复制。因此,当宿主细胞是一种细菌时,载体优选地含有细菌的复制起始区。优选的细菌复制起始区包括fl-ori和col E1复制起始区,特别是衍生自pUC质粒的复制起始区。在酵母中,ARS或GEN序列可用于保证复制的进行。哺乳动物细胞中最常用的系统是SV40的复制起始区。
质粒也优选地含有至少一个在宿主中起作用的选择性标记。选择性标记基因包括任何赋予宿主一种表型的基因,该表型使得转化细胞能够被鉴定出来并选择性地生长。细菌宿主的合适的选择性标记基因包括氨苄青霉素抗性基因(Ampr)、四环素抗性基因(Tcr)和卡那霉素抗性基因(Kanr)。在本发明中卡那霉素抗性基因是优选的。真核生物的合适的标记基因通常需要宿主中的互补缺陷型(例如,tk-宿主中的胸苷激酶)。但是,也可用药物标记(例如,G418抗性和潮霉素抗性)。
编码端粒酶的核苷酸序列还可以含有分泌信号,通过这个信号使蛋白质被合成为前体蛋白质,随后被加工并分泌出去。形成的经过加工的蛋白质可以从壁膜间隙或发酵培养基中回收。合适的分泌信号来源广泛并且在本领域是众所周知的(von Heijne,分子生物学杂志(J.Mol.Biol.)18499-105,1985)。在大肠杆菌(或其它宿主)中起作用的原核的和真核的分泌信号都可以采用。在本发明中优选的分泌信号包括,但不限于,这些由下列大肠杆菌基因编码的分泌信号pelB(Lei等人,细菌学杂志(J.Bacteriol.)1694379,1987)、phoA、ompA、ompT、ompF、ompC、β-内酰胺酶和碱性磷酸酶。
本领域的技术人员知晓,有大量的适于在细菌细胞中表达的载体并且这些载体都是很容易得到的。例如pET系列(Novagen,Madison,MI)、tac和trc系列(Pharmacia,Uppsala,瑞典)、pTTQ18(AmershamInternational plc,英国)、pACYC177、pGEX系列等载体都适合于端粒酶的表达。杆状病毒载体,如pBlueBac(参考,美国专利Nos.5,278,050、5,244,805、5,243,041、5,242,687、5,266,317、4,745,051、以及5,169,784;可从Invitrogen公司得到,San Diego)可用于在昆虫细胞中表达端粒酶,例如在草地夜蛾(Spodoptera frugiperda)sf9细胞中(参考美国专利No.4,745,051)。用于端粒酶表达的宿主的选择部分是由载体所决定的。商业上可得的载体是与适当的宿主成对提供的。
大量用于在真核细胞中表达的合适的载体是可以得到的。这些载体包括pCMVLacI、pXT1(Stratagene Cloning Systems,La Jolla,CA);pCDNA系列、pREP系列、pEBVHis(Invitrogen,Carlsbad,CA)。在某些实施方案中,端粒酶基因被克隆到基因导向载体中,例如pMClneo、pOG系列载体(Stragene)。
端粒酶蛋白质通过标准方法分离,例如亲和层析、分子排阻层析、金属离子层析、离子交换层析、HPLC,以及其它已知的蛋白质分离方法。(通常参考Ausubel等人,同上;Sambrook等人,同上)。一个被分离纯化的蛋白质用考马斯兰染色后在SDS-PAGE上为一条带。
在一个实施方案中,端粒酶蛋白质是以六组氨酸融合蛋白质的形式表达的,并通过含金属离子的层析法,如镍偶联珠层析进行分离。简单地说,编码His6的序列与编码端粒酶的DNA序列连在一起。尽管His6序列可以定位在分子中的任何地方,它优选地连接在3’端紧靠终止密码子之前的位置。His-hT1融合蛋白质可以通过这多种方法的任何一种进行构建。一个方便的方法是利用含有His6密码子的下游引物扩增TEL基因。F.端粒酶的肽和蛋白质在本发明的一个方面中,提供了具有端粒酶序列的肽。在此处和其它地方描述的分析中,这些肽可被用作免疫原制备抗体、用作端粒酶功能的抑制剂或增强剂。这些肽一般为5至100个氨基酸长,更常采用10至50个氨基酸。这些肽很容易以自动化方式经化学合成(PerkinElmerABI肽合成仪)或由商业途径获得。这些肽可以进一步通过各种方法加以纯化,包括高效液相层析。而且,这些肽和蛋白质可以含有这20种天然形成的氨基酸以外的氨基酸,或含有这些氨基酸的衍生物和修饰物。
本发明中特别感兴趣的肽具有内含子序列(图10)、逆转录酶基元等等。在某些实施方案中,端粒酶蛋白质具有图1或11中的氨基酸序列,或其至少8个氨基酸长的一部分(可以为10、15、20个氨基酸或更长)。在其它实施方案中,该蛋白质有一个或多个氨基酸被替换、插入、缺失。而在其它实施方案中,该蛋白质具有由一个核酸序列决定的氨基酸序列,该核酸序列在正常严谨条件下可与图11中任何一个序列杂交。如上面所指出,端粒酶的变体包括等位基因变体。II.端粒酶分析有多种方法可用于测定端粒酶的活性及表达。这些方法包括测量端粒酶延伸端粒DNA底物能力、溶核活性、引物(端粒)结合活性、dNTP结合活性、端粒酶RNA(hTR)结合活性的体外分析,体内功能获得(gain-of-function)分析,体内功能失去(loss-of function)分析,原位杂交,RNA酶探针保护、Northern分析,cDNA扩增,抗体染色等等。A.催化活性分析多种催化活性的分析方法在美国专利Nos 5,629,154;5,639,613;5,645,986等等中有描述。在一个传统的端粒酶活性分析方法中,使用具有宿主端粒序列的单链DNA引物(例如[TTAGGG]n)和端粒酶(参考Shay等人,分子遗传学方法(Methods in Molecular Genetics)5263,1994;Greider和Blackburn,细胞43405,1985;Morin,细胞59521,1989;美国专利No.5,629,154)。一个优选分析方法将基于去污剂的提取法与基于扩增的分析法结合起来。这种被称为TRAP(端粒重复扩增技术)的方法具有更高的敏感性(Kim等人,科学2662011,1994)。简单地说,在TRAP方法中,端粒酶合成延伸引物,延伸引物再作为扩增的模板。端粒酶产物是用衍生自寡核苷酸的非端粒区的引物和衍生自端粒区的引物扩增的。当例如通过凝胶电泳分析扩增产物,如果有端粒酶活性时可以观察到产物梯(ladder of products)。这种方法的排列已被描述(Krupp等人,核酸研究,25919,1997;Savoysky等人,核酸研究241175,1996)。而且,还有其它的端粒酶分析方法可以采用(Faraoni等人,化学疗法杂志(J.Chemother)8394,1996,描述了一种体外化学敏感性分析方法;Tatematsu等人,癌基因(Oncogene)132265,1996,描述一种“延伸PCR分析法”;Lin和Zakian,细胞811127,1995,描述一种酵母的体外分析方法)。
另外,催化活性或其它活性可以通过体外重建系统进行测定(参考实施例)。简单地说,分析方法,例如此处描述的那些方法,是利用由重组产生的纯端粒酶蛋白质和其它必须组分,例如端粒酶RNA组分、如WO/98/14593中描述的其它蛋白质进行的。B.其它活性分析溶核活性可以通过如Collins和Grieder,基因与发育(Genes andDevelopment)71364,1993)描述的技术进行评价。溶核活性是从位于DNA模板5’边界的一段核苷酸序列的3’端切除一个核苷酸(从端粒重复序列TTAGG切除G)。简单地说,此活性可以通过一个反应进行测定,该反应利用一个具有被封闭的3’核苷酸的核酸模板,即它不能作为聚合酶的引物,除非它经过溶核活性被除去。
端粒结合活性及分析在如Harrington等人,生物化学杂志(J.Biol.Chem)2708893,1995中有描述。一般地,可以采用任何检测蛋白质与核酸相互作用的方法,如凝胶移位分析。DNTP和RNA结合活性分析方法在如Morin,欧洲癌症杂志(Eur.J.Cancer)33750中有描述。C.功能获得与丢失体内功能获得分析可以通过将编码端粒酶的表达载体转染没有或几乎不可检测的内源活性的细胞而进行。然后通过如此处描述的那些体外分析方法测定活性。另一种功能获得分析方法可以在肿瘤细胞或其它表达端粒酶或逆转录酶的细胞中进行。端粒酶基因被转染到细胞中,并以高水平表达,将这些细胞用逆转录酶的抑制剂处理。然后观察到端粒酶活性对这些抑制剂的敏感性降低。而且,在酵母端粒酶突变体EST2中可以测定功能恢复情况。
功能丢失可以在表达高水平的端粒酶活性的细胞中测定,例如LIM1215细胞或其它肿瘤细胞。在这种分析中,将通常构建在表达载体中的反义寡核苷酸分子导入细胞中。端粒酶基因通过消除端粒酶活性得到证实。在另一种分析中,抑制端粒酶功能的抗体被用于展示功能性分子。D.端粒酶的表达端粒酶在各种细胞中的表达可以通过标准方法利用此处提供的序列进行分析。例如,用放射性或荧光标记探针(片段或寡核苷酸)的原位杂交可用于组织切片或固定化细胞。或者,可以将RNA从细胞中分离出来并用于Northern分析、Rnase探针保护分析等等。特定区域的探针和变体特异的探针将形成各种端粒酶转录物的表达分布曲线。
在一个优选实施方案中,通过扩增分析端粒酶的表达。用于扩增端粒酶的引物对(包括扩增特殊变体的引物对),被用于扩增从细胞RNA合成的cDNA。cDNA可以由总RNA或poly(A)+RNA合成。用于RNA分离的方法和技术是众所周知的。cDNA的合成可以由寡聚(dT)引物、随机引物(如dN6)、端粒酶特异引物等等起始。引物的选择至少部分取决于RNA的量和分析的目的。扩增引物是设计用于扩增脊椎动物细胞中存在的任何一种变体、几种特定变体的组合或所有变体的。选择与引物的长度、碱基含量、扩增产物的长度等等相称的扩增条件。有各种扩增系统可以采用(参考Lee等人,《核酸扩增技术》,生物技术丛书,Eaton出版,Natick,MA,1997;Larrick,《PCR技术定量PCR》,生物技术丛书,Eaton出版,Natick,MA,1997)。
其它用于定性和定量测定基因表达的分析方法都是众所周知的。当端粒酶mRNA的量很充足时,Rnase探针保护和Northern分析法是可行的。当只有极少的细胞时,需要进行单细胞分析,或者当样品中端粒酶RNA所占的比例极低时,采用扩增技术则是优选的。Rnase探针保护分析特别适用于检测剪接变体、突变体、以及定量这些RNA。
如上所讨论的,在优选实施方案中,各种RNA种类的表达是受到监测的。不同种类的分析可以采用任何能够将某一种类与其它种类区分开来的方法。于是,通过Northern确定长度、Rnase探针保护、克隆和扩增是一些可行的方法。在优选实施方案中,采用Rnase探针保护和扩增的方法。对于Rnase探针保护,该探针一般是衍生自对照序列和内含子连接处的一个片段,或者是衍生自内含子插入序列位点周围的序列的一个片段。例如,对照端粒酶上的一个跨越1950-1951位核苷酸的片段(如1910-1980位核苷酸)将保护对照序列上71个碱基的片段,它将保护具有内含子1的端粒酶上的41个碱基和30个碱基长的两个片段。相反,含有1910-1950位核苷酸和内含子1的30个碱基的一个片段将保护内含子1变体的71个碱基的片段和对照端粒酶的41个碱基的片段。用于Rnase探针保护的片段通常是选择30至400个碱基范围的长度,并且将片段进行定位以产生容易区分的保护产物。
另一种可用于区分变体的方法是扩增。扩增引物的设计和扩增的策略在上面有所描述。简单地说,优选那些能够将每个被剪接进或剪接出的变体单独扩增的引物。可以进行多重反应以鉴别那些发生过不止一次剪接进或剪接出事件的变体。
测定端粒酶蛋白质的方法在本发明中同样有用。例如,端粒酶抗体可用于使组织切片或透化细胞染色。抗体还可用于通过免疫沉淀、Westernblot等方法检测蛋白质。而且,使用此处描述的抗体可以确定端粒酶或端粒酶变体的亚细胞定位情况。E.端粒酶抗体此处所讨论的端粒酶蛋白质、片段或肽的抗体的制备很容易。这种抗体可以特异地识别野生型端粒酶蛋白质而不能识别突变体(或变体)蛋白质,或者能识别突变体(或变体)端粒酶蛋白质而不能识别野生型蛋白质,或者同时识别突变体(或变体)及野生型蛋白质。抗体可用于分离蛋白质、抑制(拮抗物)蛋白质的活性,或增强(激动剂)蛋白质的活性。同时,抗体的发展对与端粒酶作用的小分子的分析将有所帮助。
在本发明中,抗体被理解为包括单克隆抗体、多克隆抗体、抗特应抗体、抗体片段(如Fab,和F(ab′)2),Fv可变区,或互补决定区)。如果抗体与端粒酶蛋白质的结合Kd值大于或等于10-7M,优选地大于或等于10-8M,这种抗体一般被认为是特异性的。单克隆抗体或其结合对方的亲和性通过本领域普通技术人员可以很容易地测定(参考Scatchard,纽约科学院年报(Ann.N.Y.Acad.Sci.)51660-672,1949)。
简单地说,多克隆抗体的制品可以容易地从大量温血动物如兔子、小鼠或大鼠中产生。将动物用端粒酶蛋白质或其肽进行免疫,优选地将它们连接到一个载体蛋白质如匙孔血蓝蛋白质上。给药途径包括腹膜内、肌内、眼内、或皮下注射,通常是在佐剂中(如弗氏完全或不完全佐剂)进行。特别优选的多克隆抗血清在分析中表现出至少比背景高三倍的结合活性。
单克隆抗体还可以容易地利用传统技术从杂交瘤细胞系中产生(参考美国专利Nos.RE32,011,4,902,614,4,543,439和4,411,993;还参考《抗体实验手册》(AntibodiesA laboratory Manual),Harlow和Lane主编,冷泉港实验室出版,1988)。简单地说,在一个实施方案中,受试动物如大鼠或小鼠被用端粒酶或其一部分注射。该蛋白质以在一种佐剂如弗氏完全或不完全佐剂中的乳剂形式给药,以增加免疫反应。在最初免疫后的一至三周,动物一般被加强免疫,并用熟知的方法测试其对蛋白质的反应性。收获脾和/或淋巴结并使其无限增殖化。可以采用各种无限增殖化技术,如由Epstein-Barr病毒介导或融合以产生杂交瘤的技术。在一个优选实施方案中,无限增殖化的发生是通过与合适的骨髓瘤细胞系融合形成分泌单克隆抗体的杂交瘤。合适的骨髓瘤细胞系包括,例如,NS-1(ATCC NO.TIB 18),和P3X63-Ag8.653(ATCC NO.CRL 1580)。优选的融合伴侣不表达内源抗体基因。融合后,将细胞在培养基中培养,该培养基中含有使融合的脾和骨髓瘤细胞选择性生长的试剂,如HAT(次黄嘌呤、氨基蝶呤、和胸苷)。大约七天后,筛选存在能够与端粒酶蛋白质作用的抗体的杂交瘤。大量分析方法可以采用,包括如对流免疫电泳、放射免疫分析、放射免疫沉淀、酶联免疫吸附分析(ELISA)、点杂交分析、Western杂交、免疫沉淀、抑制或竞争分析,以及夹心法技术(参考美国专利Nos.4,376,110和4,486,530;还参考《抗体实验手册》,Harlow和Lane主编,冷泉港实验室出版,1988)。
也可以利用其他技术来构建单克隆抗体(参考Huse等人,科学2461275-1281,1989;Sastry等人,美国国家科学院院报(Proc.Natl.Acad.Sci.USA)865728-5732,1989;Alting-Mees等人,分子生物学策略(Strategiesin Molecular Biology)31-9,1990;描述重组技术)。简单地说,从B细胞群体中分离mRNA,并用于在合适的载体如λImmunoZap(H)和λImmunoZap(L)中构建重链和轻链免疫球蛋白质cDNA表达文库。这些载体可以被单独筛选或共表达以形成Fab片段或抗体(参考Huse等人,同上;Sastry等人,同上)。阳性噬菌斑可以随后被转变为能够高水平表达大肠杆菌单克隆抗体片段的非裂解质粒。
相似地,抗体的部分或片段,例如Fab和Fv片段,可以利用传统的酶解或重组DNA技术进行构建,以形成分离的抗体可变区。在一个实施方案中,来自产生目的单克隆抗体的杂交瘤编码可变区的基因是利用可变区的核苷酸引物扩增的。这些引物可以通过本领域普通技术人员进行合成,或者从商业渠道购买(如Stratacyte公司,La Jolla,CA)。扩增产物插入到载体如ImmunoZApTMH或ImmunoZApTML(Stratacyte)中,然后再导入大肠杆菌、酵母、或基于哺乳动物的系统中进行表达。利用这些技术,可以产生大量的含有VH和VL结构域融合的单链蛋白质(参考Bird等人,科学242423-426,1988)。另外,可利用技术将“鼠源”抗体变为“人源”抗体,而不改变该抗体的结合特异性。
一旦获得了合适的抗体,可以通过许多本领域普通技术人员熟知的那些方法进行分离或纯化(参考《抗体实验手册》,Harlow和Lane主编,冷泉港实验室出版,1988)。合适的技术包括肽或蛋白质亲和柱层析、HPLC或RP-HPLC、在蛋白质A或蛋白质G柱上纯化,或这些技术的任何组合。F.与端粒酶作用的蛋白质可以通过一种方法如酵母双杂交结合系统检测直接与端粒酶作用的蛋白质。简单地说,在双杂交系统中,构建DNA-结合结构域-端粒酶蛋白质融合体(如GAL4-端粒酶融合体)并转染到含有与选择性标记基因连接的GAL4结合位点的细胞中。可以使用完整的端粒酶蛋白质或端粒酶的亚区。还构建了融合到GAL4激活结构域的cDNA文库并共转染。当cDNA-GAL4激活结构域融合体中的cDNA编码与端粒酶作用的蛋白质时,选择性标记就会表达。培养含有cDNA的细胞,分离并鉴定该构件。还可以采用其它分析方法鉴定与端粒酶作用的蛋白质。这些方法包括ELISA、Western杂交、共免疫沉淀等等。III.端粒酶活性的抑制剂和增强剂候选的抑制剂和增强剂(统称为“效应物”)可从多种渠道分离到或获得,例如细菌、真菌、植物、寄生虫、化合物文库(如组合化学文库)、随机肽等等。效应物还可以是端粒酶的肽或变体肽、端粒酶变体、反义核酸、端粒酶抗体、端粒酶启动子活性的抑制剂等等。抑制剂和增强剂还可以根据从X-射线晶体学确定的蛋白质结构进行合理设计(参考,Livnah等人,科学273464,1996)。在某些优选实施方案中,抑制剂作用于特异的端粒酶,例如一种变体。
抑制剂的作用是通过阻止端粒酶与核蛋白质复合体的其他组分或端粒的结合,通过引起结合蛋白质的解离,或者通过其它机制。抑制剂的作用可以是直接的或者是间接的。在优选实施方案中,抑制剂干扰端粒酶蛋白质与端粒酶RNA或端粒的结合。在其它优选实施方案中,抑制剂是小分子。在一个最优选实施方案中,抑制剂使得细胞停止复制。抑制剂应当具有最低的副作用并且优选地是无毒的。能够透过细胞的抑制剂是优选的。
在其它优选实施方案中,效应物是以显性失活方式起作用的端粒酶蛋白质或肽(参考,Ball等人,现代生物学(Current Biology)771,1997;现代生物学684,1996)。例如,能够竞争性抑制端粒酶与端粒结合的端粒酶的肽将破坏端粒的延长。一般地,这些肽具有天然的序列,但是变体可以具有更强的活性(参考,Ball等人,同上)。变体可通过此处描述的方法进行构建。其它的肽可能结合端粒酶并抑制其一种或多种活性,但是不具有端粒酶的氨基酸序列。这种肽可以通过此处描述的方法加以鉴别。这些蛋白质或肽还可以增强端粒酶的活性。为了有效的抑制,肽类抑制剂优选地是由被转染或感染到宿主细胞中的载体表达的,但是载体也可以是通过其它方法导入的,例如脂质体介导的融合等等。真核生物载体为大家所熟知并且很容易得到。载体包括质粒、基于病毒的载体等等。
在另一个优选实施方案中,抑制剂是核酶。“核酶”是指一种能够切割端粒酶核酸序列的核酸分子。核酶由DNA、RNA、核酸类似物、或这些分子的任何组合形式(例如DNA/RNA杂合体)构成。“核酶基因”指一种核酸分子,当它被转录为RNA时能够产生核酶,而“核酶载体”指一种能够转录目的核酶基因的部件,由DNA或RNA构成。在本发明的某些实施方案中,载体可以含有一个或多个限制性位点和选择性标记。此外,根据所选择的载体和宿主细胞,此处描述的载体中可以含有另外的元件如复制起点、聚腺苷酸化位点、和增强子。
如上所述,本发明还提供能够抑制端粒酶基因表达的核酶。简单地说,可以产生大量的核酶用于本发明中,例如包括发夹核酶(参考如,Hampel等人,核酸研究18299-304,1990,EPO360,257,和美国专利No.5,254,678),锤头核酶(参考如,Rossi,J.J.等人,药物疗法(Pharmac.Ther.)50245-254,1991;Forster和Symons,细胞48211-220,1987;Haseloff和Gerlach,自然(Nature)328596-600,1988;Walbot和Bruening,自然334196,1988;Haseloff和Gerlach,自然334585,1988;Haseloff等人,U.S.Patent No.5,254,678),丁型肝炎病毒核酶(参考如,Perrotta和Been,生物化学(Biochem.)3116,1992),I组内含子核酶例如那些基于四膜虫核糖体RNA的核酶(参考如,Cech等人,美国专利No.4,987,071),RNase P核酶(参考如,Takada等人,细胞35849,1983);以及大量的能够切割目的或所选靶序列的其它核酸结构(参考如,WO95/29241,和WO95/31551)。在本发明的某些实施方案中,核酶的天然结构可以被改变以包含能够增加稳定性的四环或其它结构(参考如,Anderson等人,核酸研究221096-1100,1994;Cheong等人,自然346680-682,1990),或使核酶抵抗RNase或内切酶活性的结构(参考如,Rossi等人,药物疗法50245-254,1991)。
在本发明的一个实施方案中,提供了能够切割端粒酶核酸序列的发夹核酶和锤头核酶。简单地说,产生发夹核酶以使他们能够识别靶序列N3XN*GUC(N>6),其中N是G、U、C、或A,X是G、C、或U,而*是切割位点。相似地,产生锤头核酶以使他们能够识别序列NUX,其中N是G、U、C、或A。锤头或发夹核酶的其它核苷酸是根据靶序列周围的核苷酸和锤头共有序列确定的(参考Ruffner等人,生物化学(Biochemistry.)2910695-10702,1990)。特定核酶的制备和应用在Cech等人(美国专利No.4,987,071)中被描述。核酶优选地是由导入宿主细胞中的载体表达的。
本发明的核酶,以及编码这些核酶的DNA可以利用已发表的技术很容易地产生(例如,Promega,Madison Wis.,Heidenreich等人,J.FASEB7090-6,1993;Sproat,生物技术现代观点(Curr.Opin.Biotechnol.)420-28,1993)。或者,核酶可以由编码核酶并与RNA聚合酶启动子(例如,SP6或T7)有效连接的DNA或cDNA分子产生。RNA核酶是由DNA或cDNA分子转录产生的。
在其它优选实施方案中,抑制剂消除了端粒酶的启动子活性。真核启动子含有被RNA聚合酶结合的序列和其它参与转录单位调控的蛋白质。端粒酶的转录似乎是被高度调控的;该蛋白质主要在干细胞、胚胎细胞和癌细胞中表达,而在大多数体细胞中以低水平表达或根本就不表达。于是,启动子是抑制剂潜在的靶点。抑制剂破坏或阻止一个或多个控制端粒酶转录的因子的结合,引起转录减少或停止。转录水平仅仅需要低到使得至少一种端粒酶消失的足够低的水平。
本发明的另一个抑制剂是端粒酶编码或非编码序列的反义RNA或DNA。针对特定mRNA分子的反义核酸已经表现出抑制所编码蛋白质表达的活性。根据此处的端粒酶序列,设计反义序列并优选地插入适于转染宿主细胞的载体中,并表达反义序列。反义序列可以结合hT1 RNA的任何部分。在某些实施方案中,设计了与一个或多个变体特异结合的反义序列。特异结合的意思是在生理条件下,反义序列与具有互补序列的RNA结合,而不与其它RNA结合。因为含有任何特定内含子序列的端粒酶RNA可以是一组由于剪接变体独立排列组合造成的异源变体,所以不只一种RNA被结合并被钝化。此处的反义多聚核苷酸至少7个核苷酸长,一般不长于100至200个碱基,更典型的至少10至50个碱基长。关于反义分子的设计和导入细胞的方法方面的考虑可在美国专利Nos.5,681,747;5,734,033;5,767,102;5,756,476;5,749,847;5,747,470;5,744,362;5,716,846)中找到。
另外,在某些情况下需要端粒酶活性或表达的增强剂。有时,提高细胞的繁殖潜力将具有治疗作用。例如,在受伤或生病之后器官的再生或分化,受伤后神经细胞或脑细胞的生长,在骨髓移植中用到的造血干细胞或其它器官干细胞的繁殖等十分有限,并因此得益于端粒酶的增强剂。增强剂稳定内源蛋白质、增加转录或翻译、或通过其它机制起作用。正如本领域的技术人员所清楚的,上面提供的许多指导同样适用于增强剂的设计。
抑制剂和增强剂的筛选分析方法将随抑制剂的类型和受抑制的活性的性质不同而改变。分析方法包括TRAP分析或方差分析、不基于扩增的聚合酶分析、酵母双杂交法、用脊椎动物端粒酶转染的酵母中阻遏的释放等等。为了筛选与端粒酶启动子相互作用的化合物,通过报告基因进行的分析是很方便的。IV.端粒酶的应用端粒酶的核苷酸序列和端粒酶蛋白质被用于本发明的许多地方。在优选实施方案中,本发明的组合物被用作诊断剂或治疗剂。A.诊断剂编码端粒酶和/或蛋白质的mRNA的表达可用于正在分裂的细胞的检测,特别是肿瘤细胞和干细胞。检测方法包括抗体染色或用于检测蛋白质的标记端粒酶结合化合物,mRNA的核酸原位杂交,在DNA“芯片”上的杂交,Northern分析,Rnase探针保护,通过PCR或其它方法的扩增,连接酶介导的扩增等等。而且,RNA剪接变体的表达可以方便地通过扩增、RNase探针保护、其它公开的方法等分析。特别地,围绕频繁剪接变体位点的寡核苷酸引物例如此处描述的引物(例如,Htel内含子T和HT2482R)可用于检测不同细胞类型中的剪接变体。如实施方案中所示,不同的肿瘤细胞类型表现出不同的RNA剪接变化。可以确定剪接变体的类型与肿瘤所处的时期、转移潜力等的关系。这样,对特定变体的分析可用作一种诊断剂。具有增强的端粒酶活性的细胞,例如肿瘤细胞或过量增生性细胞可通过此处描述的任何一种方法进行定性或定量分析来鉴别。典型地,比较目的细胞和其来自相同个体或不同个体的正常对等细胞之间的端粒酶活性或表达。肿瘤或过量增殖造成活性增强这一指征是通过直接比较或通过检测其它细胞中的活性建立的,在这些细胞中已知缺失了端粒酶活性或表达。另外,可利用此处描述的分析方法监视肿瘤的发展或对治疗的反应,并比较一段时间内的活性或表达。
在一个ALT细胞系中检测到的表达端粒酶的变体提示,hT1这一基本结构域至少在一些ALT细胞系中促进了ALT机制。ALT的一个可能的机制涉及在TRAP分析中被钝化的调节异常的端粒酶组分。于是,变体的鉴别对随后的肿瘤发生有所帮助。
不同的mRNA剪接是在高等真核生物中调节基因表达的一种常见机制,并且有许多组织特异的、发育特异的和性别特异的剪接发生改变的例子。重要的是,15%与哺乳动物疾病状态有关的突变影响剪接类型(Horowitz和Krainer,遗传学进展(Trends Genet.)10100-106,1994)。细胞生理状态的改变也能引起剪接类型改变。实际上,肿瘤发生本身已经提示可以通过适应不同的剪接机制而提高mRNA剪接变体的表达。尽管其它新的、细微不同的剪接hT1变体在肿瘤发展中可能起作用,但是在与正常细胞相比的各种肿瘤细胞中,以及在与生命周期有限的转捩前细胞相比的转捩后细胞系中发现的主要转录物不同的相对表达水平,似乎是在肿瘤的发生和发展中起主要作用。另外,在睾丸和结肠隐窝以及肿瘤细胞系中发现的hT1的不同剪接变体的存在,显示出该基因在正常发育中受到复杂的调节。
在大多数肿瘤和所有端粒酶呈阳性的无限增殖化细胞系中都观察到了主要hT1产物的表达。所以hT1的转录调控是端粒酶活性及其它功能调节的一个主要方面。例如,除了维持种系中端粒的长度以外,端粒酶还在愈合染色体断裂中起作用。端粒酶的组成可以根据这些功能角色的不同而改变。
因此,内含子序列在诊断实践中特别有用。例如,疾病,例如癌、衰老、伤口的愈合、神经元再生、再生性细胞(如干细胞)的检测与鉴别是确定有效疗法的重要前奏。鉴于这一考虑,对伤口愈合的检测有助于开发并鉴别改良的化合物。当前,伤口愈合分析昂贵并耗时,而扩增或基于杂交的分析快速而费用低。在这些实践中,检测可以是定量的或是定性的。在定性分析中,一种变体序列(例如以不同方式剪接的内含子)的特定扩增引物对或杂交探针可被用于检测变体序列的存在与否。
在本发明中有用的探针包括可与图10中列出的序列或其互补序列杂交的核酸分子。杂交探针一般至少24个碱基,但其变化范围可以从12个碱基至全长序列。探针可以包含不与hT1 DNA或RNA杂交的其它序列。探针一般是DNA,但也可以是RNA、PNA、或其衍生物。选择对于探针长度和杂交方法合适的杂交条件(例如,在尼龙支持物上,在硅片上)。杂交条件在本领域是众所周知的。图10中的一个序列是基因组序列,在端粒酶mRNA中找不到。由这个序列衍生的探针可被用于在RNA样品和扩增反应中检测基因组DNA。杂交探针可用放射性标记物、化学发光标记物、或任何大量其它已知的标记物加以标记。
杂交可以在mRNA样品、cDNA样品上进行,可固定到固体支持物上、在溶液中、或在组织中原位进行等等。一种杂交分析是与固定在固体底物如经功能化处理的玻璃片或硅片上的寡核苷酸进行退火。这种芯片可从商业途径获得,或根据下面文献中提供的方法和步骤进行制备如PCT/US94/12282;美国专利No.5,405,783;美国专利No.5,412,087;美国专利No.5,424,186;美国专利No.5,436,327;美国专利No.5,429,807;美国专利No.5,510,270;WO 95/35505;美国专利No.5,474,796。寡核苷酸一般是以阵列的方式排列的,这样就能够确定每个寡核苷酸序列的位置。
对于扩增分析,需要用于扩增的引物对或者是位于内含子附近,或者是需要内含子存在。此处公开了许多这样的引物对。其它的引物对可以根据此处给出的序列进行设计。一般地,引物对的设计是使其仅仅能够扩增单个内含子,但是,在一些情况下在同一个RNA样品中检测多个内含子则是优选的。
其它诊断方法,例如原位杂交、RNase保护等方法可以单独使用或与上面讨论的方法联合使用。本发明提供了指导这些分析方法的原则,尽管这些技术是众所周知的。
可以构建转基因小鼠和无效突变体小鼠(如“敲除小鼠”)以促进候选抑制剂的测试。端粒酶基因优选地处于一个转基因小鼠载体构件的组织特异性启动子的控制下。过量表达端粒酶的小鼠可被用作测试抑制剂的模式系统。在这些小鼠中,过量表达端粒酶的细胞可望连续地繁殖。根据对细胞生长的观察和测量决定候选抑制剂的给药方式。能够减缓细胞生长或使细胞生长停止的抑制剂是候选的治疗剂。
端粒酶还可被转染到细胞中使各种细胞类型无限增殖化。暂时的无限增殖化可通过含有端粒酶的表达载体的不稳定转染获得。相反,通过添加或不加诱导物,可以使处于可诱导启动子控制下的端粒酶基因稳定转化子进行或不进行繁殖。相似地,端粒酶活性的抑制剂的存在与否可用于选择性地无限增殖化细胞。酵母中全部蛋白质的一部分的表达可以作为一种显性失活,因为许多的人类蛋白质与酵母中蛋白质复合体的一些组分相互作用,但是这种作用非常不完美因此是没有价值的。所以,这些基因作为显性失活。于是,酵母将最终老化。这种细胞可被用于筛选抑制剂药物,这种药物将使得酵母的生长度过老化期。
纯化的端粒酶蛋白质、对照变体蛋白质、或片段可被用于筛选抑制剂药物的分析中。这些分析将典型地在体外进行,并利用任何一种上述的方法或本领域已知的方法。该蛋白质还可以制成晶体并进行X-射线分析以确定其三维结构。B.治疗剂此处公开的组合物和方法还可在疾病和紊乱的治疗中用作治疗剂以影响细胞中的任何一种端粒酶活性。治疗是指任何对疾病或紊乱的改善,例如减轻疾病或紊乱的症状、减小肿瘤细胞的体积等等。例如,酶活性的抑制剂可用于限制细胞的繁殖。
许多疾病和紊乱与细胞的繁殖和繁殖潜力密切相关。与不希望的繁殖相关的一种最明显的疾病是癌症。此处描述的方法和组合物可用于治疗癌症,例如黑素瘤、其它皮肤癌、成神经细胞瘤、乳腺癌、结肠癌、白血病、淋巴瘤、骨肉瘤、等等。在本发明中适于治疗的其它疾病和紊乱包括细胞过度繁殖(与相同或不同个体的正常对等细胞相比其繁殖速率增加)如平滑肌细胞增生、皮肤生长等等。而其它的疾病和紊乱将受益于端粒酶活性的提高。端粒酶的增强剂可用于刺激干细胞繁殖和可能的分化。所以,造血干细胞的扩增可用于骨髓移植中。同时许多组织具有干细胞。这些细胞的繁殖有助于伤口愈合、毛发生长、疾病如Wilm′s肿瘤的治疗等等。
某些抑制剂或增强剂可以通过表达载体的方式给药。许多将核酸导入细胞的技术是已知的。这种方法包括逆转录病毒载体和随后的逆转录病毒感染、腺病毒或腺结合病毒载体和随后的感染、核酸与凝聚剂(如多聚赖氨酸)的复合体,这些复合体或病毒载体通过结合配体的方式导入特定的细胞类型。许多肿瘤细胞和其它细胞特异的配体在本领域是众所周知的。
如上所述,在本发明的某些方面,编码核酶、反义序列、显性失活端粒酶、端粒酶的部分等等的核酸可以通过向目的细胞引入一种功能性的基因,而被用于抑制端粒酶的活性。这可以通过向细胞传递一种合成的基因或者通过传递能够在体内转录基因产物的DNA或cDNA来实现。更特别的是,为了在体内产生该产物,编码该产物的核酸序列被置于一个真核启动子的控制之下(如pol III启动子、CMV或SV40启动子)。当需要更特异地控制转录时,该基因可被置于一个组织或细胞特异的启动子(如将细胞导入肝中),或一个可诱导启动子的控制之下。
大量的载体可用于本发明中,包括如质粒、病毒、逆转录转座子和粘粒。代表性例子包括腺病毒载体(如WO94/26914,WO93/9191;Yei等人,基因疗法(Gene Therapy)1192200,1994;Koll等人,美国国家科学院院报91(1)215-219,1994;Kass-Eisler等人,美国国家科学院院报90(24)11498-502,1993;Guzman等人,循环88(6)2838-48,1993;Guzman等人,循环研究(Cir.Res.)73(6)1202-1207,1993;Zabner等人,细胞75(2)207-216,1993;Li等人,人基因疗法(HumGene Ther.)4(4)403-409,1993;Cailaud等人,欧洲神经科学杂志(Eur.J.Neurosci.)5(10)1287-1291,1993),腺伴随1型病毒(“AAV-1”)或腺伴随1型病毒(“AAV-2”)载体(参考WO95/13365;Flotte等人,美国国家科学院院报90(22)10613-10617,1993),活体、或弱化的丁型肝炎病毒载体和疱疹病毒载体(如美国专利No.5,228,641),以及在美国专利No.5,166,320中公开的载体。其它代表性的载体包括逆转录病毒载体(如EP 0 415 731;WO90/07936;WO91/02805;WO94/03622;WO93/25698;WO93/25234;美国专利No.5,219,740;WO93/11230;WO93/11230;WO93/10218。方法和其它组合物参考美国专利No.5,756,264;5,741,486;5,733,761;5,707,618;5,702,384;5,656,465;5,547,932;5,529,774;5,672,510;5,399,346,和5,712,378)。
在本发明的某些方面中,利用载体或通过各种物理方法可将核酸分子导入宿主细胞中。这些方法的代表性例子包括用磷酸钙沉淀进行转化(Dubensky等人,美国国家科学院院报817529-7533,1984),直接显微注射核酸分子到完整的靶细胞中(Acsadi等人,自然352815-818,1991),和电穿孔法。在电穿孔法中,悬浮在导电溶液中的细胞被置于强电场中使细胞膜被瞬时极化,从而使核酸分子进入细胞。其它方法包括利用连接在失活腺病毒上的核酸分子(Cotton等人,美国国家科学院院报896094,1990),脂质转染法(Felgner等人,美国国家科学院院报847412-7417,1989),微粒轰击法(Willianms等人,美国国家科学院院报882726-2730,1991),聚阳离子化合物如聚赖氨酸、受体特异性配体、包裹核酸分子的脂质体,含有核酸分子的大肠杆菌被除去外层细胞壁并通过聚乙二醇融合到动物细胞中形成的球形融合体,病毒转导(Cline等人,药物疗法2969,1985;和Friedmann等人,科学2441275,1989),和DNA配体(Wu等人,生物化学杂志26416985-16987,1989),以及被补骨脂素失活的病毒如仙台病毒或腺病毒。在一个实施方案中,利用脂质体法将核酸分子导入宿主细胞中。
效应物的给药方法一般按照现有方案进行。本发明的化合物可单独给药,或是作为药物组合物给药。简单地说,本发明的药物组合物可含有此处描述的一种或多种抑制剂或增强剂,并与一种或多种药学或生理学上可接受的载体、稀释剂或赋形剂结合使用。这些组合物可以含有缓冲液如中性缓冲盐水、磷酸缓冲盐水等等,碳水化合物如葡萄糖、甘露糖、蔗糖或葡聚糖、甘露醇,蛋白质、多肽或氨基酸如甘氨酸,抗氧化剂、螯合剂如EDTA或谷胱甘肽,佐剂(例如氢氧化铝)和防腐剂。另外,本发明的药物组合物还可以含有一种或多种另外的活性成分。效应物可以进一步结合一个导向基团,它可与繁殖细胞特异的细胞表面受体结合。
本发明的组合物可以根据指定的给药方式进行配制,包括如经口、经鼻、经静脉、颅内、腹膜内、皮下、或肌内给药。在本发明的其它实施方案中,此处描述的组合物可以作为缓释植入物的一部分。而在其它实施方案中,本发明的组合物可制成冻干粉,利用合适的赋形剂提高冻干粉和随后的再水化的稳定性。
如上所述,本发明还提供了药物组合物。这些组合物含有任何一种上述核酶、DNA分子、蛋白质、化学药品、载体、或宿主细胞,以及药学或生理学上可接受的载体、赋形剂或稀释剂。一般地,这些载体在所用的剂量和浓度内对受体应是无毒的。通常,这些组合物的制备包括使治疗剂与缓冲液、抗氧化剂如抗坏血酸、低分子量(低于约10个残基)多肽、蛋白质、氨基酸、碳水化合物包括葡萄糖、蔗糖或糊精、螯合剂如EDTA、谷胱甘肽和其它稳定剂和赋形剂混合。中性缓冲盐水或与非特异性血清白蛋白质混合的盐水是合适的稀释剂的范例。
另外,本发明的药物组合物可制成不同药剂以便通过多种不同的途径给药,包括如关节内、颅内、皮内、肝内、肌内、眼内、腹膜内、鞘内、静脉内、皮下注射或者甚至直接注射到肿瘤中。另外,本发明的药物组合物可置于容器内,并有提供该药物组合物使用指导的包装材料。一般地,这些指导将包括描述药剂浓度的明确说明,以及在某些实施方案中还包括赋形剂成分或稀释剂(如水、盐水或PBS)的相对含量,这些成分是重构药物组合物所必需的。药物组合物对于诊断或治疗都是有用的。
本发明的药物组合物可以针对所治疗(或预防)的疾病采取适当的给药方式。给药的量和频率将根据这些因素确定,例如患者的条件、以及患者病情的类型和严重程度等。在临床实验中最精确地确定给药的剂量。通过适当的技术检测患者的治疗效果,这些技术包括临床恶化的观察、成像等等。
下面的实施方案是通过说明的方式提供的,而不是意在限制。实施例实施例1人端粒酶基因的鉴定与分离一个人端粒酶基因是在从癌细胞系构建的cDNA文库中鉴定的。将该cDNA进行DNA序列分析(Kilian等人,同上)。
通过BLAST与GenBank登录号U95964(p=3.2×10-6)的Euplotes端粒酶序列比较,GenBank登录号AA281296的EST序列被鉴定为一个部分端粒酶基因序列。两个序列之间的氨基酸序列的同一性大约为38%而氨基酸序列的相似性大约60%。
为了获得更长的hT1克隆,利用EST序列内部引物,通过扩增的方法筛选从肿瘤细胞制备的cDNA文库。基于EST序列的引物HT1553F和HT1920R用于在不同cDNA文库中扩增大约350bp的片段。扩增反应是在“热启动”条件下进行的。扩增循环为95℃4分钟;80℃1分钟;94℃30秒、55℃30秒、72℃1分钟30次循环;以及72℃5分钟。在12个所筛选的文库中,仅从3个文库中检测到了预期大小(~350bp)的扩增产物。在睾丸cDNA文库、体细胞文库、和不同癌细胞cDNA文库中未检测到片段。然而,从结肠癌细胞系LIM1215细胞中检测到了高丰度的350bp片段。在这个文库以及其它几个文库中,扩增了大约170bp的另外一个片段。
从LIM1215文库中获得更长克隆的方法有两个用32P标记的EST探针筛选噬菌斑和在文库DNA上扩增。通过用EST探针进行文库杂交获得了一个具有1.9kb插入片段的阳性噬菌斑,命名为53.2。此克隆的DNA序列分析表明它从EST序列的5’和3’延伸,但是并不含有一个开放阅读框(ORF)。从文库的扩增分析获得的一个片段在序列上与53.2片段相似,但是还含有36bp和>300bp的另外两个序列。这两个插入片段表示出了在相对于53.2序列边界处剪接受体和供体序列的特征,可能代表了未剪接的内含子。用T7引物和HT1553F引物扩增,产生一个大约1.6kb的片段;而用T3引物和HT1893R引物扩增,产生了一个大约0.7bp的片段。每个片段都支持用HTEL1553F引物和HT1893R引物扩增,得到320bp的片段。
更长的克隆还可以通过mRNA样品的扩增获得。在LIM1215 mRNA上进行逆转录PCR(RT-PCR)鉴定出另外一个PCR产物,包括一个相对于53.2片段的具有182bp插入片段的产物,它形成一个开放阅读框(ORF)。cDNA是从分离自正常组织和肿瘤组织的RNA合成的。在进行嵌套扩增前用Titan RT-PCR系统(Boehringer-Mannheim)进行RT-PCR。扩增条件如下95℃2分钟,94℃30秒两个循环,65℃30秒和68℃3分钟,94℃30秒,63℃30秒,68℃3分钟两个循环,94℃30秒,60℃30秒和68℃3分钟34个循环。RT-PCR产物稀释100倍,将其中1微升用Taq聚合酶和缓冲液Q(Qiagen)进行嵌套扩增。扩增条件如上,除了最后一步为14个循环。对于正常组织和肿瘤组织,将扩增产物在1.5%琼脂糖凝胶上电泳分离,转移至Zetaprobe膜上并用放射性标记的寡核苷酸HT1691F探测。
分别用cRACE和3’RACE的组合,在LIM1215mRNA上将该DNA序列的5’和3’延伸,得到了命名为hT1(图1)的3871bp的片段。进行两轮cRACE以延伸hT1序列并确定转录的起始位点。用500纳克LIM1215 polyA+RNA作为模板。cDNA第一条链的合成是用HT1576R引物引发的。在连接产物(利用XL-PCR系统)上进行的第一轮扩增采用HT1157R和HT1262F引物。扩增产物用Qiagen柱纯化,并进一步用HT1114R和HT1553F引物扩增。产生的1.4kb谱带进行DNA序列分析,并根据该序列设计了一套新的引物。在第二轮cRACE中,cDNA第一条链用HT220R引物引发。第一轮扩增采用HT0142R和HT0141F引物。产物按上述纯化并用HT0093和HT0163F扩增。观察到一个100bp的产物,并在两个独立的实验中将其进行序列分析以确定hT1转录物的5’末端。转录物的5’末端还可以通过用引物HtelFulcodT 5′-AGGAGATCTCGCGATGCCGCGCGCTC-3′和HtelFulcodB 5′-TCCACGCGTCCTGCCCGGGTG-3′对LIM1215 RNA扩增得到。产生的扩增产物用MluI和BglII消化并连接到剩余的端粒酶cDNA序列上。
转录物的3’远端序列是通过进行两轮扩增(XL-PCR系统)得到的,在两轮扩增中都采用EBHT18作为反向引物,而在第一和第二轮扩增中分别采用HT2761F和HT3114F作为正向引物。
hT1的大小与从LIM1215 RNA中丰度最高的RNA的Northern杂交(见下面)中估计的大小非常吻合。在图1中列出了大约3.9kb的DNA序列。在EST中发现的序列位于1624-2012位核苷酸。最大开放阅读框的预测的氨基酸序列也在图1中列出。如图中所示,该蛋白质为1132个氨基酸。
表2名称寡核苷酸序列HT0028F 5′-GCTGGTGCAGCGCGGGGACCHT5′Met5′-CACAAGCTTGAATTCACATCTCACCATGAAGGAGCTGGTGGCCCGAGTHT0093R 5′-GGCACGCACACCAGGCACTGHT0141F 5′-CCTGCCTGAAGGAGCTGGTGHT0142R 5′-GGACACCTGGCGGAAGGAGHT0163F 5′-CCGAGTGCTGCAGAGGCTGTHT0220R 5′-GAAGCCGAAGGCCAGCACGTTCTTHT1262F 5′-GTGCAGCTGCTCCGCCAGCACAHT1114R 5′-GTTCCCAAGCAGCTCCAGAAACAGHT1157R 5′-GGCAGTGCGTCTTGAGGAGCAHT1553F 5′-CACTGGCTGATGAGTGTGTACHT1576R 5′-GACGTACACACTCATCAGCCAGHT1590F 5′-GGTCTTTCTTTTATGTCACGGAGHT1691F 5′-CACTTGAAGAGGGTGCAGCTHT1875F 5′-GTCTCACCTCGAGGGTGAAGHT1893R 5′-TTCACCCTCGAGGTGAGACGCTHT1920R 5′-TCGTAGTTGAGCACGCTGAACHT2026F 5′-GCCTGAGCTGTACTTTGTCAAHTM2028F 5′-CTGAGCTGTACTTTGTCAAGGACAHT2230F 5′-GTACATGCGACAGTTCGTGGCTCAHT2356R 5′-CATGAAGCGTAGGAAGACGTCGAAGAHT2482R 5′-CGCAAACAGCTTGTTCTCCATGTCHT2761F 5′-CTATGCCCGGACCTCCATCAGAHT2781R 5′-CTGATGGAGGTCCGGGCATAGHT3114F 5′-CCTCCGAGGCCGTGCAGTHT3292B 5′-CACCTCAAGCTTTCTAGATCAGTCCAGGATGGTCTTGAAGTCAHT3689R 5′-GGAAGGCAAAGGAGGGCAGGGCGAEBHT185′-CACGAATTCGGATCCAAGCTTTTTTTTTTTTTTTTTTHT-RNA-F 5′-GGGTTGCGGAGGGTGGGCHT-RNA451R5′-GCAGTGGTGAGCCGAGTCCTGHT-RNA598F5′-CGACTTTGGAGGTGCCTTCAHTel5′T 5′-GCTGGTGCAGCGCGGGGACCHTel979T 5′-GAGGTGCAGAGCGACTACTCCAHTel1335T 5′-GTCTCACCTCGAGGGTGAAGHTel71T 5′-GGCTGCTCCTGCGTTTGGTGGAHTel21B(Top) 5′-GCCAGAGATGGAGCCACCCHTel21TBot) 5′-GGGTGGCTCCATCTCTGGCHTel-7B 5′-CCGCACGCTCATCTTCCACGTHTel+256B 5′-GCTTGGGGATGAAGCGGTCHtelIntronT 5′-CGCCTGAGCTGTACTTTGTCAHtel 3′CODB5′-CACCTCAAGCTTTCTAGATCAGCTAGCGGCCCAGCCCAACTCCCCTHtel 1210B 5′-GCAGCACACATGCGTGAAACCTGTHtel 1274B 5′-GTGTCAGAGATGACGCGCAGGAAHtel 1624b 5′-ACCCACACTTGCCTGTCCTGAGThTR TAC 5′-ACTGGATCCTTGACAATTAATGCATCGGCTCGTATAATGTGTGGAGGGTTGCGGAGGGTGGGChTR 5′T7 5′-CTGTAATACGACTCACTATAGGGTTGCGGAGGGTGGGChTR 3′PstI 5′-CACCTGCAGACATGCGTTTCGTCCTCACGGACTCATCAGGCCAGCTGGCGACGCATGTGTGAGCCGAGTCCTGBT-177 5′-GGATCCGCCGCAGAGCACCGTCTGBT-178 5′-CGAAGCTTTCAGTGGGCCGGCATCTGAACBT-179 5′-CGAAGCTTTCACAGGCCCAGCCCAACTCCBT-182 5′-GCGGATCCAGAGCCACGTCCTACGTCBT-183 5′-GCGGATCCGTTCAGATGCCGGCCCAC实施例2HT1序列及与其它端粒酶的序列比较多重序列比较显示推测的hT1蛋白质与Euplotes和酿酒酵母端粒酶催化亚单位在全长范围内共线性(co-linear)(图2)。尽管三种蛋白质之间的整体同源性相对较低(在所有的成对组合中大约为40%的相似性),但是蛋白质的整体结构似乎非常保守。四个主要的结构域N-末端、碱性的、逆转录酶(RT)和C-末端结构域存在于所有三种蛋白质中。序列相似性最高的区域是在RT结构域中。显然,Euplotes逆转录酶结构域的所有基元的特征都存在于hT1序列中,并且与逆转录酶催化有关的所有氨基酸残基也都保留在hT1序列中(Lingner等人,科学276561-567,1997)。
最近,用蛋白质磷酸酶2A处理人乳腺癌细胞提取物,显示能够抑制端粒酶的活性(Li等人,生物化学杂志27216729-16732,1997)。尽管还不知道这种作用是不是直接的,但是它提高了蛋白质磷酸化对端粒酶活性调节的可能性。推测的hT1蛋白质不含有大量潜在的磷酸化位点,包括11SP或TP二肽,这些是细胞周期依赖性激酶的潜在位点。实施例3端粒酶基因的表征进行Northern分析和Southern分析以确定端粒酶转录物的大小以及端粒酶基因是否是在肿瘤细胞中扩增的。
对于Northern分析,polyA mRNA是从LIM1215细胞和CCD成纤维细胞中分离的。CCD是一个原代人成纤维细胞系。在含有去污剂(0.1%SDS)和200μg/ml蛋白质酶K的缓冲液(0.1M NaCl,10mM Tris,pH 7.4,1mM EDTA)中通过匀浆简单地将细胞裂解。将SDS加到裂解液中至终浓度为0.5%,并将裂解液在60℃保温1小时和37℃下保温20分钟。将裂解液与Oligo dT-纤维素再保温1小时,Oligo dT-纤维素事先经在0.1M NaOH中预循环并经在0.5M NaCl,10mM Tris pH 7.4,1mMEDTA,和0.1%SDS中平衡。离心收集树脂,在平衡缓冲液中分批洗涤,并装柱。mRNA用温缓冲液(38℃)(10mM Tris pH 7.4,0.1mM EDTA)洗脱下来并用乙醇沉淀。
大约3微克聚腺苷酸化的RNA在0.85%的甲醛-琼脂糖凝胶上电泳(参考Sambrook等人,同上),过夜转移至Genescreen plus膜(Bio-Rad,CA)上。将膜用32P标记的端粒酶特异探针(相应于EST序列的390bp插入片段)杂交。经高严谨度洗膜后,在来自LIM1215的mRNA中观察到一条很明显的~3.8kb的谱带,而在来自CCD成纤维细胞的mRNA中没有(图3)。随后,同一张膜用甘油醛6-磷酸脱氢酶探针进行的杂交显示两种mRNA的谱带强度相同,说明各泳道中含有相似数量的高质量的RNA。仅在LIM1215RNA中还观察到更大的转录物(特别是~8kb非均一的谱带)的存在(图10,上道)。这些结果证明了其它hT1-特异的mRNA的存在,以及hT1可以优选地在肿瘤细胞而非正常细胞中表达。
为了Southern分析,DNA从人的外周血液单核细胞和LIM1215细胞中分离。大约10微克DNA用HindIII、XbaI、EcoRI、BamHI和PstI消化,在1%琼脂糖凝胶中电泳,并转移至尼龙膜上。作为对照,将含有人端粒酶的质粒DNA滴定至每10微克基因组DNA大约10个拷贝、5个拷贝和1个拷贝,并在相同凝胶中电泳。一个390bp的端粒酶基因片段(含有EST序列)被用32p标记并在正常严谨度条件下杂交。在2×SSC,0.1%SDS中55℃下洗膜。图4中给出了一个扫描磷图象。如图所示,端粒酶基因似乎没有在LIM1215细胞中被扩增或重排,因为LIM1215与PBMC DNA相比其杂交带型与强度没有明显的不同。而且,端粒酶似乎是一个单拷贝基因,因为除了PstI以外,所有的酶消化都产生单一谱带。实施例4HT1的表达模式尽管已经将端粒酶活性与肿瘤细胞和种系广泛地联系在一起,但是直到最近才认识到某些正常的哺乳动物组织表达低水平的端粒酶活性。在原代成纤维细胞RNA中没有检测到hT1的表达,并且用EST区的引物扩增几种从商业途径得到的肺、心脏、肝、胰、海马区、胎儿脑以及睾丸的cDNA文库也没有得到任何产物。
然而,在前面已表明具有端粒酶活性的正常组织(结肠,睾丸和外周血液淋巴细胞)以及许多黑素瘤和乳腺癌样品中检测了hT1的表达。从正常的人结肠、睾丸和循环淋巴细胞和肿瘤样品的组织切片中分离RNA,并进行RT-PCR分析。cDNA的扩增产物很容易与因污染了基因组DNA而形成的产物区别开,因为利用cDNA为模板得到~300bp的产物,而利用基因组DNA为模板得到2.7kb的产物。在结肠、睾丸和大多数肿瘤样品中都检测出hT1转录物,在淋巴RNA中转录物非常弱(图5,上道)。有趣的是,两个乳腺癌样品的hT1表达呈阴性,尽管以β-肌动蛋白的扩增作为阳性对照判断它含有与其它样品数量相当的RNA(图5,下道)。
端粒酶活性的获得似乎是无限增殖化过程的一个重要的方面。在许多区配的成对转捩前细胞培养物和转捩后细胞系中hT1的表达利用RT-PCR进行测定,随后进行嵌套引物扩增(图6,上道)。根据TRAP分析(Bryan等人,EMBO J.144240-4248,1995),这些细胞系分别是端粒酶阴性(转捩前细胞系)和阳性(转捩后细胞系)的。在两个匹配的成对细胞系BFT-3B和BET-3K中,hT1仅在转捩后细胞系中检测到(比较a泳道和b泳道、e泳道和f泳道)。尽管BFT-3K的转捩后细胞系(d、f泳道)显示出丰富的hT1谱带,但是相同大小的片段在转捩前培养样品(c、e泳道)中仍然很弱。另外,三个转捩后细胞系中的两个显示存在另外一个320bp的意料之外的片段,并且当在高分辩率胶上分析结肠和睾丸mRNA时也观察到了这个产物。
对三个无限增殖化的端粒酶阴性(ALT)细胞系也进行hT1表达分析(图6,g,h,i泳道)。两个细胞系显示hT1表达阴性,但是在另一个细胞系(IIICF-T/B1)中,又扩增到了一个大约320bp的产物,这与转捩后的结肠和睾丸样品相似。来自IIICF-T/B1(ALT)细胞系的320bp产物的DNA序列分析显示,与期望的产物相比存在一个38bp的插入片段。利用相同的引物但是用基因组DNA为模板进行的扩增排除了这是一个基因组DNA扩增而不是mRNA扩增的可能性。在这些条件下,扩增到一个2.7kb的片段,通过部分序列分析得到确证。实施例5端粒酶mRNA其它剪接类型的鉴定LIM1215cDNA文库中克隆的DNA序列分析和上述转捩前和转捩后培养物的RT-PCR数据表明,在hT1转录物中有大量不同的序列变体。为了系统地测定变体,利用包含整个序列的引物对进行RT-PCR。在N-末端和碱性结构域中没有发现变体,而在逆转录酶结构域中发现了几个变体,以及在C-末端结构域发现了更少的变体。最明显的是,在逆转录酶基元A和逆转录酶基元B之间有几个RNA变体(图7A)。
mRNA样品是利用传统方法从几种不同的肿瘤中制备的。这些肿瘤是(1)SLL肺癌,(2)淋巴瘤C,(3)肺癌,(4)成神经管细胞瘤,(5)淋巴瘤B,(6)淋巴瘤E,(7)肿瘤样品47D,(8)嗜铬细胞瘤,(9)淋巴瘤F,(10)神经胶质瘤,和(11)淋巴瘤G。这些样品的mRNA首先被逆转录为cDNA,再用引物HT1875F和HT2781R扩增,最后用嵌套引物HT2026F和HT2482R扩增。在图8中发现了四个不同的扩增产物220bp(谱带1)、250bp(谱带2)、400bp(谱带3)和430bp(谱带4)。令人惊讶的是,所测试的肿瘤样品在扩增产物的总数和这些产物的定量分布上都有很大的差异。
这些产物中的三个从一些肿瘤组织中分离,并进行DNA序列分析。其中之一,一个220bp的片段与LIM1215文库的53.2cDNA相等。大约250bp的片段(谱带2)含有36bp的框内插入片段,与从LIM1215cDNA文库的扩增产物中鉴定的插入片段相同。因为RT-PCR产物与cDNA文库的产物具有相同的序列,很明显36bp插入片段不是在文库构建时人工形成的。最大的产物(谱带4)与250bp复制子相比含有182bp的插入片段(与前面从LIM1215 RNA扩增的较大产物相同)。400bp谱带(谱带3)的确切的序列还没有得到。根据它的大小,它可能含有182bp的插入片段,但是失去了谱带2和谱带4中存在而谱带1中没有的36bp插入片段。
为了检验该转录物存在的假设,设计了一个引物HTM2028F,使得只有当36bp片段丢失时才能进行扩增。利用HTM2028F和HT2026F引物与HT2356R结合的扩增证明,含有182bp片段但是丢失了36bp片段的转录物存在于LIM1215 RNA中(图9,a和b泳道)。相同的上链引物(HTM2028F和HT2026F)与HT2482R引物结合从LIM1215 RNA中扩增了许多产物(图9,c和d泳道),根据PCR产物的直接序列分析其中大部分代表谱带1-4。用HTM2028F和HT2482R引物扩增的一个650bp的片段代表另一个尚未完全表征的、逆转录酶-基元A/逆转录酶基元B区的以其它方式剪接的端粒酶变体。为了表示得更清楚,与Euplotes和酿酒酵母蛋白质匹配最好的蛋白质序列列于图1中作为对照序列。
特别地,至少有7个插入片段或内含子可以在端粒酶RNA中存在或从端粒酶RNA中消失。(1)5’-最远端序列(Y)位于碱基222和223之间。(2)插入序列(X)位于碱基1766-1767之间。测定了一个部分序列并示于图10中。终止密码子存在于所有三个阅读框中。因此,将产生一个没有任何逆转录酶基元的截短的蛋白质。(2)一个序列,在图7中以“1”表示,位于碱基1950-1951之间。这个内含子为38bp(图10),并且似乎存在于ALT和大部分肿瘤系中。该序列的存在增加了13个氨基酸并使阅读框移码,使得终止密码子(TGA)位于阅读框中1973位碱基处。(3)一个序列,在图7中以“α”表示,位于碱基2130和2167之间。该插入序列为36碱基(图10),它的丢失移去了逆转录酶基元“A”但是没有改变阅读框。(4)一个序列,在图7中以“β”表示,位于碱基2286和2469之间。该插入序列为182碱基(图10),并且它的丢失引起阅读框移码并且在逆转录酶基元5中2604位核苷酸出现终止密码子。(5)图7中的序列“2”存在于碱基2823和2824之间。其长度未定;其部分序列列于图10中。该插入片段的存在造成一个截短的端粒酶蛋白质,因为该插入片段的第一个密码子是终止密码子。(6)序列“3”是一个位于碱基3157和3158之间159bp的插入片段(图10)。它的存在形成一个改变了羧基端的端粒酶蛋白质。该插入片段含有一个终止密码子。而且,序列“3”具有一个推测的c-abl的SH3结构域的结合位点(PXXXXPXXP;PEMEPPRRP)。
与Euplotes和酵母的氨基酸相似性最接近的转录物含有序列A和B,而不含有序列C。由mRNA形成包括序列A、B和C的各种组合的八个变体的核苷酸和氨基酸序列列于图8。实施例6人端粒酶的的重组表达人端粒酶被克隆到细菌表达载体中。从两个品种的LIM1215 mRNA中扩增到图1所示的序列,并且将其连接起来。
扩增时,合成cDNA的第一条链并用于含有DNA聚合酶混合物的扩增反应中(Titan系统,Boehringer,IN),这样一个校读热稳定的酶(如rTth)与Taq DNA聚合酶一起使用。因为LIM1215中的许多mRNA缺少序列B(图9),设计扩增引物,使得每对引物的一个引物位于序列B中,位于2271位核苷酸的SacI位点的任何一侧(图1)。用HT2356R和HT0028F首先从cDNA中扩增了5’部分(循环条件70℃2分钟;然后添加平衡至50℃的引物序列;50℃30分钟;95℃2分钟;94℃30秒;65℃30秒2个循环;94℃30秒;63℃30秒;68℃3分钟3个循环;94℃30秒;60℃30秒;68℃3分钟32个循环)。然后端粒酶基因的最远端5’部分连接在用EcoRI/SacI消化的pTTQ18(Amersham Internationalplc,Buckinghamshire,英国)和pBluescriptII KS+上,并且验证了该序列。
为了获得3’端,用HT2230F和HT3292B引物扩增LIM1215cDNA,该cDNA与编码端粒酶最C-端的序列互补。扩增产物用HindIII和SacI消化,插入到pTTQ18和pBluescript II KS+上。5’端和3’端还被一起克隆在pTTQ18的天然SacI位点上作为六组氨酸融合体和非融合体蛋白质。
质粒pTTQ18-Htel被转染到细菌细胞中(如BL21(DE3))。用IPTG诱导可以过量表达蛋白质。离心收集细菌并在裂解缓冲液中裂解(20mMNaPO4,pH7.0,5mM EDTA,5mM EGTA,1mM DTT,0.5μg/ml亮抑蛋白酶肽,1μg/ml抑蛋白酶肽,0.7μg/ml胃蛋白酶抑制剂)。用Polytron匀浆器均匀地悬浮此混合物,经过玻璃珠搅拌或通过微量流体器(microfluidizer)将细胞破碎。将裂解液50,000转/分离心45分钟。用20mMNaPO4,1mM EDTA,pH7.0(缓冲液A)稀释上清液。将稀释后的裂解液上清液上样于SP-琼脂糖柱或与之相当的柱子,使用总计6倍柱体积的缓冲液A和以0至30%线性梯度加入缓冲液A中的缓冲液B(1M NaCl,20mM NaPO4,1mM EDTA,pH7.0)。混合含有端粒酶的级分。可以进行进一步的纯化。
对于六组氨酸融合体蛋白质,离心澄清裂解液,分批吸附到Ni-IDA-琼脂糖柱上。将基质加入柱中并用缓冲液洗柱,一般缓冲液或是50mM TrispH 7.6,1mM DTT;50mM MES pH 7.0,或是IMAC缓冲液(对于六组氨酸融合体)。结合到基质上的端粒酶蛋白质在含NaCl的缓冲液中被洗脱。实施例7人端粒酶RNA组分的重组表达人端粒酶RNA组分首先通过扩增从基因组DNA中分离。扩增引物是telRNA T和telRNA 598B(图5)。扩增条件是95℃3分钟;加聚合酶;80℃2分钟;94℃30秒;68℃2分钟35个循环。
用hTR TAC(具有tac启动子序列)和hTR 3′Pst(具有顺式作用核酶序列)引物进行另一个扩增后,将扩增产物插入到pBluescript中。然后分离pBluescript插入片段并连接到pACYC177。实施例8人端粒酶亚区的表达人端粒酶的逆转录酶结构域是通过与莫洛尼鼠类白血病病毒(Moloney MuLV)逆转录酶进行序列比较确定的。莫洛尼鼠类白血病病毒的手指/手掌区形成一个结晶稳定单元(Georgiadis等人,结构(Structure)3879,1995)。许多残基和基元保留在两个蛋白质的活性位点上。设计引物扩增逆转录酶结构域和手指/手掌结构域,插入到表达载体中并分离蛋白质。
片段号 引物 氨基酸I BT-177/BT-178AAEH...→...VQMPAHII BT-177/BT-179AAEH...→...VGLGLIIIBT-182/BT-179RATS...→...VGLGLIV BT-183/BT-179VQMPAH...→...VGLGL片段I编码相应于莫洛尼鼠类白血病病毒的“手指和手掌”结构域。C-末端的“拇指”区和“连接”区(参考Kohlstaedt等人,科学2561783,1992)被删除了。片段II编码端粒酶的逆转录酶结构域,以及C-末端的“连接”区结构域。N-末端是通过与莫洛尼鼠类白血病病毒逆转录酶结构比较大小而选出的。片段III编码蛋白质的C-末端。RATS序列位于蛋白质的逆转录酶结构域(手掌区)内。片段IV编码含有“拇指”和“连接”结构域的C-末端区并且可能起调节元件的作用。HIV-1中的连接结构域在没有RNase结构域时能够填塞HIV逆转录酶的催化裂缝(Kohlstaedt等人,同上)。C-末端区可能以一种类似的方式起调节(抑制)片段的作用。而且序列C具有一个推测的SH3结构域结合位点c-abl(PXXXXPXXP;PEMEPPRRP,参考图8的变体2序列)。c-abl蛋白质直接与ATM(共济失调毛细血管扩张)蛋白质相互作用(Shafman等人,自然389520,1997),ATM蛋白质是一种明显参与细胞周期调控、减数分裂重组、端粒长度监测和DNA损伤应答的蛋白质。c-abl蛋白质的结合可以通过标准的蛋白质-蛋白质相互作用方法加以测定。这样,端粒酶与c-abl或其它含有SH3结构域的蛋白质(如erb2)的相互作用,以及通过端粒酶C-末端在催化裂缝内或裂缝外的运动进行的调节是可以用此处描述的构件和产物进行控制的。在一种情况下,这种调节可以是通过磷酸化/去磷酸化反应介导的。
所有的引物都具有HinIII或BamHI位点。扩增反应是在1×Pfu缓冲液、250μM dNTP、100ng各种引物、克隆53.2模板DNA中进行的,循环条件如下94℃2分钟;55℃、60℃或65℃2分钟、72℃2分钟、94℃1分钟25个循环;然后72℃10分钟。获得了预期长度的产物(BT-177/BT-178 966bp;BT-177/BT-179 1479bp;BT-182/BT-179 824bp;BT-183/BT-179 529bp)。用酚氯仿抽提扩增产物并用乙醇沉淀。重悬扩增产物并用在引物序列内有切点的合适的酶消化。
被消化的产物连接到经酶消化产生合适末端的pBluescript上,将插入片段用HindIII消化并用BamHI部分消化以连接到pGEX上。质粒转染BL21(DE3)细胞并在氨苄青霉素平板上选择。挑取克隆并在液体培养液中生长过夜。取一份培养液在加100μg/ml氨苄青霉素的Terrific液中稀释。细胞在37℃下生长并用0.5mM IPTG诱导至O.D值约为0.8。继续生长5个小时。离心收集细胞并立即处理或冷冻在-70℃备用。
从裂解细胞中纯化蛋白质。细胞菌体在50mM Tris pH 8.0,10mM 2-ME,1mg/ml溶菌酶,0.5%Triton X-100,1μg/ml胃蛋白酶抑制剂,10μg/ml亮抑蛋白酶肽,10μg/ml抑蛋白酶肽,0.5mM PMSE,和2mMEDTA中振荡混合,冻融一次使之裂解。将裂解液离心澄清。将上清液加入到50%GSH-琼脂糖浆液中,在4℃下搅拌2小时。将基质用裂解缓冲液和50mM Tris pH8.0,10mM 2-ME洗两次。为了通过SDS-PAGE凝胶电泳进行分析,加入含150mM 2-ME的样品缓冲液并将样品煮沸。实施例9鼠端粒酶基因的分离鼠端粒酶基因是从基因组文库或cDNA文库中分离的。鼠基因组文库是用细胞株129 DNA在λFIX II载体上构建的。将文库涂平板,把噬菌斑挑到尼龙膜上。尼龙膜用克隆53.1(1.9kb)的插入片段在正常严谨条件下进行杂交。选出六个杂交斑点以作进一步的分析。实施例10用HT-1和端粒酶变体说明端粒酶的活性将全长的hT-1序列克隆至一表达载体,分析产生的蛋白质的端粒酶活性。载体pRc/CMV2(Invitrogen,Carlsbad,CA)是一个真核表达载体,在启动子RSV LTR之间具有多克隆位点,以及聚腺苷酸化信号和来自牛生长激素基因的转录终止序列。将亮氨酸49密码子转变成甲硫氨酸密码子的端粒酶序列插入到pRc/CMV2中。从中选择一个克隆phTC51进行进一步研究。测定了5’连接处的DNA序列并确定了插入片段的方向。随后,测定了3’连接处的序列并且显示缺失了polyA信号,但是没有缺失端粒酶编码序列。
将该克隆转染至第44代和第68代HeLa GM847细胞,第18代SUSM-1细胞,和第40代RKF-T/A6细胞。通过此处描述的TRAP分析法分析细胞提取物的端粒酶活性。如图12中所示,以1∶100稀释的SUSM-1细胞的提取物中,可以看到指示端粒酶活性的产物梯,而在对照细胞中没有看到。在高浓度的提取物中不容易检测到产物带,可能是由于提取物中的核酸酶活性的缘故。
构建了三个端粒酶变体pAKI.4是β区被剪接出的端粒酶(图13);pAKI.7是C-端插入片段3被改变的端粒酶(图14);而pAKI.14是α区被剪接出的端粒酶(图15)。端粒酶基因的5’端分别插入至这三个载体中并将插入片段转移至pCIneo表达载体中。这些变体,以及pCIneo中的对照端粒酶被瞬时转染至GM847细胞中,GM847细胞中没有可检测到的端粒酶活性但是表达RNA亚单位。用TRAP法检测细胞提取物。对照端粒酶表现出活性,具有插入片段3(pAKI.7插入)的端粒酶也有活性,而其它的变体不表达活性。
从前面可以看出,尽管为了进行说明已经在此描述了本发明的几个特殊的实施例,但是可以在不背离本发明的精神和范围的前提下进行各种修正。因此,除了附加的权利要求以外,本发明没有加以限制。
权利要求
1.一种分离的编码脊椎动物端粒酶的核酸分子。
2.权利要求1的分离的核酸分子,其中所说的脊椎动物是人。
3.权利要求1的核酸分子,其中的核酸分子包含图1中所示的序列,或者在正常严谨条件下可与图1中所示序列的互补序列杂交的序列,前提是该核酸分子不是EST AA281296。
4.权利要求1的核酸分子,其中的核酸分子编码图1或11中所示的氨基酸序列或其变体。
5.一种分离的编码图11中所示的任何一个氨基酸序列的核酸分子,或者在正常严谨条件下可与编码图11所示氨基酸序列的互补序列杂交的核酸分子,前提是该核酸分子不是EST AA281296。
6.一种分离的含有图10中所示的任何一个序列的核酸分子,或者在正常严谨条件下可与图10所示序列的互补序列杂交的核酸分子。
7.一种寡核苷酸,它含有图1中所示序列的10至100个连续核苷酸或其互补序列。
8.一种寡核苷酸,它含有图10中所示序列的10至100个连续核苷酸或其互补序列。
9.权利要求7或8的寡核苷酸,其中的寡核苷酸被标记。
10.权利要求9的寡核苷酸,其中的标记是一种放射性标记、化学发光标记或生物素标记。
11.一种表达载体,它含有一个与权利要求1-6的任一核酸分子有效连接的异源启动子。
12.权利要求11的表达载体,其中的载体选自细菌载体、逆转录病毒载体、腺病毒载体和酵母载体。
13.一种含有权利要求11或12的载体的宿主细胞。
14.权利要求13的宿主细胞,其中的细胞选自人细胞、猴子细胞、小鼠细胞、大鼠细胞、酵母细胞和细菌细胞。
15.权利要求13的宿主细胞,其中的细胞是人细胞。
16.一种分离的含有脊椎动物端粒酶蛋白质的蛋白质。
17.权利要求16的蛋白质,其中的脊椎动物是人。
18.权利要求16的蛋白质,其中的蛋白质含有图1或11中所示的氨基酸序列或其变体。
19.脊椎动物端粒酶蛋白质的一部分。
20.权利要求19的部分蛋白质,其中该部分蛋白质的氨基酸序列示于图1中。
21.权利要求19的部分蛋白质,其中该部分蛋白质的氨基酸序列示于图11中。
22.权利要求19的部分蛋白质,其中该部分蛋白质为10至100个氨基酸长。
23.一种可与权利要求16或19的蛋白质特异结合的抗体。
24.一种可与由选自1区、α区、β区、2区和3区的序列编码的多肽特异结合的抗体。
25.权利要求24的抗体,其中的抗体为单克隆抗体。
26.一种产生权利要求14的抗体的杂交瘤。
27.一种在正常严谨条件下能够与编码脊椎动物端粒酶特异性杂交的核酸探针,前提是该探针不与图1中所示的1624-2012位核苷酸杂交。
28.权利要求27的探针,其中的探针为12至200个核苷酸长。
29.权利要求27的探针,其中的探针为20至50个核苷酸长。
30.权利要求17的探针,其中的核酸分子具有图1中所示的序列或其互补序列。
31.权利要求17的探针,其中的核酸分子被标记。
32.一对能够特异扩增编码人端粒酶的核酸分子的全部或部分的寡核苷酸引物。
33.权利要求32的引物,其中的核酸分子含有图1中所示的序列或其互补序列。
34.权利要求32的引物,其中的核酸分子含有图11中所示的任何一个序列或其互补序列。
35.权利要求32的引物,其中的引物对能够特异地扩增包括1区、α区、β区、2区、3区、X区或Y区的全部或部分的序列。
36.权利要求35的引物,其中的引物位于图1中所示的222、1950、2131-2166、2287-2468、2843、或3157位核苷酸的侧翼。
37.权利要求36的引物,其中引物对中只有一个引物位于图1中所示的222、1950、2131-2166、2287-2468、2843、或3157位核苷酸的侧翼,而引物对中的另一个引物具有相应于图10中所示的序列之一的序列或其互补序列。
38.一对能够特异扩增图10中所示的基因组序列的寡核苷酸引物,其中的引物扩增至少1至38位核苷酸。
39.一种可与1区、α区、β区、2区、3区、X区或Y区的核酸序列特异杂交的寡核苷酸。
40.权利要求39的寡核苷酸,其中的寡核苷酸为15至36个碱基。
41.一种诊断患者癌症的方法,包括制备肿瘤cDNA,利用特异扩增人端粒酶核酸序列的引物扩增肿瘤cDNA,其中端粒酶核酸序列的检测是癌症诊断的指征。
42.权利要求41的方法,进一步包括比较端粒酶序列与对照的扩增量,其中端粒酶核酸序列比对照量的增加是癌症诊断的指征。
43.权利要求41的方法,其中的引物跨越1区、α区、β区、2区、3区、X区或Y区,其中扩增的模式是癌症诊断的指征。
44.权利要求43的方法,其中的引物为Htel内含子T和Htel 723B。
45.权利要求44的方法,其中的引物为Htel335T和Htel1022B。
46.一种确定细胞中端粒酶RNA表达模式的方法,包括从分离自细胞中的mRNA制备cDNA,利用权利要求35的引物扩增cDNA,由此确定端粒酶RNA表达的模式。
47.权利要求46的方法,进一步包括通过与具有1区、α区、β区、2区、3区、X区或Y区序列的全部或部分的寡核苷酸杂交,检测扩增产物。
48.一种诊断患者癌症的方法,包括确定端粒酶RNA表达的模式,包括从由肿瘤RNA合成的cDNA扩增端粒酶,并通过与具有1区、α区、β区、2区、3区、X区或Y区序列的全部或部分的寡核苷酸杂交检测扩增产物,由此确定端粒酶RNA表达的模式,其中表达模式是癌症诊断的指征。
49.权利要求48的方法,进一步包括将表达模式与从对照癌症所得的表达模式相比较。
50.一种非人类转基因动物,其细胞中含有脊椎动物端粒酶基因,该基因与能够使该基因表达的启动子有效地连接。
51.权利要求50的动物,其中的动物是小鼠。
52.权利要求50的动物,其中的启动子是组织特异性的。
53.权利要求50的动物,其中的端粒酶基因是图11中所示的任何一个核酸序列。
54.一种小鼠,其细胞中具有通过与非功能性端粒酶基因进行同源重组而被破坏的内源性端粒酶基因,其中的小鼠不能表达内源性端粒酶。
55.一种脊椎动物端粒酶活性抑制剂,其中的抑制剂可与端粒酶结合但不是核苷类似物。
56.权利要求55的抑制剂,其中的脊椎动物是人。
57.权利要求55的抑制剂,其中的抑制剂是与人端粒酶mRNA互补的反义核酸。
58.权利要求57的抑制剂,其中的反义核酸与α区、β区、2区、3区、或X区互补。
59.权利要求55的抑制剂,其中的抑制剂是核酶。
60.一种治疗癌症的方法,包括给患者施用治疗有效量的权利要求55的抑制剂。
61.一种核酸分子,其含有由选自图10中所示的1区、α区、β区、2区或3区的序列构成的序列及其变体。
62.一种鉴定端粒酶活性效应物的方法,包括(a)向端粒酶蛋白质、RNA组分和模板混合物中加入候选效应物,其中的端粒酶蛋白质由分离的权利要求1的核酸分子编码;(b)检测端粒酶活性;和(c)比较步骤(b)的活性与没有候选效应物的对照混合物的活性,由此鉴定效应物。
63.权利要求62的方法,其中的效应物是抑制剂。
64.权利要求62的方法,其中的核酸分子编码人端粒酶。
全文摘要
本发明提供了编码脊椎动物端粒酶的核酸分子。还提供了基因产物、表达载体和适于表达端粒酶的宿主细胞。公开了鉴定端粒酶活性抑制剂的方法和抑制剂组合物。
文档编号C12N15/54GK1270634SQ98808383
公开日2000年10月18日 申请日期1998年7月1日 优先权日1997年7月1日
发明者A·奇利安, D·鲍泰尔 申请人:卡姆比亚生物系统有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1