前列腺癌中的复发基因融合的制作方法

文档序号:432857阅读:326来源:国知局
专利名称:前列腺癌中的复发基因融合的制作方法
技术领域
本发明涉及用于癌症诊断、研究和治疗的组合物和方法,包括但 不限于癌症标记。更具体地,本发明涉及用作前列腺癌的诊断标记和 临床靶物的复发基因融合。
背景技术
癌症研究的一个中心目标是,识别改变的原因性地参与肿瘤生成 的基因。已经识别出几类体细胞突变,包括碱基置换、插入、缺失、 易位和染色体增加和减少,它们都会导致癌基因或肺瘤抑制基因活性 的改变。在二十世纪早期首次假设,现在有确凿证据表明,染色体重 排在癌症中的成因作用(Rowley, Nat Rev Cancer 1: 245 (2001))。 认为复发的染色体畸变是白血病、淋巴瘤和肉瘤的基本特征。上皮肿 瘤(癌)是更常见的,且会促成相对大部分的与人癌症有关的发病率和 死亡率,它包含小于1。/。的已知疾病特异性染色体重排(MUelman, Mutat Res 462: 247 (2000))。尽管血液恶性胂瘤经常表征为平衡的、 疾病特异性的染色体重排,大多数实体瘤具有非特异性染色体畸变的 多血症。认为实体瘤的染色体组型的复杂性是由于通过癌症进化或进
展获得的二级改变。
已经描述了染色体重排的2个基本机理。在一个机理中, 一个基 因的启动子/增强子元件重排在原癌基因附近,从而造成致癌蛋白表达 的改变。这类易位的实例是,免疫球蛋白(IG)和T-细胞受体(TCR)基 因向MYC的添附,这分别导致B-和T-细胞恶性肿瘤中该癌基因的激活 (Rabbitts, Nature 372: 143 (1994))。在第二个机理中,重排会导 致2个基因的融合,这产生融合蛋白,其可能具有新的功能或改变的 活性。该易位的原型实例是慢性髓细胞性白血病(CML)中的BCR-ABL 基因融合(Rowley, Nature 243: 290 (1973); deKlein等,Nature 300: 765 (1982))。重要的是,该发现导致曱磺酸伊马替尼(Gleevec)的合理 开发,该药物成功地把向BCR-ABL激酶(Deininger等,Blood 105: 2640(2005))。因而,识别普通上皮肿瘤中的复发基因重排,可能对癌 症药物开发工作以及患者治疗具有深远的影响。

发明内容
本发明提供了,但不限于,诊断患者的前列腺癌的方法,其包含 提供来自患者的样品;和,检测样品中是否存在具有来自雄激素调节 基因(ARG)的转录调节区的5'部分和来自ETS家族成员基因的3'部分 的基因融合,其中所述基因融合在样品中的存在是患者中前列腺癌的 指标。所述ARG可以是TMPRSS2或PSA。所述ETS家族成员基因可以 是ERG, ETV1(ER81), FLIl, ETS1, ETS2, ELK1, ETV6(TEL1), ETV7(TEL2), GABP ot , ELF1, ETV4(E1AF; PEA3) , ETV5 (ERM) , ERF, PEA3/E1AF, PU.1, ESE1/ESX, SAP1(ELK4), ETV3 (METS), EWS/FLI1, ESE1, ESE2(ELF5), ESE3, PDEF, NET(ELK3; SAP2) , NERF(ELF2),或 FEV。 ARG的转录调节区可以包含ARG的启动子区。ARG的启动子区还 可以包含ARG的雄激素反应元件(ARE)。
检测样品中是否存在基因融合,可以包括检测具有来自ARG的转 录调节区的5'部分和来自ETS家族成员基因的3'部分的基因组DNA 的染色体重排。许多技术可以用于检测基因组DNA的染色体重排,包
括核酸测序、核酸杂交、和核酸扩增。核酸杂交技术包括原位杂交
(ISH)、微阵列和DNA印迹。核酸扩增技术包括聚合酶链式反应(PCR)、 反转录聚合酶链式反应(RT-PCR)、转录介导的扩增(TMA)、连接酶链反 应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。
检测样品中是否存在基因融合,可以备选地包括检测具有来自ARG 的转录调节区的5'部分和来自ETS家族成员基因的3'部分的嵌合 mRNA转录物。许多技术可以用于检测嵌合mRNA,包括核酸测序、核酸 杂交和核酸扩增。核酸杂交技术包括原位杂交(ISH)(例如,荧光原位 杂交(FISH))、微阵列和RNA印迹。核酸扩增技术包括聚合酶链式反应 (PCR)、反转录聚合酶链式反应(RT-PCR)、转录介导的扩增(TMA)、连 接酶链反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。
检测样品中是否存在基因融合,还可以备选地包括检测由ARG的 转录调节区与ETS家族成员基因融合产生的氨基端截短的ETS家族成 员蛋白,或检测具有来自ARG的转录调节区的氨基端部分和来自ETS 家族成员基因的羧基端部分的嵌合蛋白。许多技术可以用于检测所述 截短的ETS家族成员蛋白或嵌合蛋白蛋白测序;和,免疫测定。免 疫测定技术包括免疫沉淀、蛋白印迹、ELISA、免疫组织化学、免疫细 胞化学、流式细胞术和免疫-PCR。
本发明还提供了,但不限于,用于诊断患者的前列腺癌的组合物 和试剂盒。所述组合物和试剂盒可以包含 一个单独的标记的探针, 其包含会与来自ARG的转录调节区的5'部分和来自ETS家族成员基因 的3'部分之间的融合接头杂交的序列; 一对标记的探针,其中第一个. 标记的探针包含会与ARG的转录调节区杂交的序列,笫二个标记的探 针包含会与ETS家族成员基因杂交的序列; 一对扩增寡核苷酸,其中 第一个扩增寡核苷酸包含会与ARG的转录调节区杂交的序列,第二个 扩增寡核普酸包含会与ETS家族成员基因杂交的序列;由ARG的转录 调节区与ETS家族成员基因融合产生的氨基端截短的ETS家族成员蛋 白的抗体;或具有来自ARG的转录调节区的氨基端部分和来自ETS家 族成员基因的羧基端部分的嵌合蛋白的抗体。
本发明也提供了,但不限于,治疗患者的前列腺癌的方法,其包
含给患者施用一种试剂,所述试剂会抑制具有来自雄激素调节基因 (ARG)的转录调节区的5'部分和来自ETS家族成员基因的3'部分的基 因融合的至少一种生物活性。所述ARG可以是TMPRSS2或PSA。所述 ETS家族成员基因可以是ERG, ETV1(ER81), FLIl, ETS1, ETS2, ELK1, ETV6(TEL1), ETV7(TEL2), GABP ot , ELF1 , ETV4(E1AF; PEA3), ETV5(ERM) , ERF, PEA3/E1AF , PU. 1 , ESE1/ESX , SAP1 (ELK4), ETV3(METS), EWS/FLI1, ESE1, ESE2 (ELF5), ESE3, PDEF, NET(ELK3; SAP2), NERF(ELF2)和FEV。 ARG的转录调节区可以包含ARG的启动子 区。ARG的启动子区还可以包含ARG的雄激素反应元件(ARE)。所述试 剂可以是小分子,siRNA,反义核酸,或抗体。
在下面的描述和实施例中,提供了本发明的其它实施方案。


图1显示了微阵列数据的癌症异常值分析(C0PA)。 (A)显示了来自 2个大规模基因表达研究中的所有测试样品的ETV1 (左图)和ERG (中图) 表达(标准化的表达单位)。(B)除了使用来自激光捕获显微切割样品的 数据以夕卜,同(A)。 (C)除了检查多发性骨髓瘤中癌基因(FGFR3和CCND1) 向免疫球蛋白重链启动子(IgH)的已知易位以外,同(A)。
图2显示了前列腺癌(PCA)中TMPRSS2: ETV1和TMPRSS2: ERG基因 融合的识别和表征。(A)通过定量PCR(QPCR),分析了前列腺癌细胞系 (DuCaP、 LnCaP和VCaP)和激素抗性的转移性(MET)前列腺癌组织的 ERG(園)和ETVl(口)mRNA表达。(B)与LNCaP细胞相比,MET26中ETV1 外显子2和3的过表达的丧失。(C)MET26-LN中的ETV1和MET28-LN 中的ERG的5'RNA连接酶介导的快速扩增cDNA末端(RLM-RACE)结果示 意图,揭示了与TMPRSS2的基因融合。(D)使用MET26-LN和MET26-RP 中的易位特异性QPCR,验证TMPRSS2: ETV1表达。(E)使用细胞系和 PCA样本中的易位特异性QPCR,验证TMPRSS2: ERG表达。
图3显示了福尔马林固定化的、石蜡包埋的组织切片上的分裂间
期荧光原位杂交(FISH),它证实了 TMPRSS2: ETV1基因融合和ERG基因 重排。(A和B)显示了双色融合-信号方案,以检测TMPRSS2(绿色信号) 和ETV1(红色信号)的融合。(C和D)使用双色分裂-信号方案,用2个 跨ERG的(绿色信号)和3'(红色信号)区域的探针,检测ERG基因重 排。(E)使用与(A-D)相同的探针, 一个独立组织微阵列的FISH结果的 矩阵表示,所述独立组织微阵列含有来自13例临床上局限性前列腺癌 (PCA)和16例转移性前列腺癌(MET)的核心(core )。
图4显示了携带TMPRSS2:ERG易位的前列腺癌细胞中ERG的雄激 素调节。
图5显示了癌症异常值分析(COPA)。图5A显示了 C0PA分析的示 意图。图5B表明,RUNX1T1(ET0)在90%的Valk等急性骨髓性白血病 数据集(n = 293)中具有最高评分异常值。
图6显示了 MET26-LN中的ETV1和PCA4中的ERG的RNA连接酶介 导的快速扩增cDNA末端(RLM-RACE)结果示意图,揭示了与TMPRSS2 的基因融合(TMPRSS2: ERGb融合)。
图7显示了前列腺癌中ETS家族成员的过表达。使用0ncomine, 观察了来自粗切割的组织(A)或通过激光捕获显微切割分离的组织(B) 的良性前列腺、前列腺上皮内瘤形成(PIN)、临床上局限性前列腺癌和 转移性前列腺癌中的所有监视的ETS家族成员的表达。
图8显示了过表达ETV4的前列腺癌病例中TMPRSS2和ETV4基因 座的过表达。A.在混合的良性前列腺组织(CPP)、不过表达ETV4且是 TMPRSS2: ERG阳性的(PCA1-2)或阴性的(PCA3-4)的前列腺癌和来自我 们的ETV4过表达LCM组的前列腺癌病例(PCA5)中,ETV4的指定外显 子或区域的表达。B. RLM-RACE揭示了 PCA5中在TMPRSS2上游的序列 与ETV4的融合。C.通过QPCR, TMPRSS2:ETV4a和TMPRSS2:ETV4b在 PCA5中的表达。D.福尔马林固定化的、石蜡包埋的组织上的分裂间 期荧光原位杂交证实了 PCA5中TMPRSS2和ETV4基因座的融合。
图9显示了示例性的ETS家族基因的QiRNA序列。
图IO显示了 TMPRSS2的mRNA序列。
图11显示了通过FISH进行的TMPRSS2:ERG基因融合分析。图A: 该染色体模式图描述了用于间接检测TMPRSS2:ERG融合的断裂试验。 图B:基质细胞(左)和前列腺癌腺(右)的分裂间期细胞核。图C:显示 通过末端着丝粒探针的丟失指示的断裂和同时删除的前列腺癌腺的分 裂间期细胞核(100x油浸物镜放大)。图D. C中画框区的放大图,它 显示出2个具有末端着丝粒探针的断裂和丟失的细胞核(60x油浸物 镜放大)。
图12显示了染色体21上在ERG和TMPRSS2之间的基因组缺失。 图A:通过qPCR和/或通过FISH,表征了样品(包括6个细胞系,13 个异种移植物和11转移性PCA样品)的TMPRSS2: ERG和TMPRSS2: ETV1 状态(灰色条代表阴性,蓝色条代表阳性状态)。图B: A中绿色框盒的 放大。图C: A中黑色框盒的放大。
图13显示了临床上局限性前列腺癌中的TMPRSS2: ERG重排和与病 理学参数的关联。图A.在49. 2。/。的原发性PCA样品和41.2。/。的激素 原初转移性LN样品中,鉴别出TMPRSS2:ERG重排。图B.具有缺失的 TMPRSS2:ERG重排肿瘤倾向于在更高百分比的具有晚期肿瘤的PCA病 例中发现(P= 0. 03)。
图14显示了位于21q22-23的ERG(着丝粒的)和TMPRSS2(末端着 丝粒的)之间的已知基因。在黑线上面的基因的方向是5'-着丝粒至 3'-末端着丝粒,在黑线下面的基因的方向是5'-末端着丝粒至3'-着 丝粒。在图像的下半部分,用FISH探针描述了 ERG基因座的放大。
图15显示了主要显示具有缺失的TMPRSS2: ERG重排的'异源'前列 腺癌病例(细胞核在右侧)和显示没有缺失的TMPRSS2:ERG重排的仅小 部分(细胞核在左侧)。
图16显示了跨8个公开的表达阵列数据集,位于TMPRSS2和ERG 之间的基因的荟萃分析(meta-analysis)。
图17表明,FISH试验会检测出与TMPRSS2:ERG基因融合有关的 特征缺失,所述TMPRSS2:ERG基因融合与疾病进展有关。图A和B: 为了分析染色体21q22.2上的ERG重排,应用了断裂探针系统,它由
生物素-14-dCTP标记的BAC克隆RP11-24A11 (最终缀合以产生红色信 号)和异羟洋地黄毒苷配基-dUTP标记的BAC克隆RP11-137J13 (最终缀 合以产生绿色信号)组成,二者分别跨ERG基因座的邻近着丝粒区域和 末端着丝粒区域。使用该断裂探针系统,没有ERG重排的细胞核表现 出2对并列的红色和绿色信号。并列的红色-绿色信号形成黄色融合信 号(图B,箭头)。图C:在累积发生率回归模型中,将TMPRSS2:ERG
评价为累积发生率或转移或前列腺癌-特异性死亡的决定因素。 图18显示了没有融合转录物的FLI1过表达。 图19显示了雄激素对TMPRSS2- ERG+细胞中ERG蛋白表达的诱导。
图20显示了内源和融合ERG多肽的示意图。 图21显示了 ERG2的细胞核相互作用因子。 图22显示了肽抗体的序列和针对ERG1的aqua探针产生。 图23显示了肽抗体的序列和针对ETV1的aqua探针产生。 图24显示了肽抗体的序列和针对FLI1的aqua探针产生。 图25显示了肽抗体的序列和针对ETV4的aqua探针产生。 图26显示了 LNCaP前列腺癌细胞系中ETV1的过表达和雄激素调 节。图26A显示了雄激素-调节的基因在VCaP和LNCaP前列腺癌细胞 系中的表达标记。图26B显示了通过定量PCR(QPCR)证实的VCaP和 LNCaP细胞中雄激素对PSA的诱导。图26C显示了 LNCaP细胞中雄激 素对ETV1的诱导。图26D表明,ETVl在LNCaP细胞中显著过表达。
图27显示了 LNCaP细胞中ETV1的重排。图27 A显示了用作荧光 原位杂交(FISH)的探针的BAC的示意图。图27B表明,RP11-12札22 和RP11-1149J13共同定位于正常周边淋巴细胞(NPL)的染色体7上。 图27C显示了 BAC并1和BAC #4在分裂中期分布上的定位(上图),并 在接近四倍体的LNCaP细胞系中测定了分裂间期细胞(下图)。图27D 表明,来自RP11-12札22的信号在LNCaP细胞中定位于染色体14。
图28表明,整个ETVl基因座插入在LNCaP细胞的染色体14中。 图28 A显示了在该实验中使用的BAC的示意图。图28B显示了 RP11-12札22(BAC #1)和RP11-313C20(BAC #2)在分裂中期分布上的定 位(上图),并通过FISH在LNCaP细胞系中测定了分裂间期细胞(下图)。
图29显示了 LnCaP中ETV1的siRNA抑制。
图30显示了 VCAP中ERG的siRNA抑制。
图31显示了病毒过表达系统。
图32显示了转基因小鼠的示意图。
图33显示了尿中ERG和ETV1转录物的检测。图33 A显示了 LNCaP(高ETV1表达)或VCaP(高ERG和TMPRSS2: ERG表达)前列腺癌 细胞中ERG和ETV1的检测。图33B显示了被怀疑患有前列腺癌的患者 的尿中ERG和ETV1的检测。
图34显示了用于检测前列腺癌中的TMPRSS2: ETS基因融合的测定 法。图34A显示了 TMPRSS2和ERG的断裂测定法。在左图中显示了 ERG 重排阳性的病例(没有缺失),如一对分裂5'和3'信号所指示的。在 右图中显示了 TMPRSS2重排阳性的病例(有缺失),如一个3'信号缺失 所指示的。图34B显示了 TMPRSS2:ETV1基因融合的融合测定。图34C 显示了 ETV4的断裂测定。
图35显示了通过FISH检测到的TMPRSS2、 ERG、 ETV1和ETV4重 排。图35A显示了通过图34所示的测定法测得的TMPRSS2、 ERG、 ETV1 和ETV4中的重排的结果表。图34B显示了来自38个病例的TMPRSS2、 ERG、 ETV1和ETV4状态的热图(heat map)表示,其中所有4个测定 法象A所述一样有价值。图34C显示了具有不一致的TMPRSS2和ETS 重排状态的病例的热图表示。
图36显示了本发明的基因融合的序列。
图37显示了 FLI-1表达分析的引物和探针。
定义
为有助于理解本发明,下面定义许多术语和短语 如本文所使用的,术语"基因融合"指嵌合基因组DNA,嵌合信使 RNA,截短的蛋白或由第一个基因的至少一部分与第二个基因的至少一
部分融合产生的嵌合蛋白。基因融合不一定包括整个基因或基因的外 显子。
如本文所使用的,术语"转录调节区"指基因的非编码上游调节
序列,也称作5'不翻译区(5'UTR)。
如本文所使用的,术语"雄激素调节基因"指其表达会被雄激素(例 如,睾酮)启动或增强的基因或基因的一部分。雄激素调节基因的启动 子区可以含有与雄激素或雄激素信号传递分子(例如,下游信号传递分 子)相互作用的"雄激素反应元件"。
如本文所使用的,术语"检测"可以描述发现或辨别的一般行为, 或可检测地标记的组合物的特异性观察。
如本文所使用的,术语"抑制基因融合的至少一种生物活性"指, 任意试剂通过直接接触基因融合蛋白、接触基因融合mRNA或基因组 DNA、造成基因融合多肽的构象变化、降低基因融合蛋白水平、或干扰 与信号传递伴侣的基因融合相互作用、和影响基因融合乾基因的表达, 降低本发明的基因融合的任意活性(例如,包括但不限于本文所述活 性)。抑制剂也包括通过阻断上游信号传递分子来间接调节基因融合生 物活性的分子。
如本文所使用的,术语"siRNA,,是指短干扰RNA。在有些实施方 案中,siRNA包含大约18-25个核苷酸长的双螺旋或双链区域;通常 siRNA在各链的3'末端包含大约2至4个未配对的核苷酸。siRNA的 双螺旋或双链区域的至少 一条链与靶RNA分子基本上同源或基本上互 补。与靶RNA分子互补的链是"反义链";与所述乾RNA分子同源的 链是"有义链,,,并且也与siRM反义链互补。siRNA也可包含额外 的序列;这类序列的非限定性示例包括连接序列或环以及茎和其它折 叠结构。siRNA似乎在无脊推或脊推动物中在引发RNA干涉中和在植 物的转录后基因沉默过程中引发序列特异性RNA降解中发挥至关重要 的中间物的作用。
术语"RNA干扰"或"RNAi"是指通过siRNAs沉默或减少基因表 达。在动物和植物中,其是由siRNA启动的序列特异性、转录后基因沉默的过程,所述siRNA在其双螺旋区域与被沉默的基因序列同源。 所述基因对生物体来说可以是内源的或外源的,以整合入染色体内的 形式存在或存在于未整合入基因组内的感染性栽体中。所述基因的表 达被完全或部分地抑制。也可考虑用RNAi来抑制靶RNA的功能;耙 RNA的功能可以是完全的或部分的。
如本文所使用的,术语"癌症阶段,,指癌症进展水平的定性或定 量判断。用于确定癌症阶段的标准包括但不限于肿瘤的大小和转移的 范围(例如,局部或远处)。
如本文所使用的,术语"基因输送系统"指将包含核酸序列的组 合物输送给细胞或组织的任意工具。例如,基因输送系统包括但不限 于载体(例如,逆转录病毒输送系统、腺病毒输送系统、腺相关病毒输 送系统和其它基于核酸的输送系统),棵核酸的显微注射,基于聚合物 的输送系统(例如,基于脂质体的系统和基于金属颗粒的系统), biolistic注射,等。如本文所使用的,术语"病毒基因输送系统"指, 包含用于促进样品向目标细胞或组织的输送的病毒元件(例如,完整病 毒,改变的病毒和病毒组分例如核酸或蛋白)的基因输送系统。如本文 所使用的,术语"腺病毒基因输送系统,,指,包含属于腺病毒科家族 的完整或改变的病毒的基因输送系统。
如本文所使用的,术语"位点特异性的重组乾序列"指,提供重组 因子和重组发生位置的识别序列的核酸序列,
如本文所使用的,术语"核酸分子"指任意含有核酸的分子,包 括但不限于DNA或RNA。该术语包括含有DNA和RNA的任意已知碱基 类似物的序列,所述碱基类似物包括但不限于4-乙酰胞嘧啶、8-羟基 -N6-甲基腺苷、吖丙咬基胞嘧啶、假异胞嘧啶、5-(羧基羟基甲基)尿 嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、5-羧基曱基氨基甲基-2-疏尿嘧啶、 5-羧基甲基氨基甲基尿嘧啶、二氢尿嘧啶、次黄嘌呤核苷、N6-异戊烯 基腺嘌呤、1-曱基腺噤呤、1-甲基假尿嘧咬、1-甲基鸟噪呤、1-甲基 次黄嗜呤核苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、 3-甲基胞嘧啶、5-甲基胞嘧啶、N6-曱基腺嘌呤、7-甲基鸟嘌呤、5- 曱基氨基甲基尿嘧啶、5-曱氧基氨基甲基-2-硫尿嘧啶、P -D-mannosylqueosine、 5'-甲氧基羰基甲基尿嗜咬、5-曱氧基尿嘧咬、 2-曱基硫-N6-异戊烯基腺嘌呤、尿嘧啶-5-氧乙酸曱基酯、尿嘧啶-5-氧乙酸、oxybutoxosine、假尿嗜咬、queosine、 2-硫胞嘧咬、5-甲基 -2-硫尿嘧咬、2-硫尿嘧咬、4-硫尿嘧啶、5-甲基尿嘧啶、N-尿嘧咬-5-氧乙酸甲基酯、尿嘧啶-5-氧乙酸、假尿嘧啶、queosine、 2-石克胞嗜咬 和2, 6-二氨基嘌呤。
术语"基因"是指包含用于产生多肽、前体或RNA(例如,rRNA、 tRNA)所必需的编码序列的核酸(例如,DNA)序列。多肽可由全长编 码序列或所述编码序列的任何部分编码,只要全长或片段的想要的活 性或功能特征(例如,酶活性、配体结合性、信号传导、免疫原性等) 得以保留。所述术语也包括结构基因的编码区和与编码区5'和3'两个 末端相邻的序列,所述序列距离任一端大约为lkb或更长,这样所述 基因就相应于全长mRNA的长度。位于编码区5'并存在于mRNA上的序 列被称作5'非翻译序列。位于3'或编码区下游并存在于mRNA上的序 列称作3'非翻译序列。术语"基因"包括cDM和基因组形式的基因。 基因的基因组形式或克隆包含由称作"内含子"或"间隔区"或"间 隔序列"的非编码序列打断的编码区。内含子是转录成核RNA(hnRNA) 的基因片段;内含子可含有调控元件例如增强子;内含子被从细胞核 或初级转录物中除去或"拼接掉";因此内含子在信使RNA (mRNA) 转录物中不存在。在翻译过程中mRNA的功能是确定新生多肽的序列或 氨基酸顺序。
如本文所使用的,术语"异源基因"是指不是以其天然环境存在 的基因。例如,异源基因包括导入到另一物种中的来自一个物种的基 因。异源基因也包括生物体所固有的但以一些方式(例如,经突变、 加入多个拷贝、连接至非天然调控序列等)改变的基因。异源基因与 内源基因的区别在于异源基因序列通常被连接到DNA序列上,所述DNA 序列不是与染色体中的基因天然连接的或与在自然界中未发现的染色 体的部分(例如,在基因非正常表达的基因座上表达的基因)相连。
如本文所使用的,术语"寡核苷酸,,指单链多核苷酸链的短长度。
寡核苷酸的长度通常小于200个残基(例如,15至100),但是,如本 文使用的,该术语也意在包括更长的多核苷酸链。寡核苷酸经常用它 们的长度来表示。例如,24残基寡核苷酸称作"24-聚体"。通过自 己杂交或通过与其它多核苷酸杂交,寡核苷酸可以形成二级和三级结 构。这样的结构可以包括但不限于双链体、发夹、十字形、弯曲和三 链体。
如本文所使用的,术语"互补的"或"互补"用来指通过碱基配 对规则相关联的多核苷酸(即核苷酸序列)。例如,序列"5'-A-G-T-3'" 和序列"3'-T-C-A-5'"互补。互补可以是"部分的",其中仅仅某些 核酸碱基依据碱基配对规则匹配。或者,核酸之间可以存在"完全" 或"全部"的互补。核酸链之间的互补程度对于核酸链间杂交的效率 和强度具有重大影响。这在扩增反应、以及依赖于核酸之间的结合的 检测方法中尤为重要。
术语"同源"是指互补程度。可存在部分同源或完全同源(即相 同)。部分互补的序列是至少部分地抑制完全互补的核酸分子与"基 本上同源的,,靶核酸杂交的核酸分子。完全互补的序列与乾序列的杂 交的抑制可使用杂交测定(DNA或RM印迹、溶液杂交等),在低严 谨性条件下进行检查。在低严谨性条件下,基本上同源的序列或探针 将竟争并抑制完全同源的核酸分子与靶标的结合(即杂交)。这并不 是说低严谨性条件是允许非特异性结合的条件;低严谨性条件要求两 序列彼此之间的结合是特异性(即选择性)的相互作用。非特异性结 合的不存在可通过使用基本上不互补(如小于约30%的同一性)的笫 二靶标进行测试;在非特异性结合不存在时,探针将不会与第二不互 补乾标杂交。
当用于指双链核酸序列如cDNA或基因组克隆时,术语"基本上同 源"是指在如上文所述的低严谨性条件下能与所述双链核酸序列的一 条或两条链杂交的任何探针。
基因可产生多种RNA,它们是通过初级RNA转录物的差异性剪接 产生的。作为同一基因剪接变体的cDNA将含有序列相同或完全同源的 区域(代表两cDNA上存在同一外显子或同一外显子的一部分),以及 完全不同的区域(例如,代表cDNA 1上存在外显子"A",而cDM 2 含有外显子"B")。由于两cDNA含有序列相同的区域,它们都将与 衍生自完整基因或含有见于两cDNA上的序列的基因部分的探针杂交; 这两个剪接变体因此与此探针并且彼此之间基本上同源。
当用于指单链核酸序列时,术语"基本上同源"是指在如上文所
述的低严谨性条件下能与所述单链核酸序列杂交(即是其互补物)的 任何探针。
如本文所使用的,术语"杂交"用来指互补核酸的配对。杂交和 杂交强度(即核酸之间的结合强度)受到诸如核酸之间互补程度、涉 及的条件的严谨性、形成的杂交链的L、以及核酸内G:C比等因素的 影响。在其结构内包含互补核酸配对的单个分子被表述为"自杂交的"。
如本文所使用的,术语"严谨性"用来进行核酸杂交的有关温度、 离子强度、以及存在化合物如有机溶剂的存在情况的条件。在"低严 谨性条件"下,目的核酸序列将与其精确互补物、具有单碱基错配的 序列、密切相关的序列(如具有90%或更高同源性的序列)、以及仅 有部分同源性的序列(如具有50-90%同源性的序列)杂交。在"中 严谨性条件"下,目的核酸序列将仅与其精确互补物、具有羊板基錄 配的序列、以及密切相关的序列(如90%或更高同源性)杂交。在'ft 严谨性条件"下,目的核酸序列将仅与其精确互补物以及(取夹于条 件如温度)具有单碱基错配的序列杂交。换言之,在高严谨性条件下, 可提高温度从而排除与具有单碱基错配序列的杂交。
当"高严谨性条件"用于指核酸杂交时,包括等同于如下的条件 在由5xSSPE(43. 8 g/1 NaCl, 6.9 g/1 NaH2P04H20和1. 85 g/1 EDTA, pH由NaOH调整至7. 4)、 0. 5%SDS、 5 x Denhardt's试剂和10G pg/ml 变性鲑鱼精DM组成的溶液中于42"C结合或杂交,接着在包括0. 1 x SSPE、 1. 0%SDS的溶液中于42r洗涤(如果使用的是长度约500个核 苷酸的探针)。
当"中严谨性条件"用于指核酸杂交时,包括等同于如下的条件: 在由5 x SSPE(43. 8 g/1 NaCl, 6.9 g/1 NaH2P04H20和1. 85 g/1 EDTA, pH由NaOH调整至7.4)、 0. 5%SDS、 5 x Denhard1/s试剂和100 jag/ml 变性鲑鱼精DNA组成的溶液中于42X:结合或杂交,接着在包括1. Ox SSPE、 1.0。/。SDS的溶液中于42X:洗涤(如果使用的是长度约500个核 苷酸的探针)。
"低严谨性条件"包括等同于如下的条件在由5 x SSPE (43. 8 g/1 NaCl, 6. 9 g/1 NaH2P04H20和1. 85 g/1 EDTA, pH由NaOH调整至7. 4)、 0. 1 % SDS、 5 x Denhardt's试剂[50 x Denhardt' s每500 ml含5 g Ficoll(型号400, Pharamcia)、 5gBSA(级分V; Sigma)]和100 ng/ml 变性鲑鱼精DNA组成的溶液中于421C结合或杂交,接着在包括5x SSPE、 0. 1%SDS的溶液中于421C洗涤(如果使用的是长度约500个核 苷酸的探针)。
本领域熟知可釆用众多的等同条件构成低严谨性条件;可考虑诸 如探针的长度和性质(DNA、 RNA、碱基组成)和耙标的性质(DNA、 RNA、 碱基组成、存在于溶液之中或者固定的等)以及盐和其它组分的浓度 (如曱酰胺、硫酸葡聚糖、聚乙二醇的存在与否)等因素,并且可改 变杂交溶液以产生不同于但又等同于上文所列条件的低度严谨杂交条 件。另外,本领域公知促进在高严谨性条件下杂交的条件(如提高杂 交和/或洗涤步骤的温度、在杂交溶液中使用甲酰胺等)(见上文"严 谨性"定义)。
如.本文所使用的,术语"扩增寡核苷酸"指与靶核酸或它的补体 杂交且参与核酸扩增反应的寡核苷酸。扩增寡核苷酸的一个实例是在 扩增过程中与模板核酸杂交且含有被聚合酶延伸的3'0H末端的"引 物"。扩增寡核苷酸的另一个实例是不被聚合酶延伸(例如,因为它具 有3'封闭端)、但是参与或促进扩增的寡核苷酸。扩增寡核苷酸可以 任选地包括修饰的核苷酸或类似物或参与扩增反应、但是不与乾核酸 互补或包含在靶核酸内的其它核苷酸。扩增寡核苷酸可以含有不与乾 物或模板序列互补的序列。例如,引物的5'区域可以包含不与靶核酸
互补的启动子序列(称作"启动子-引物")。本领域技术人员会理解,
可以将起引物作用的扩增寡核苷酸修饰成包含启动子序列,从而起 启动子-引物的作用。类似地,通过去除或合成启动子序列,可以修饰 启动子-引物,且仍然起引物的作用。3'封闭的扩增寡核苷酸可以提供 启动子序列,并用作聚合模板(称作"启动子-提供者")。
如本文所使用的,术语"引物"指寡核苷酸,无论是在纯化的限 制酶切消化中天然产生的还是合成生产的,当置于诱导合成与核酸链 互补的引物延伸产物的条件下(即,在有核苷酸和诱导剂例如DNA聚 合酶存在下,且在合适的温度和pH)时,其能作为合成的起点。所述 引物优选地是单链的,以实现扩增的最大效率,但是或者可以是双链 的。如果是双链的,在用于制备延伸产物之前,先处理所述引物以分 离它的链。优选地,所述引物是寡脱氧核糖核苷酸。所述引物必须足 够长,以在有诱导剂存在下引发延伸产物的合成。引物的确切长度依 赖于许多因素,包括温度、引物来源和使用方法。
如本文所使用的,术语"探针"指寡核苷酸(即,核苷酸序列), 无论是在纯化的限制酶切消化中天然产生的还是通过重组或通过PCR 扩增合成生产的,其能与另一个目标寡核苷酸的至少一部分杂交。探 针可以是单链的或双链的。探针用于特定基于序列的检测、鉴别和分 离中。预见到可以用任意的"报告分子"标记在本发明中使用的任意探 针,以便在任意检测系统中可检测到,包括但不限于酶(例如,ELISA 以及基于酶的组织化学测定法),荧光的、放射性的和发光的系统。本 发明无意限于任意具体检测系统或标记。
当术语"分离"用于核酸时,如在"分离的寡核苷酸"或"分离 的多核苷酸"中,是指从至少一个组分或杂质中鉴定和分离的核酸序 列,所述组分或杂质通常与所述核酸序列在其天然来源中结合。分离 的核酸就这样存在或以不同于其在自然界中被发现的形式存在。相反 地,未分离的核酸是例如以其天然存在的状态被发现的DNA和RM的 核酸。例如,在宿主细胞染色体上发现给定的DM序列(例如,基因) 与相邻基因接近;RNA序列,例如编码特定蛋白的特定mRNA序列,以
与大量其它编码大量蛋白的mRNAs混合的形式发现于细胞中。然而, 分离的编码给定蛋白的核酸包括(通过示例的方式)这样的在细胞中 通常表达所述给定蛋白的核酸,其中所述核酸存在于不同于天然细胞 的染色体位置的染色体位置上,或侧翼连接不同于天然发现的核酸序 列的核酸序列。所述分离的核酸、寡核苷酸或多核苷酸可以单链或双 链的形式存在。当使用分离的核酸、寡核苷酸或多核苷酸表达蛋白时, 所述寡核苷酸或多核苷酸至少包含有义链或编码链(即,所述寡核苷 酸或多核苷酸可以是单链),还可同时包含有义和反义链(即,所述 寡核苷酸或多核苷酸可以是双链)。
如本文所使用的,术语"纯化的"或"纯化"是指从样品中除去 组分(如污染物)。例如,抗体可通过除去污染的非免疫球蛋白类蛋 白而纯化;它们也可通过除去不与乾分子结合的免疫球蛋白而纯化。 非免疫球蛋白类蛋白的去除和/或不与靶分子结合的免疫球蛋白的去 除导致样品中靶-反应性免疫球蛋白的百分比增大。在另一个实例中, 重组多肽在细菌宿主细胞中表达,并且通过除去宿主细胞蛋白而纯化 所述多肽;由此提高样品中重组多肽的百分比。
发明详述
本发明是基于复发基因融合在前列腺癌中的发现。本发明提供了 诊断、研究和治疗方法,其可以直接或间接检测或靶向所述基因融合。 本发明也提供了用于诊断、研究和治疗目的的组合物。
I.基因融合
本发明鉴别出指示前列腺癌的复发基因融合。所述基因融合是雄 激素调节基因(ARG)和ETS家族成员基因的染色体重排的结果。尽管它 们复发,ARG与ETS家族成员基因融合的接头会变化。所述基因融合 通常包含来自ARG的转录调节区的5'部分和来自ETS家族成员基因的 3'部分。所述复发基因融合可以用作前列腺癌的诊断标记和临床把物。
A.雄激素调节基因
雄激素调节的基因对于人前列腺正常生理功能是至关重要的。它
们也为前列腺癌的发展和进展作出贡献。识别出的ARG包括但不限于 TMPRSS2; PSA; PSMA; KLK2; S皿;Seladin-l;和,FKBP51 (Paoloni-Giacobino等,Genomics 44: 309 (1997); Velasco等,Endocrinology 145 (8): 3913 (2004))。更具体地,已经证实与其它正常人组织相比, TMPRSS2(NM—005656)在前列腺上皮中高度表达(Lin等,Cancer Research 59: 4180 (1999))。 TMPRSS2基因位于染色体21上。该基因 位于离pter 41, 750, 797 - 41, 801, 948碱基对(共51, 151碱基对; 负链朝向)的位置处。人TMPRSS2蛋白序列可以参见GenBank登记号 AAC51784 (Swiss Protein登记号015393)),对应的cDNA是GenBank 登记号U75329 (也参见,Paoloni-Giacobino,等,Genomics 44: 309 (1997))。
ARG的转录调节区可以含有ARG的编码区或非编码区,包括启动 子区。ARG的启动子区还可以含有ARG的雄激素反应元件(ARE)。更具 体地,TMPRSS2的启动子区提供在GenBank登记号AJ276404。
B. ETS家族成员基因
BTS家族的转录因子调节控制基因表达的细胞内信号传递途径。 作为下游效应子,它们激活或抑制特定靶基因。作为上游效应子,它
们负责许多生长因子受体的空间和时间表达。已经鉴别出该家族的接 近30个成员,并涉入许多生理和病理过程。它们包括但不限于ERG; ETV1(ER81); FLI1; ETS1; ETS2; ELK1; ETV6(TEL1); ETV7 (TEL2); GABPoc; ELF1; ETV4(EUF; PEA3); ETV5 (ERM); ERF; PEA3/E1AF; PU. 1; ESE1/ESX; SAP1 (ELK4) ; ETV3(METS); EWS/FLI1; ESE1; ESE2(ELF5); ESE3; PDEF; NET(ELK3; SAP2); NERF(ELF2);和FEV。 示例性的ETS家族成员基因序列如图9所示。
更具体地,已经证实与其它正常人组织相比,ERG(NM-004449)在 前列腺上皮中高度表达。ERG基因位于染色体21上。该基因位于离pter 38, 675, 671-38, 955, 488碱基对的位置处。ERG基因共279, 817碱基 对;负链朝向。对应的ERG cDNA和蛋白序列分别见GenBank登记号
M17254和GenBank登i己号NP04440 (Swiss Protein登^己号P11308)。 ETV1基因位于染色体7上(GenBank登记号NC-000007. 11; NC-086703. ll;和NT—007819. 15)。该基因位于离pter 13, 708330 -13,803,555碱基对的位置处。ETV1基因共95, 225碱基对;负链朝向。 对应的ETVlcDNA和蛋白序列分别见GenBank登记号NM—004956和 GenBank登记号NP-004947 (Swiss蛋白登记号P50549)。
人ETV4基因位于染色体14上(GenBank登记号NC-000017. 9; NT-010783. 14;和NT画086880. 1)。该基因位于离pter 38, 960, 740 -38,979, 228碱基对的位置处。ETV4基因共18, 488碱基对;负链朝向。 对应的ETV4 cDNA和蛋白序列分别见GenBank登记号NM-001986和 GenBank登记号NP—01977 (Swiss蛋白登记号P43268)。 C. ARG/ETS基因融合
如上所述,本发明提供了 ARG与ETS家族成员基因的融合。在图 36中给出了示例性的基因融合序列。关于所有涉及的基因(TMPRSS2、 ERG、 ETV1和ETV4),提供了 GenBank参照序列ID,并使用UCSC人体 基因组的2004年5月集合比对外显子。关于所有识别出的融合,图 36提供了从TMPRSS2基因的开头穿过所述融合和ETS家族成员基因的 终止密码子的完整序列。也提供了每个公开的变体的保藏的GenBank 序列。有些TMPRSS2:ERG和TMPRSS2: ETVl融合通过TMPRSS2和ETS 家族成员基因的断裂点外显子来描述。例如,将TMPRSS2:ERGa (它将 TMPRSS2的外显子1与ERG的外显子4-11融合)鉴别为 TMPRSS2:ERG(1,4)。
ARG与ETS家族成员基因的融合可以作为DM、RM或蛋白检测到。 最初,基因融合可以作为基因组DNA的染色体重排检测到,所述色体 重排具有来自ARG的转录调节区的5'部分和来自ETS家族成员基因的 3'部分。转录后,所述基因融合可以作为嵌合mRNA检测到,所述嵌合 mRM具有来自ARG的转录调节区的5'部分和来自ETS家族成员基因的 3'部分。翻译后,所述基因融合可以作为下述蛋白检测到由ARG的 转录调节区与ETS家族成员基因融合产生的氨基端截短的ETS家族成
员蛋白;具有来自ARG的转录调节区的氨基端部分和来自ETS家族成 员基因的羧基端部分的嵌合蛋白;或未调节的、但是否则不可辨别的
天然ETS家族成员蛋白。截短的ETS家族成员蛋白和嵌合蛋白的氨基 酸序列、翻译后加工和/或二级、三级或四级结构可能不同于它们各自 的天然蛋白。如果存在,这样的差别可以用于鉴别基因融合的存在。 下面更详细地描述了具体的检测方法。
在前列腺癌中,某些基因融合比其它基因融合更常见。本发明将 50-80 %的前列腺癌鉴别为具有TMPRSS2与ERG、 ETV1、 ETV4、或FLI1 的复发基因融合。其中,50-70%是TMPRSS2-ERG,其中的50%- 60 %源自染色体21上TMPRSS2和ERG基因座之间遗传信息的缺失(下面 更详细地描述),5-10%是TMPRSS2-ETV1, 1-2 %是TMPRSS2-ETV4, l-2o/o是TMPRSS2-FLI1。
在开发本发明的过程中进行的实验表明,某些融合基因会表达融 合转录物,而其它融合基因则不会表达功能转录物(Tomlins等, Science, 310: 644-648(2005); Tomlins等,Cancer Research 66: 3396-3400(2006))。
在开发本发明的过程中进行的其它实验,鉴别出了位于染色体 2lq22.2-3上TMPRSS2和ERG之间的显著的基因组缺失。在 TMPRSS1ERG融合阳性的PCA样品中观察到缺失。该缺失出现在共有 区域,但是在该区域内表现出变异性。在Paris等(Hum. Mol. Genet. 13: 1303-13 (2004))以前公开的工作中,CGH分析检测出离TMPRSS2 6 kb着丝粒的CTD-210307 BAC中的缺失。在12.5% (9/72)的临床上局 限性PCA样品和33% (5/15)的转移性PCA样品中观察到这些缺失。这 些结果支持了来自当其研究的SNP阵列数据,并表明任一种PCA缺失 随着进展变得更常见,或缺失在倾向于更快速地进展的PCA中更常鉴 别出。鉴于TMPRSS2:ERG重排的显著的肿瘤内同质性,这些分子亚型 更可能与不同疾病进展特征相关联。
评价了 118个临床上局限性PCA病例,其中49. 2。/。具有ERG重排。 在60. 3 %的这些TMPRSS2: ERG融合阳性的病例中,,见察到基因内缺失。
几乎所有显著过表达ERG的PCA样品具有重排,且所述过表达发生在 与重排大致相同数目的病例中。使用Oncomine (可公开得到的基因表 达数据概要),鉴别出4个显著下调节的基因,它们位于共同缺失位 点区域(图16)。
本发明不限于特定的机理。实际上,对机理的理解并非实施本发 明所必需的。虽然如此,结果表明,接近半数的PCA可以通过 TMPRSS2:ERG重排来确定。大多数这样的肿瘤表现出基因内缺失,它 们的大小根据寡核苷酸SNP阵列基因组分析是可变的。但是,约30-40 %没有表现出缺失,因而可能具有TMRPSS2和ERG的平衡易位。在缺 失范围内该变异性可能与已经用CML观察到的疾病进展有关。本研究 鉴别出了与肿瘤阶段和淋巴结状态的显著临床关联。TMPRSS2:ERG重 排的具有缺失的肿瘤也表现出向更高PSA生物化学失败速率的趋势。
在开发本发明的过程中进行的其它实验,基于TMPRSS2: ERG基因 融合在长期随访的早期前列腺癌警戒等待组中的存在,探究了发生转 移或前列腺癌特异性死亡的风险。使用92个病例,评估了 TMPRSS2:ERG 基因融合的频率。该基于群体的组中TMPRSS2:ERG基因融合的频率是 15.2% (n/92),低于在2个基于医院的组中观察到的50%频率。本 发明不限于特定的机理。实际上,对机理的理解并非实施本发明所必 需的。虽然如此,该TMPRSS2:ERG基因融合前列腺癌的差异可能归因 于种族和人种的遗传差异。与其它基于非群体的研究相比,在该警戒 等待组中更低百分比的晚期病例,也可以解释这些差异。
以3.6的累积发生率(P- 0.004, 95 %置信区间=1.5-8. 9),观 察到TMPRSS2: ERG基因融合和远处转移和前列腺癌特异性死亡的发展 之间的显著关联。这些数据表明,TMPRSS2:ERG基因融合前列腺癌具 有更高侵袭性的表型。其它实验表明,TMPRSS2:ERG基因融合中的基 因组缺失与晚期和/或转移性前列腺癌有关(参见例如,实施例5)。
本发明还已经证实,雄激素可以在TMPRSS2-ERG阳性细胞系中诱 导ERG的过表达,推定是通过ARE。本发明不限于特定的机理。实际 上,对机理的理解并非实施本发明所必需的。虽然如此,结果一起表
明,通过TMPRSS2上游的ARE失调ETS家族活性,可以驱动前列腺癌 发展。
预见到,基因融合表达的存在、分子亚型或量与疾病的阶段、侵 袭性或进展、或转移的存在或风险有关。还预见到,类似的涉及ETS 家族成员基因的复发基因融合发生在其它上皮癌中。
II. 抗体
本发明的基因融合蛋白,包括其片段、衍生物和类似物,可以用 作免疫原来生产抗体,其可以用于下述的诊断、研究和治疗方法中。 抗体可以是多克隆或单克隆的、嵌合的、人化的、单链或Fab片段。 本领域普通技术人员已知的不同方法可以用于生产和标记这样的抗体 和片段。参见,例如,Burns, ed. , Immunochemical Protocols, 第 3版,Humana Press (2005); Harlow和Lane, Ant ibodies: A Laboratory Manual, Cold Spring Harbor Laboratory(1988) ; Kozbor 等, Immunology Today 4: 72(1983); K6hler和Milstein, Nature 256: 495 (1975)。利用截短的ETS家族成员蛋白或嵌合蛋白与它们各自的天 然蛋白之间的差异的抗体或片段是特别优选的。
III. 诊断用途
本发明提供了基于DNA、 RNA和蛋白的诊断方法,其可以直接或间 接检测基因融合。本发明也提供了用于诊断目的的组合物和试剂盒。
本发明的诊断方法可以是定性的或定量的,定量的诊断方法可以 用于,例如,通过截止值或阈值水平,区分无痛的和侵袭性的癌症。 当适用时,定性或定量诊断方法也可以包括靶物、信号或中间物(例如, 通用引物)的扩增。
初步测定可以证实基因融合的存在,但是不能鉴别所述特异性融 合。如果需要,然后进行第二个测定,来确定特定融合的一致性。第 二个测定可以使用与初步测定不同的检测技术。
本发明的基因融合可以与其它标记一起以多路或格子(panel)形
式检测。单独地或与基因融合相组合地,选择标记的预测价值。示例
性的前列腺癌标记包括但不限于AMACR/P504S (美国专利号 6,262,245); PCA3(美国专利号7, 008,765); PCGEM1(美国专利号 6,828,429) ; prostein/P501S, P503S, P504S, P509S, P510S, prostase/P703P, P710P (美国
发明者A·齐恩耐彦, C·李, D·洛德斯, F·德米彻里斯, M·A·鲁宾, R·梅尔拉, S·汤姆林斯, S·珀纳, 孙晓葳 申请人:密执安州立大学董事会;布里格海姆妇女医院公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1