前列腺癌中的复现性基因融合体的制作方法

文档序号:581557阅读:1505来源:国知局
专利名称:前列腺癌中的复现性基因融合体的制作方法
技术领域
本发明涉及用于癌症诊断、研究和治疗的组合物和方法,包括但不限于癌症标志物。具体来说,本发明涉及使用复现性基因融合体(recurrent gene fusion)作为前列腺癌的诊断标志物和临床靶。
背景技术
癌症研究的中心目标是鉴定与肿瘤发生具有因果关联的改变的基因。已经鉴定到几种类型的体细胞突变,包括碱基取代、插入、删除、易位以及染色体增多和缺失,它们都引起癌基因或肿瘤抑制基因活性的改变。染色体重排是癌症的病因这一假说,在1900年代早期首次提出,现在有令人信服的证据(Rowley, Nat Rev Cancer 1:245(2001))。复现性的染色体畸变被认为是白血病、淋巴瘤和肉瘤的首要特征。上皮细胞肿瘤(癌)要常见得多并造成相对高比例的与人类癌症相关的发病和死亡,其包含不到1%的已知的、疾病特异性的染色体重排(MiteIman,Mutat Res 462:247(2000))。尽管血液癌通常具有平衡的、疾病特异性染色体重排的特征,但大多数实体肿瘤具有过多的非特异性染色体畸变。据认为,实体肿瘤的核型复杂性是由于通过癌症演化或发展而获得的继发改变。已经描述了染色体重排的两种主要机制。在一种机制中,一个基因的启动子/增强子元件邻近原癌基因重排,从而引起致癌蛋白表达的改变。这种类型的易位的实例是免疫球蛋白(IG)和T-细胞受体(TCR)基因与MYC的并置,其分别在B-和T-细胞癌中引起该癌基因的活化(Rabbitts,Nature 372:143(1994))。在第二种机制中,重排导致两个基因的融合,由此产生了可能具有新功能或改变的活性的融合蛋白。这种易位的范例是慢性粒细胞白血病(CML)中的 BCR-ABL 基因融合体(Rowley, Nature 243 :290(1973) ;de Klein等,Nature 300:765(1982))。重要的是,该发现导致了甲磺酸伊马替尼(Gleevec)的合理开发,其成功地靶向BCR-ABL激酶(Deininger等,Blood 105:2640(2005))。因此,在常见上皮细胞肿瘤中鉴定复现性基因重排,对于癌症药物发现工作以及患者治疗可能具有深远意义。发明概述在某些实施方案中,本发明提供了在患者中鉴定前列腺癌的方法,所述方法包含提供来自于患者的样品;以及检测样品中具有来自于SLC45A3基因转录调控区的5’部分和来自于ERG基因的3 ’部分的基因融合体的存在或不存在,其中在样品中检测到该基因融合体的存在鉴定患者患有前列腺癌。在某些实施方案中,SLC45A3基因的转录调控区包含SLC45A3基因的启动子区。在某些实施方案中,检测步骤包含检测具有来自于SLC45A3基因转录调控区的5’ DNA部分和来自于ERG基因的3’ DNA部分的基因组DNA的染色体重排。在某些实施方案中,检测步骤包含检测具有从SLC45A3基因转录调控区转录的5’ RNA部分和从ERG基因转录的3’ RNA部分的嵌合mRNA转录物。在某些实施方案中,样品是组织、血液、血浆、血清、尿液、尿液上清液、尿液细胞沉淀物、精液、前列腺分泌物或前列腺细胞。在某些实施方案中,本发明提供了在患者中鉴定前列腺癌的方法,所述方法包含提供来自于患者的样品;以及检测样品中具有来自于FLJ35294基因转录调控区的5’部分 和来自于ETS家族成员基因的3 ’部分的基因融合体的存在或不存在,其中在样品中检测到基因融合体的存在鉴定患者患有前列腺癌。在某些实施方案中,FLJ35294基因的转录调控区包含FLJ35294基因的启动子区。在某些实施方案中,ETS家族成员基因是ETVl。在某些实施方案中,检测步骤包含检测具有来自于FLJ35294基因转录调控区的5’ DNA部分和来自于ETS家族成员基因的3’ DNA部分的基因组DNA的染色体重排。在某些实施方案中,检测步骤包含检测具有从FLJ35294基因转录调控区转录的5’ RNA部分和从ETS家族成员基因转录的3’ RNA部分的嵌合mRNA转录物。在某些实施方案中,样品是组织、血液、血浆、血清、尿液、尿液上清液、尿液细胞沉淀物、精液、前列腺分泌物或前列腺细胞。在某些实施方案中,本发明提供了在患者中鉴定前列腺癌的方法,所述方法包含提供来自于患者的样品;以及检测样品中具有来自于DDX5基因的5’部分和来自于ETS家族成员基因的3 ’部分的基因融合体的存在或不存在,其中在样品中检测到基因融合体的存在鉴定患者患有前列腺癌。在某些实施方案中,ETS家族成员基因是ETV4。在某些实施方案中,检测步骤包含检测具有来自于DDX5基因的5’ DNA部分和来自于ETS家族成员基因的3’ DNA部分的基因组DNA的染色体重排。在某些实施方案中,检测步骤包含检测具有从DDX5基因转录的5’ RNA部分和从ETS家族成员基因转录的3’ RNA部分的嵌合mRNA转录物。在某些实施方案中,检测步骤包含检测具有DDX5基因编码的氨基端部分和ETS家族成员基因编码的羧基端部分的嵌合蛋白。在某些实施方案中,样品是组织、血液、血浆、血清、尿液、尿液上清液、尿液细胞沉淀物、精液、前列腺分泌物或前列腺细胞。在某些实施方案中,本发明提供了用于诊断、治疗和研究目的的组合物。在某些实施方案中,组合物包含寡核苷酸探针,所述探针包含与嵌合基因组DNA或嵌合mRNA的连接处杂交的序列。在某些实施方案中,组合物包含第一个寡核苷酸探针,所述探针包含与嵌合基因组DNA或嵌合mRNA的5’部分杂交的序列,以及第二个寡核苷酸探针,所述探针包含与嵌合基因组DNA或嵌合mRNA的3’部分杂交的序列。在某些实施方案中,组合物包含第一个扩增寡核苷酸,所述寡核苷酸包含与嵌合基因组DNA或嵌合mRNA的5’部分杂交的序列,以及第二个扩增寡核苷酸,所述寡核苷酸包含与嵌合基因组DNA或嵌合mRNA的3’部分杂交的序列。在某些实施方案中,组合物包含针对具有5’基因编码的氨基端部分和3’基因编码的羧基端部分的嵌合蛋白的抗体。本发明的其他实施方案提供在下面的说明书和实施例中。


图I显示了微阵列数据的癌症异常值谱分析(Cancer Outlier ProfileAnalysis) (COPA)。(A)显示了两个大规模基因表达研究中所有进行谱分析的样品的ETVl (左图)和ERG(中图)的表达(归一化的表达单位)。(B)与(A)中相同,差别在于使用了激光捕获显微切割的样品。(C)与(A)中相同,差别在于检查了多发性骨髓瘤中已知易位到免疫球蛋白重链启动子(IgH)的癌基因(FGFR3和CCND1)。图2显示了前列腺癌(PCA)中TMPRSS2:ETV1和TMPRSS2:ERG基因融合体的鉴定和表征。(A)通过定量PCR(QPCR)分析前列腺癌细胞系(DuCaP、LnCaP和VCaP)和激素抗拒性转移性(MET)前列腺癌组织的ERG( ■)和ETVl ( □ )mRNA表达。⑶与LNCaP细胞中相比,MET26中失去了 ETVl外显子2和3的过表达。(C)MET26_LN中的ETVl和MET28-LN中的ERG的5' RNA连接酶介导的cDNA末端快速扩增(RLM-RACE)结果的示意图,显示了与TMPRSS2的基因融合体。(D)在MET26-LN和MET26-RP中使用易位特异性QPCR验证TMPRSS2:ETV1 的表达。(E)在细胞系和PCA样本中使用易位特异性QPCR验证TMPRSS2:ERG的表达。图3显示了在福尔马林固定的石蜡包埋组织切片上的间期荧光原位杂交(FISH),证实了 TMPRSS2:ETV1基因融合和ERG基因重排。(A和B)显示了双色融合信号方法检测TMPRS S2 (绿色信号)与ETVl (红色信号)的融合。(C和D)使用双色分裂信号方法,利用跨过ERG的5’(绿色信号)和3’(红色信号)区域的两个探针检测ERG基因重排。(E)使用与(A-D)中相同的探针在独立的组织微阵列上的FISH结果的矩阵表示,所述微阵列含有来自13例临床局限性前列腺癌(PCA)和16例转移的前列腺癌(MET)的核心。图4显示了在带有TMPRSS2:ERG易位的前列腺癌细胞中ERG的雄激素调控。图5显示了癌症异常值谱分析(COPA)。图5A显示了 COPA分析的示意图。图5B显示了 RUNX1T1 (ETO)在Valk等的急性粒细胞白血病数据组(n = 293)的90百分位数处具有最高分值的异常值情况。图5C显示了 E2A-PBX1的异常值表达情况图。图6显示了 MET26-LN中的ETVl和PCA4中的ERG的RNA连接酶介导的cDNA末端快速扩增(RLM-RACE)结果,表明了与TMPRSS2的基因融合(TMPRSS2:ERGb融合体)。图7显示了前列腺癌中ETS家族成员的过表达。从大体切片组织(A)或通过激光捕获显微切割分离的组织(B)中进行谱分析的良性前列腺、前列腺上皮内瘤(PIN)、临床局限性前列腺癌和转移前列腺癌中所有被监测的ETS家族成员的表达,使用Oncomine进行可视化。图8显示了过表达ETV4的前列腺癌病例中TMPRSS2和ETV4基因座的过表达。A.在合并的良性前列腺组织(CPP)、没有过表达ETV4并且是TMPRSS2:ERG阳性(PCA1-2)或阴性(PCA3-4)的前列腺癌、以及来自我们的具有ETV4过表达的LCM组群的前列腺癌病例(PCA5)中,ETV4的标出的外显子或区域的表达。B. RLM-RACE显示出在PCA5中TMPRSS2上游的序列与ETV4融合。C.通过QPCR检测的PCA5中TMPRSS2: ETV4a和TMPRSS2: ETV4b的表达。D.在福尔马林固定的石蜡包埋组织上进行的间期荧光原位杂交证实了 PCA5中TMPRSS2与ETV4基因座的融合。图9显示了示例性ETS家族基因的mRNA序列。图10 显示了 TMPRSS2 的 mRNA 序列。图11显示了通过FISH进行的TMPRSS2:ERG基因融合体分析。图A :核型模式图,描绘了用于间接检测TMPRSS2:ERG融合体的分裂(break apart)分析。图B :基质细胞(左侦D和前列腺癌腺体(右侧)的间期核。图C :前列腺癌腺体的间期核,显示了分裂和同时的删除,正如端粒探针的失去所指示的(IOOx油浸物镜放大倍数)。图D :C中加框区域的放大视图,证实了两个核的分裂和端粒探针的失去^Ox油浸物镜放大倍数)。图12显示了 12号染色体上ERG与TMPRSS2之间的基因组删除。图A :样品包括6个细胞系、13个异种移植物和11个转移PCA样品,通过qPCR和/或FISH进行TMPRSS2: ERG和TMPRSS2:ETV1状态的表征(灰色条表示阴性,蓝色条表示阳性状态)。图B :A中加绿色框区域的放大图。图C :A中加黑色框区域的 放大图。图13显示了临床局限性前列腺癌中的TMPRSS2:ERG重排以及与病理参数的关联性。图A.在49.2%的原发PCA样品和41.2%的未接触过激素的转移LN样品中鉴定到了TMPRSS2: ERG重排。图B.在肿瘤晚期的PCA病例中倾向于观察到更高百分率的带有缺失的TMPRSS2:ERG 重排肿瘤(p = 0. 03)。图14显示了位于21q22_23上ERG(着丝粒方向)与TMPRSS2 (端粒方向)之间的已知基因。黑线上方的基因走向为5’ -着丝粒到3’ -端粒方向,黑线下方的基因走向为5’-端粒到3’-着丝粒方向。在图像的下半部分,描绘了使用FISH探针检测的ERG基因座的放大图。图15显示了 “异源”前列腺癌病例,绝大部分显示出带有缺失的TMPRSS2:ERG重排(右侧的核),只有少量区域显示出没有缺失的TMPRSS2:ERG重排(左侧的核)。图16显示了位于TMPRSS2与ERG之间的基因跨8个已发表的表达阵列数据组的碁萃分析(meta-analysis)。图17显示出FISH测定检测到与TMPRSS2:ERG基因融合相关的特征性删除,这与疾病发展有关。图A和B :为了分析染色体21q22. 2上的ERG重排,使用了由分别跨越ERG基因座附近的着丝粒向和端粒向区域的生物素-14-dCTP标记的BAC克隆RP11-24A11 (最终结合产生红色信号)和地高辛配基-dUTP标记的BAC克隆RPl 1-137J13 (最终结合产生绿色信号)构成的分裂探针(break apart probe)系统。使用该分裂探针系统,没有ERG重排的核显示出两对并置的红色和绿色信号。并置的红-绿色信号形成黄色的融合信号(图B,箭头)。图C :在累计发病率回归模型中,评估了 TMPRSS2:ERG作为累计发病率或转移或前列腺癌特异性死亡的决定因子。图18显示了 FLIl没有融合转录物的过表达。图19显示了在TMPRSS2-ERG+细胞中雄激素对ERG蛋白表达的诱导。图20显示了内源和融合ERG多肽的示意图。图21显示了 ERG2的核相互作用物。图22显示了针对ERGl的肽抗体的序列和aqua探针的产生。图23显示了针对ETVl的肽抗体的序列和aqua探针的产生。图24显示了针对FLIl的肽抗体的序列和aqua探针的产生。图25显示了针对ETV4的肽抗体的序列和aqua探针的产生。图26显示了 LNCaP前列腺癌细胞系中ETVl的过表达和雄激素调控。图26A显示了 VCaP和LNCaP前列腺癌细胞系中雄激素调控的基因的表达特征。图26B显示通过定量PCR(QPCR)证实了在VCaP和LNCaP两种细胞中PSA被雄激素诱导。图26C显示了 LNCaP细胞中ETVl被雄激素诱导。图26D显示了在LNCaP细胞中ETVl显著过表达。图27显示了 LNCaP细胞中ETVl的重排。图27A显示了在荧光原位杂交(FISH)中用作探针的BAC的示意图。图27B显示了在正常外周血淋巴细胞(NPL)中RP11-124L22和RP11-1149J13共定位于7号染色体。图27C显示了在接近四倍体的LNCaP细胞系中确定了 I号BAC和4号BAC在中期涂片(上图)和间期细胞(下图)上的定位。图27D显示了在LNCaP细胞中来自RP11-124L22的信号定位于14号染色体。图28显示了整个ETVl基因座被插入到LNCaP细胞的14号染色体中。图28A显示了在本实验中使用的BAC的示意图。图28B显示了在LNCaP细胞中通过FISH确定了RP11-124L22(1号BAC)和RP11-313C20 (2号BAC)在中期涂片(上图)和间期细胞(下图)上的定位。图29显示了在LnCaP中ETVl的siRNA击倒。图30显示了在VCaP中ERG的siRNA击倒。
图31显示了病毒过表达系统。图32显不了转基因小鼠的不意图。图33显示了尿液中ERG和ETVl转录物的检测。图33A显示了在LNCaP (高ETVl表达)或VCaP (高ERG和TMPRSS2: ERG表达)前列腺癌细胞中ERG和ETVl的检测。图33B显示了在疑似患有前列腺癌的患者的尿液中ERG和ETVl的检测。图34显示了用于在前列腺癌中检测TMPRSS2:ETS基因融合体的测定方法。图34A显不了用于TMPRSS2和ERG的分裂测定方法(break apart assay)。通过一对分裂的5’和3’信号指示的ERG重排阳性病例(没有缺失)显示在左图中。通过失去一个3’信号指示的TMPRSS2重排阳性病例(具有缺失)显示在右图中。图34B显示了用于TMPRSS2:ETV1基因融合体的融合测定方法。图34C显示了用于ETV4的分裂测定方法。图35显示了通过FISH检测的TMPRSS2、ERG、ETV1和ETV4重排。图35A显示了通过图34中所示的测定方法检测到的TMPRSS2、ERG、ETVl和ETV4的重排结果表。图34B显示了来自所有四种测定都可以按照A中的描述进行评估的38个病例的TMPRSS2、ERG、ETV1和ETV4状态的热图表现。图34C显示了 TMPRSS2和ETS重排状态不一致的病例的热图表
/Jn o图36显示了本发明的基因融合体的序列。图37显示了用于FLI-I表达分析的引物和探针。图38显示了异常值肿瘤样本中与ETVl融合的前列腺特异性或遍在活性的调控元件的鉴定。a. ETVl异常值病例的鉴定,b.在异常值病例中与ETVl融合的新的5’配偶体的结构,c.使用5’针对所标明的配偶体和3’针对ETVl的探针,通过FISH证实ETVl融合。d. 5’融合配偶体的组织特异性,e. 5’融合配偶体的雄激素调控的评估。图39显示了通过qPCR验证的新EVTl基因融合体。图40显示了通过FISH验证的新ETVl基因融合体。a.在间期FISH中用作探针的、5’ 和 3,位于 ETVU HNRPA2B1、HERV_K_22qll. 23、C150RF21 和 SLC45A3 的 BAC 的示意图。b-d.使用所标出的BAC以及相应的荧光标记物在福尔马林固定的石蜡包埋的组织切片上进行FISH,用于b)5’融合配偶体的分裂信号测定,c) 5’配偶体和ETVl的融合测定,以及d)ETVl的分裂信号测定。
图41显示前列腺细胞中ETVl的过表达赋予了浸润力。a.表达ETVl基因融合产物(外显子4-直到报道的终止密码子)的腺病毒和慢病毒。b.将良性永生化前列腺细胞系RWPE按照指示用ETVl或对照(GUS)慢病毒感染,产生稳定克隆并测定穿过修饰基膜的浸润。c.将原代前列腺上皮细胞(PrEC)按照指示用ETVl或LACZ腺病毒感染并测定浸润。显示了平均值(n = 3)+S.E。被浸润细胞的显微照片标明在插图中。d-e. LNCaP细胞中ETVl的siRNA击倒使浸润受到抑制。将LNCaP细胞只用转染试剂处理(未处理),或按照指示用非寻靶或ETVl siRNA转染。d. ETVl击倒通过qPCR得到证实(平均值(n = 4) +S.E.)。e.与b和c中相同评估细胞的浸润(平均值(n = 3)+S. E.)。f.在Agilent全基因组微阵列上对RWPE-ETV1和RWPE-GUS细胞进行谱分析。显示了与RWPE-GUS细胞相比,在RWPE-ETV1中过表达的基因的分子概念分析的网络图。每个节点表示分子概念、或生物相关基因的组。节点大小与概念中的基因数量成正比(例如“RWPE-ETV1”和“细胞外基质”概念分别含有527和186个基因)。概念的颜色根据图例表示概念类型。每条边表示显著富集(P < 0. 005)。g. qPCR证实在所选的参与浸润的基因在RWPE-ETV1细胞中过表达浸润。图42显示了在前列腺中表达ETVl基因融合产物的转基因小鼠发生小鼠前列腺上 皮内瘤(mPIN)。a-f.ARR2Pb-ETVl前列腺的苏木精和曙红染色,用于形态学评估。c. b的高倍率图,其中插图显示了 mPIN病灶中显著的核。d.在3号ARR2Pb-ETVl小鼠(33周)的腹侧前列腺(VP)中观察到的正常腺体和mPIN灶。e. d的高倍率图。f.显示出正常上皮组织结构以及mPIN的单一腺体。插图显示了由箭头指示的mPIN灶。g_l.使用平滑肌肌动蛋白(SMA)进行的免疫组织化学证实了 g)良性腺体和h)所有mPIN病灶周围连续的纤维肌层,同时基细胞标志物i_j)细胞角蛋白5(CK5)和k-l)p63证实了在3号ARR2Pb-ETVl小鼠的背外侧前列腺(DLP)中,在mPIN灶(j,l)中与正常腺体(i,k)相比失去了周围基细胞。原始放大倍数对于a、b和d来说是IOOx,对于c和e_l来说是400x。图43显示了不同类型的染色体重排活化前列腺癌中的ETS癌基因。图44显示了 ETVl的过表达不影响增殖或转化良性前列腺上皮细胞。a.将良性的永生化前列腺细胞系RWPE按照指示用ETVl或对照(GUS)慢病毒感染,产生稳定克隆并测定增殖。b.将原代前列腺上皮细胞(PrEC)按照指示用ETVl或LACZ腺病毒感染并测定增殖。显示了平均值(n = 3)+S. E.。结果代表了三次独立实验。c. ETVl过表达不增加S期中RWPE细胞的百分率。d. ETVl过表达不增加RWPE细胞的无贴壁依赖性生长。图45显示了 ETVl的shRNA击倒抑制了在LNCaP细胞中的浸润。a.如图41e中所示,将对照LNCaP细胞或用表达非寻靶或ETVl shRNAmir的慢病毒感染的LNCaP细胞进行浸润评估。显示了平均值(n = 3)+S.E。b.来自a的被浸润细胞的显微照片。图46显示出ETVl的过表达导致增殖相关概念的表达降低。图47显示了在RWPE-ETV1细胞中过表达的浸润相关基因的鉴定。a. RffPE-ETVl和RffPE-GUS细胞在Agilent全基因组微阵列上进行谱分析。b.鉴定RWPE-ETV1概念中和富集网络的14个其他概念中的至少5个(由数字标明)中存在的基因的叠加图。图48显示了 ARR2Pb-ETVl小鼠的前列腺中mPIN区域中ARR2Pb_ETVl_FLAG表达的证实。a.4号ARR2Pb-ETVl小鼠的腹侧前列腺(VP)的低倍率图,其中良性区域和mPIN灶分别用黄色和黑色箭头指示。b. a中指出的良性腺体的高倍率图,显示了缺乏ETV1-FLAG表达。c. a中指出的mPIN腺体的高倍率图,证实了 ETV1-FLAG的表达。
图49显示了剥夺LNCaP细胞的雄激素调节了雄激素调控基因的表达。图50显示出在雄激素响应性VCaP细胞系中R1881不诱导ETVl表达。图51显示了本发明另外的基因融合体的序列。图52显示了本发明其他的基因融合体的序列。图53显示了通过QPCR鉴定到两个前列腺癌(PCa)病例显示出ETV5异常表达。图B显示了通过RACE测定到的这两个病例的融合转录物的结构。
图54显示了用于在前列腺癌中进行ETS畸变的全面FISH筛选的方法示意图。a)分裂探针FISH方法使用了侧翼带有ETS断点的 IMb探针,并用于前列腺癌TMA以筛选涉及ETS家族基因的遗传重排。b)来自基于FISH的前列腺癌筛查的可能结果。c)如果IMb分裂探针表明畸变,将紧接目标基因两侧的探针(100 200Kb)应用于组织切片以验证由初始筛查所鉴定的畸变。d)对于ETS基因和已知5’配偶体两者都重排的病例来说,执行融合探针FISH测定以证实可能的基因融合;在只有ETS基因重排的病例中,使用RLM-RACE鉴定ETS基因的新5’配偶体。图55a和b显示了前列腺癌中ETS和5’融合配偶体畸变的汇总矩阵。图56显示了鉴定SLC45A3作为ERG的新的5’融合配偶体。a)用作间期FISH探针、5’和3’位于SLC45A3和ERG的BAC的示意图。b)在福尔马林固定的石蜡包埋的组织切片上使用具有所标明的相应荧光标记物的BAC进行FISH,分别用于SLC45A3、ERG的分裂信号分析和5’与SLC45A3以及3’与ERG的融合。图57显示了前列腺癌中5’融合配偶体FLJ35294、CANTl和DDX5的鉴定。a)通过 5’ RACE 分析鉴定到的 FLJ35294-ETV1 (PCa_54)、CANT1-ETV4(PCa_46)和DDX5-ETV4 (PCa_85)融合物的示意图。框中的数字表示外显子。框上的数字指示每个外显子的最后一个碱基。非翻译区用较浅的阴影显示(FLJ35294是预测的具有未表征的基因结构的转录物)。b)前列腺癌中FLJ35294、CANT1和DDX5基因与28个其他癌症类型相比的表达图,所述其他癌症类型是基于Oncomine数据组中获取的国际基因组联盟(InternationalGenomic Consortium) expOdata 组。图58 显示了通过 FISH 验证 FLJ35294:ETV1、CANT1:ETV4 和 DDX5:ETV4 融合物。a)用作间期FISH探针、5’和3,位于ETV1、ETV4、FLJ5294和CANTl的BAC的示意图。b-d)在福尔马林固定的石蜡包埋的组织切片上使用具有所标明的相应荧光标记物的BAC进行FISH,用于b)ETVl和ETV4的分裂信号测定,c)5’融合配偶体的分裂信号测定以及d)5’配偶体与ETVl或ETV4的融合。分裂信号由箭头标出,融合的信号用黄色箭头标出。图59显示了前列腺癌中FLJ35294和CANTl基因座的雄激素调控和DDX5:ETV4融合蛋白的表征。a)通过QPCR测定了良性前列腺和对FLJ35294-ETV1、CANT1-ETV4、DDX5-ETV4或SLC45A3:ERG阳性的前列腺癌病例中ERG、ETV1和ETV4的表达。b)将LNCaP细胞剥夺激素48小时,用R1881或乙醇对照处理,并通过Q-PCR测定FLJ35294、CANT1和DDX5转录物的表达。c)通过染色质免疫沉淀(ChIP)分析评估相应基因座处的AR富集值。d)上图,通过DDX5的I到102位氨基酸与ETV4的65到484位氨基酸融合指示的DDX5-ETV4融合蛋白的示意图。中图,通过用PCDNA3. 2-DDX5-ETV4表达构建物瞬时转染的HEK293细胞的免疫印迹分析,检测带有FLAG标签的DDX5-ETV4融合蛋白。下图,在源自于带有DDX5-ETV4基因融合体(PCa_85)的患者的组织裂解液中检测内源DDX5-ETV4融合蛋白(57kDa)。
定义为了便于理解本发明,下面对一些术语和词组进行定义当在本文中使用时,术语“基因融合体”是指嵌合的基因组DNA、嵌合的信使RNA、由第一个基因的至少一部分与第二个基因的至少一部分融合产生的截短蛋白或嵌合蛋白。基因融合体不必包括全部基因或基因外显子。当在本文中使用时,术语“在癌症中上调的基因”是指与其他组织中的水平相比,在癌症(例如前列腺癌)中以更高水平表达(例如mRNA或蛋白表达)的基因。在某些实施方案中,在癌症中上调的基因的表达水平比在其他组织中的表达水平高至少10 %、优选至少25 %、更优选至少50 %、更加优选至少100 %、更加优选至少200 %、最优选至少300 %。 在某些实施方案中,在前列腺癌中上调的基因是“雄激素调控基因”。当在本文中使用时,术语“在前列腺组织中上调的基因”是指与其他组织中的水平相比,在前列腺组织中以更高水平表达(例如mRNA或蛋白表达)的基因。在某些实施方案中,在前列腺组织中上调的基因的表达水平比在其他组织中的表达水平高至少10%、优选至少25 %、更优选至少50 %、更加优选至少100 %、更加优选至少200 %、最优选至少300 %。在某些实施方案中,在前列腺组织中上调的基因只在前列腺组织中表达。当在本文中使用时,术语“高表达启动子”是指一种启动子,当其与基因融合时,弓丨起基因在特定组织(例如前列腺)中的表达水平与该基因不与所述高表达启动子融合时的表达水平相比更高(例如高至少10%、优选至少25%、更优选至少50%、更加优选至少100%,更加优选至少200%、最优选至少300%的水平)。在某些实施方案中,高表达启动子是来自于雄激素调控基因或持家基因(例如HNRPA2B1)的启动子。当在本文中使用时,术语“转录调控区”是指包含有调节(例如上调或下调)基因表达的序列的基因区域。在某些实施方案中,基因的转录调控区包含基因的非编码上游序列,也称为5’非翻译区(5,UTR)。在其他实施方案中,转录调控区含有位于基因编码区内或内含子内的序列(例如增强子)。当在本文中使用时,术语“雄激素调控基因”是指其表达受雄激素(例如睾酮)诱导或抑制的基因或基因部分。雄激素调控基因的启动子区可以包含“雄激素响应元件”,其与雄激素或雄激素信号传导分子(例如下游信号传导分子)相互作用。当在本文中使用时,术语“检测”可以描述发现或分辨的一般性行动或可检测标记组合物的特别观察。当在本文中使用时,术语“抑制基因融合体的至少一种生物活性”是指任何药剂通过直接接触基因融合体蛋白、接触基因融合体mRNA或基因组DNA、引起基因融合体多肽的构象变化、降低基因融合体蛋白水平或干扰基因融合体与信号传导配偶体的相互作用、以及影响基因融合体靶基因的表达,从而降低了本发明的基因融合体的任何活性(例如包括但不限于本文描述的活性)。抑制还包括通过拦截上游信号传导分子来间接调控基因融合体生物活性的分子。当在本文中使用时,术语“siRNA”是指小干扰RNA。在某些实施方案中,siRNA包含约18-25个核苷酸长的双链体或双链区;siRNA经常在每条链的3’末端包含约2到4个未配对的核苷酸。siRNA的双链体或双链区的至少一条链与靶RNA分子基本上同源或基本上互补。与靶RNA分子互补的链是“反义链”;与靶RNA分子同源的链是“有义链”,其也与siRNA反义链互补。siRNA还可以包含其他序列;这些序列的非限制性实例包括连接序列或环,以及茎和其他折叠结构。siRNA似乎在引发无脊椎动物和脊椎动物中的RNA干扰和引发植物中转录后基因沉默期间的序列特异性RNA降解中,起到关键中介的作用。术语“RNA干扰”或“RNAi ”是指通过siRNA来沉默或降低基因表达。它是动物和植物中序列特异性的转录后基因沉默过程,由在双链区中与被沉默基因的序列同源的siRNA启动。该基因对于生物体来说可以是内源或外源的,可以整合存在于染色体中或存在于不整合到基因组中的转染载体中。基因的表达被部分或完全抑制。也可以考虑RNAi来抑制靶RNA的功能;靶RNA的功能可以是完全的或部分的。当在本文中使用时,术语“癌症阶段”是指癌症发展水平的定性或定量评估。用于确定癌症阶段的标准包括但不限于肿瘤的大小和转移程度(例如局限性或远处)。当在本文中使用时,术语“基因转移系统”是指将包含核酸序列的组合物递送到细胞或组织的任何手段。例如,基因转移系统包括但不限于载体(例如反转录病毒、腺病毒、 腺相关病毒和其他基于核酸的递送系统)、裸核酸的微注射、基于聚合物的递送系统(例如基于脂质体和基于金属粒子的系统)、基因枪注射等。当在本文中使用时,术语“病毒基因转移系统”是指包含病毒元件(例如完整病毒、修饰病毒和病毒组分例如核酸或蛋白)以便于将样品递送到所需细胞或组织的基因转移系统。当在本文中使用时,术语“腺病毒基因转移系统”是指包含属于腺病毒科的完整或修改病毒的基因转移系统。当在本文中使用时,术语“位点特异性重组靶序列”是指提供了重组因子的识别序列和发生重组的位置的核酸序列。当在本文中使用时,术语“核酸分子”是指任何含核酸的分子,包括但不限于DNA或RNA。该术语涵盖了包含DNA和RNA的任何已知碱基类似物的序列,所述碱基类似物包括但不限于4-乙酰胞嘧啶、8-羟基-N6-甲基腺嘌呤、氮丙啶基胞嘧啶、假异胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、次黄嘌呤、N6-异戊烯基腺嘌呤、I-甲基腺嘌呤、I-甲基假尿嘧啶、I-甲基鸟嘌呤、I-甲基次黄嘌呤、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、
3-甲基胞嘧啶、5-甲基胞嘧啶、N6-甲基腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基-氨基甲基-2-硫尿嘧啶、^ -D-甘露糖基辫苷、5’ -甲氧基羰甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲基硫代-N6-异戊烯基腺嘌呤、尿嘧啶-5-氧乙酸甲基酯、尿嘧啶-5-氧乙酸、oxybutoxos ine、假尿喃唳、辫苷、2-硫胞喃唳、5-甲基-2-硫尿喃唳、2_硫尿喃唳、4_硫尿嘧啶、5-甲基尿嘧啶、N-尿嘧啶-5-氧乙酸甲基酯、尿嘧啶-5-氧乙酸、假尿嘧啶、辫苷、
2-硫胞嘧啶和2,6- 二氨基嘌呤。术语“基因”是指包含产生多肽、前体或RNA(例如rRNA、tRNA)所需的编码序列的核酸(例如DNA)序列。多肽可以由全长编码序列或由编码序列的任一部分编码,只要全长或片段的所需活性或功能性质(例如酶活性、配体结合、信号传导、免疫原性等)得以保留即可。该术语还涵盖了结构基因的编码区和位于编码区5’和3’两个末端附近距任一端约Ikb以上的序列,以便基因对应于全长mRNA的长度。位于编码区的5’方向并存在于mRNA上的序列被称为5’非翻译序列。位于编码区3’方向或下游并存在于mRNA上的序列被称为3’非翻译序列。术语“基因”涵盖了基因的cDNA和基因组两种形式。基因的基因组形式或克隆含有被非编码序列打断的编码区,所述非编码序列被称为“内含子”或“居间区”或“居间序列”。内含子是被转录成核RNA(hnRNA)的基因区段;内含子可含有调控元件例如增强子。内含子从核或原始转录物中被移除或“剪接掉”;因此在信使RNA(mRNA)转录物中不存在内含子。在翻译过程中,mRNA起到指定新生多肽的氨基酸序列或次序的功能。当在本文中使用时,术语“异源基因”是指不在其天然环境中的基因。例如,异源基因包括来自于一个 物种而被导入另一物种的基因。异源基因还包括生物体固有的但已通过某些方式进行改变(例如突变、以多拷贝添加、与非固有调控序列相连等)的基因。异源基因与内源基因的区别在于异源基因序列典型地与自然情况下没有发现在染色体中与该基因序列有关联的DNA序列相连,或与在自然情况下没有发现的染色体部分相关联(例如基因在该基因正常不表达的基因座中表达)。当在本文中使用时,术语“寡核苷酸”是指长度短的单链多核苷酸链。寡核苷酸的长度典型小于200个残基(例如15至100之间),但是,当在本文中使用时,该术语也打算涵盖较长的多核苷酸链。寡核苷酸通常以其长度称呼。例如,24个残基的寡核苷酸被称为“24聚体”。寡核苷酸可以通过自身杂交或与其他多核苷酸杂交形成二级和三级结构。这样的结构可以包括但不限于双链体、发夹、十字形、弯曲和三链体。当在本文中使用时,术语“互补”或“互补性”被用于指称通过碱基配对规则相关联的多核苷酸(即核苷酸序列)。例如,序列“5’ -A-G-T-3’ ”与序列“3’ -T-C-A-5’ ”互补。互补性可以是“部分的”,其中只有某些核酸碱基根据碱基配对规则匹配。或者,在核酸之间也可以存在“完全”或“全部”互补性。核酸链之间的互补程度对核酸链之间的杂交效率和强度有显著影响。这在扩增反应以及依赖于核酸之间的结合的检测方法中是特别重要的。术语“同源”是指互补程度。可以存在部分同源或完全同源(即同一)。部分互补的序列是至少部分抑制完全互补的核酸分子与“基本上同源的”祀核酸杂交的核酸分子。完全互补的序列与靶序列杂交的抑制,可以在低严紧性条件下使用杂交测定方法(Southern或Northern印迹、溶液杂交等)来检测。基本上同源的序列或探针将在低严紧性条件下竞争并抑制完全同源的核酸分子与靶的结合(即杂交)。这并不是说低严紧性条件是允许发生非特异性结合的条件;低严紧性条件需要两个序列彼此的结合是特异性的(即选择性的)相互作用。非特异性结合的不存在可以通过使用基本上不互补(例如同一性低于约30%)的第二个靶来测试;在不存在非特性结合的情况下,探针将不与第二个非互补靶杂交。当用于指称双链核酸序列例如cDNA或基因组克隆时,术语“基本上同源的”是指在上述的低严紧性条件下能够与双链核酸序列的任一条或两条链杂交的任何探针。基因可以产生多种RNA,其由原始RNA转录物的差异剪接产生。cDNA是相同基因的剪接变体,将含有序列同一或完全同源的区域(表示在两个cDNA上存在相同外显子或相同外显子的部分)和完全不同一的区域(例如,表示在cDNA I上存在外显子“A”,而在cDNA2中代之以含有外显子“B”)。因为两个cDNA含有序列同一的区域,它们将都与含有在这两个cDNA上发现的序列的完整基因或基因部分所衍生的探针杂交;因此这两个剪接变体与该探针同源并彼此基本上同源。当用于指称单链核酸序列时,术语“基本上同源的”是指能够在如上所述的低严紧性条件下与单链核酸序列杂交(即与其互补的)任何探针。当在本文中使用时,术语“杂交”被用于指称互补核酸的配对。杂交和杂交强度(即核酸之间结合的强度)受到诸如下列因素的影响核酸之间的互补性程度、所涉及条件的严紧性、形成的杂交体的Tni、核酸中的G C比。在其结构中含有互补核酸配对的单个分子,被称为是“自身杂交的”。当在本文中使用时,术语“严紧性”被用于指称用于执行核酸杂交的温度、离子强度和其他化合物例如有机溶剂的存在的条件。在“低严紧性条件”下,目标核酸序列将与其完全互补序列、具有单碱基错配的序列、密切相关 的序列(例如具有90%以上同源性的序列)以及只具有部分同源性的序列(例如具有50-90%同源性的序列)杂交。在“中严紧性条件”下,目标核酸序列将只与其完全互补序列、具有单碱基错配的序列和密切相关的序列(例如具有90%以上同源性的序列)杂交。在“高严紧性条件”下,目标核酸序列将只与其完全互补序列以及(取决于条件例如温度)具有单碱基错配的序列杂交。换句话说,在高严紧性条件下,可以升高温度以便排除与具有单碱基错配的序列的杂交。当在核酸杂交的情形中使用时,“高严紧性条件”包含与下述条件等价的条件,SP当使用长度约为500个核苷酸的探针时,在42°C下、在由5XSSPE(43.8g/l NaCl、6.9g/lNaH2PO4 H2O 和 I. 85g/l EDTA,用 NaOH 将 pH 调整到 7. 4)、0. 5% SDS、5X Denhardt 试剂和100 yg/ml变性鲑鱼精子DNA构成的溶液中结合或杂交,然后在包含0. IX SSPEU.0% SDS的溶液中在42°C下清洗。当在核酸杂交的情形中使用时,“中严紧性条件”包含与下述条件等价的条件,SP当使用长度约为500个核苷酸的探针时,在42°C下、在由5XSSPE(43.8g/l NaCl、6.9g/lNaH2PO4 H2O 和 I. 85g/l EDTA,用 NaOH 将 pH 调整到 7. 4)、0. 5% SDS、5X Denhardt 试剂和100 u g/ml变性鲑鱼精子DNA构成的溶液中结合或杂交,然后在包含I. OX SSPEU. 0% SDS的溶液中在42°C下清洗。“低严紧性条件”包含与下述条件等价的条件,即当使用长度约为500个核苷酸的探针时,在 42°C下、在由 5X SSPE(43. 8g/l NaCl、6.9g/l NaH2PO4 H2O 和 I. 85g/l EDTA,用NaOH 将 pH 调整到 7. 4) ,0. 1% SDS、5X Denhardt 试剂[50X Denhardt 试剂每 500ml 含有5g Ficoll (400 型,Pharamcia)、5g BSA (级分 V ;Sigma)]和 100 u g/ml 变性鲑鱼精子 DNA构成的溶液中结合或杂交,然后在包含5X SSPE、0. 1% SDS的溶液中在42 °C下清洗。本技术领域熟知可以使用许多等价条件来构成低严紧性条件;考虑多种因素,例如探针的长度和性质(DNA、RNA、碱基组成)和靶的性质(DNA、RNA、碱基组成,存在于溶液中或固定化等)以及盐和其他组分的浓度(例如甲酰胺、硫酸葡聚糖、聚乙二醇的存在或不存在),并且可以改变杂交溶液以产生与上面列出的条件不同但是等价的低严紧性杂交条件。此外,本技术领域已知在高严紧性条件下促进杂交的条件(例如升高杂交和/或清洗步骤的温度,在杂交溶液中使用甲酰胺等)(参见上面对“严紧性”的定义)。当在本文中使用时,术语“扩增寡核苷酸”是指与靶核酸或其互补链杂交并参与核酸扩增反应的寡核苷酸。扩增寡核苷酸的实例是与模板核酸杂交并含有在扩增过程中被聚合酶延伸的3’OH末端的“引物”。扩增寡核苷酸的另一个实例是不被聚合酶延伸(例如因为它具有3’封闭末端)但是参与或促进扩增的寡核苷酸。扩增寡核苷酸可以任选包括修饰的核苷酸或类似物,或参与扩增反应但是不与靶核酸互补或不包含在靶核酸中的其他核苷酸。扩增寡核苷酸可以含有不与靶或模板序列互补的序列。例如,引物的5’区域可以包括不与靶核酸互补的启动子序列(被称为“启动子-引物”)。本技术领域的专业人员将会理解,起引物作用的扩增寡核苷酸可以被修饰以包含5’启动子序列,并因此起到启动子-引物的作用。同样,启动子-引物可以通过除去启动子序列或合成为没有启动子序列进行修饰,并仍起到引物的作用。3’封闭的扩增寡核苷酸可以提供启动子序列并用作聚合的模板(被称为“启动子提供者”)。当在本文中使用时,术语“引物”是指在纯化的限制性消化物中天然存在的或合成产生的寡核苷酸,当其被置于能够诱导与核酸链互补的引物延伸产物的合成的条件下(即在核苷酸和诱导剂例如DNA聚合酶存在下并在适合的温度和pH下)时,能够起到合成起始点的作用。引物优选为单链以使扩增效率最高,但是也可以是双链的。如果是双链的,引物在用于制备延伸产物之前首先进行处理以将其链分开。优选,引物是寡脱氧核糖核苷酸。为了在诱导剂存在下引发延伸产物的合成,引物必须足够长。引物的具体长度取决于许多因素,包括温度、引物来源和使用的方法。
当在本文中使用时,术语“探针”是指在纯化的限制性消化物中天然存在的或合成、重组或通过PCR扩增产生的寡核苷酸(即核苷酸序列),其能够与另一个目标寡核苷酸的至少一部分杂交。探针可以是单链或双链的。探针可用于检测、鉴定和分离特定基因序列。设想了在本发明中使用的任何探针可以用任何“报告分子”标记,以便可以在任何检测系统中检测,包括但不限于酶(例如ELISA以及基于酶的组织化学测定法)、荧光、放射活性和发光系统。不打算将本发明限于任何特定检测系统或标记物。术语“分离的”,当涉及核酸使用时,像“分离的寡核苷酸”或“分离的多核苷酸”,是指被鉴定并与其在天然来源中通常相伴的至少一种组分或污染物分离开的核酸序列。分离的核酸以与其在自然界中发现的形式或环境不同的形式或环境中存在。相反,未分离的核酸是以其在自然界中存在的状态被发现的核酸例如DNA和RNA。例如,给定的DNA序列(例如基因),在宿主细胞染色体上相邻基因附近被发现;RNA序列,例如编码特定蛋白的特定mRNA序列,在细胞中作为与编码大量蛋白的许多其他mRNA的混合物而被发现。但是,编码给定蛋白的分离的核酸包括,例如,在正常表达给定蛋白的细胞中处于与天然细胞中不同的染色体位置中的核酸,或侧翼带有与自然界中发现的不同的核酸序列的核酸。分离的核酸、寡核苷酸或多核苷酸可以采取单链或双链形式存在。当分离的核酸、寡核苷酸或多核苷酸将被用于表达蛋白时,所述寡核苷酸或多核苷酸将至少含有有义或编码链(即寡核苷酸或多核苷酸可以是单链的),但也可以含有有义和反义链(即寡核苷酸或多核苷酸可以是双链的)。当在本文中使用时,术语“纯化的”或“纯化”是指从样品中移除组分(例如污染物)。例如,抗体通过移除污染性非免疫球蛋白的蛋白进行纯化;它们也可以通过移除不与靶分子结合的免疫球蛋白进行纯化。移除非免疫球蛋白的蛋白和/或移除不与靶分子结合的免疫球蛋白导致样品中靶反应性免疫球蛋白的百分率增加。在另一个实例中,将重组多肽在细菌宿主细胞中表达,并通过移除宿主细胞的蛋白对多肽进行纯化;从而增加了样品中重组多肽的百分率。发明详述本发明是基于在前列腺癌中发现的复现性基因融合体。本发明提供了直接或间接检测或靶向该基因融合体的诊断、研究和治疗方法。本发明还提供了用于诊断、研究和治疗目的的组合物。I.基因融合体
本发明鉴定了指示前列腺癌的复现性基因融合体。该基因融合体是雄激素调控基因(ARG)或持家基因(HG)与ETS家族成员基因的染色体重排的结果。尽管它们有复现性,但ARG或HG与ETS家族成员基因融合的连接处可变。该基因融合体典型地包含来自ARG或HG的转录调控区的5’部分和来自ETS家族成员基因的3’部分。复现性基因融合体可用作前列腺癌的诊断标志物和临床靶。A.雄激素调控基因 受雄性激素调控的基因对于人类前列腺的正常生理功能是至关重要的。它们也造成了前列腺癌的发生和发展。已识别的ARG包括但不限于TMPRSS2,SLC45A3,HERV-K_22qll.23, C150RF21, FLJ35294, CANTI, PSA, PSMA, KLK2, SNRK, Seladin-I 和FKBP51 (Paoloni-Giacobino 等,Genomics 44:309(1997) ;Velasco 等,Endocrinology145(8) :3913(2004)))。已证实相对于其他正常人类组织,TMPRSS2(NM_005656)在前列腺上皮中高度表达(Lin 等,Cancer Research 59:4180(1999))。TMPRSS2 基因位于 21 号染色体上。该基因位于距 pter 41,750,797-41,801,948bp 处(总共 51,151bp ;负链走向)。人类 TMPRSS2 蛋白序列可见于GenBank登记号AAC51784 (Swiss蛋白登记号015393),相应的cDNA的GenBank登记号为 U75329 (也参见 Paoloni-Giacobino 等,Genomics 44 :309 (1997))。SLC45A3,也称为prostein或P501S,已经在转录物和蛋白两种水平上显示出专一在正常前列腺和前列腺癌中表达(Kalos等,Prostate 60, 246-56 (2004) ;Xu等,CancerRes 61,1563-8(2001))。通过EST分析和大规模平行测序,发现HERV_K_22qll. 23是人类内源反转录病毒元件的HERV-K家族的表达第二强的成员,并且与其他正常组织相比,在前列腺中表达最高(Stauffer等,Cancer Immun 4,2(2004))。尽管还没有描述HERV-K元件的雄激素调控,但已经显示内源反转录病毒元件对小鼠的性连锁蛋白基因C4A赋予了雄激素响应性(Stavenhagen等,Cell 55,247-54 (1988))。其他HERV-K家族成员已显示出在乳腺癌和乳腺癌细胞系中高表达并且受雌激素调控(Ono等,J Virol 61,2059-62 (1987) ;Patience等,J Virol 70,2654-7(1996) ;Wang-Johanning 等,Oncogene 22,1528-35 (2003)),并且在具有t(8;19) (pl2 ;ql3. 3)的干细胞骨髓增殖性障碍病例中,来自19号染色体上的HERV-K3 元件的序列与 FGFRl 融合(Guasch 等,Blood 101,286-8 (2003))。C150RF21,也称为D-PCA-2,最初是基于它专一在正常前列腺和前列腺癌中过表达而被分离(Weigle 等,Int J Cancer 109,882-92(2004))。FLJ35294被鉴定为“全长长日本”(full-length long Japan,FLJ)集合中被测序的人类 cDNA 的成员(Nat Genet. 2004 Jan ;36(1) :40-5. Epub 2003 Dec 21)。CANTl,也称为sSCANl,是可溶性钙活化的核苷酸酶(Arch Biochem Biophys. 2002Oct I ;406(1) :105-15)。CANTl是371个氨基酸的蛋白。可切割的信号肽产生333个残基的分泌蛋白,预测的核心分子量为37,193Da。Northern分析在各种人类组织中鉴定到转录物,包括睾丸、胎盘、前列腺和肺。在该人类的酶中没有鉴定到传统的腺苷三磷双磷酸酶保守区域或核苷酸结合结构域,表明其在新的细胞外核苷酸酶家族中的成员身份。本发明的基因融合体可以包含ARG的转录调控区。ARG的转录调控区可以包含ARG的编码或非编码区,包括启动子区。ARG的启动子区还可以包含ARG的雄激素响应元件(ARE)。具体来说,TMPRSS2的启动子区由GenBank登记号AJ276404所提供。B.持家基因持家基因是组成性表达的,并且一般在所有组织中遍在表达。这些基因编码的蛋白提供了所有细胞存活所需的基本的、必需的功能。持家基因通常在所有细胞和组织中以相同水平表达,但是具有一些变动,特别是在细胞生长和组织发育的过程中。还未确切了解人类细胞具有多少持家基因,但是大多数人估计在300-500个的范围内。已经鉴定到数百个之多的持家基因。最常见的已知基因GAPDH(甘油醛-3-磷酸脱氢酶),编码对糖酵解途径至关重要的酶。另一个重要的持家基因是白蛋白,其协助在整个身体中运输化合物。几个持家基因编码构成细胞骨架的结构蛋白,例如¢-肌动蛋白和微管蛋白。其他持家基因编码核糖体的18S或28S rRNA亚基。HNRPA2B1是遍在表达的异核核糖核蛋白的成员。其启动子已被显示是未甲基化的,并防止转基因中CMV启动子的转录沉默(Williams等,BMC Biotechnol 5,17(2005))。持家基因的示例性名单可以在例如 Trends in Genetics, 19, 362-365 (2003)中发现。C. ETS家族成员基因转录因子的ETS家族调控控制基因表达的细胞内信号传导途径。作为下游效应子,它们活化或阻遏特定靶基因。作为上游效应子,它们负责众多生长因子受体的时空表达。已经鉴定到该家族的接近30个成员,它们涉及广泛的生理和病理过程。这些成员包括但不限于ERG, ETVl (ER81), FLI I, ETSl,ETS2, ELKl,ETV6 (TELl), ETV7 (TEL2), GABP a,ELFl, ETV4(E1AF、PEA3),ETV5 (ERM), ERF,PEA3/E1AF, PU.1,ESE1/ESX, SAPl (ELK4),ETV3(METS), EWS/FLI1, ESEl, ESE2 (ELF5),ESE3, PDEF,NET(ELK3、SAP2),NERF(ELF2)和FEV0实例性的ETS家族成员序列提供在图9中。ERG(NM_004449)已被证实在前列腺上皮中相对于其他正常人类组织高表达。ERG基因位于21号染色体上。该基因位于距pter 38,675,671-38,955,488碱基对处。ERG基因总共279,817bp,为负链走向。相应的ERG cDNA和蛋白序列分别提供在GenBank登记号M17254 和 NP04440 (Swiss 蛋白登记号 P11308)中。ETVl 基因位于 7 号染色体上(GenBank 登记号 NC_000007. 11、NC_086703. 11和 NT_007819. 15)。基因位于距 pter 13,708330-13,803,555 碱基对处。ETVl 基因总计95,225bp,为负链走向。相应的ETVl cDNA和蛋白序列分别提供在GenBank登记号NM_004956 和 NP_004947 (Swiss 蛋白登记号 P50549)中。人类ETV4 基因位于 14 号染色体上(GenBank 登记号 NC_000017. 9、NT_010783. 14和 NT_086880. I)。基因位于距 pter 38,960,740-38,979,228 碱基对处。ETV4 基因总计18,488bp,为负链走向。相应的ETV4 cDNA和蛋白序列分别提供在GenBank登记号NM_001986 和 NP_01977 (Swiss 蛋白登记号 P43268)中。人类ETV5 基因位于 3 号染色体上 3q28 处(NC_000003. 10 (187309570. . 187246803))。相应的ETV5 mRNA和蛋白序列分别提供在GenBank登记号NM_004454和CAG33048中。D. ETS基因融合体包括最初鉴定的TMPRSS2:ETS基因融合体,在前列腺癌中已经鉴定到5类ETS重排(图43)。本发明不限于特定机制。事实上,对于实践本发明来说不需要理解机制。然而,设想了 ETS家族成员在癌症中通过与ARG或HG融合或插入到表达增加的基因座中而引起上调表达,为前列腺癌提供了一种机制。了解具体个体中存在的重排类型允许对癌症疗法进行定制。I.基因重排类型TMPRSS2:ETS基因融合(I类)代表了前列腺癌中ETS重排的主要类型。涉及与来自其他前列腺特异性雄激素诱导基因的非翻译区的融合(IIa类)和内源反转录病毒元件的融合(IIb类)的重排,分别例如SLC45A3和HERV-K_22qll. 23,在功能上与ETS重排中的TMRPSS2类似。与I类和II类重排中的5’配偶体相似,C150RF21在前列腺癌中显著过表达。然而,与I类和II类重排中的融合配偶体不同,C150RF21被雄激素抑制,代表了一类新 的涉及前列腺特异性雄激素抑制的5’融合配偶体的ETS重排(III类)。相反,HNRPA2B1不显示前列腺特异性表达或雄激素响应性。因此,HNRPA2B1:ETV1代表了一类新的ETS重排(IV类),其中涉及非组织特异性启动子元件的融合驱动了 ETS表达。在V类重排中,整个ETS基因重排到前列腺特异性区域。患有晚期前列腺癌的男性通常用雄激素剥夺疗法进行治疗,常常引起肿瘤消退。但是具有激素抗拒表型的癌症的进展几乎不变。因为IV类重排(例如HNRPA2B1:ETV1)由雄激素不敏感的启动子元件驱动,结果表明这些患者可能不响应抗雄激素疗法,因为这些基因融合体对雄激素剥夺没有响应性。具有III类重排的患者的抗雄激素治疗可能增加ETS融合体表达。例如,从患有激素抗拒性转移前列腺癌的患者分离到C150RF21:ETV1,在该患者中抗雄激素治疗增加了 C150RF21:ETV1表达。支持这一假说的是,LNCaP的雄激素饥饿显著降低了内源PSA和TMPRSS2的表达,对HNRPA2B1没有影响,并增加了 C150RF21的表达(图49)。这允许根据存在的融合体类型,为患有前列腺癌的男性定制疗法(例如选择雄激素阻断治疗或其他备选疗法)。前列腺癌中的多种基因重排类型表明染色体重排在常见上皮癌中的更普遍的作用。例如,在其他激素驱动型癌症中组织特异性启动子元件可以与癌基因融合,例如在乳腺癌中雌激素响应性元件与癌基因融合。此外,尽管前列腺特异性融合(i-iii、v类)在其他上皮癌中不提供生长优势并且不被选择,但涉及遍在表达基因例如HNRPA2B1的强启动子的融合体,导致癌基因遍及肿瘤类型的异常表达。总而言之,该研究支持了染色体重排在常见上皮细胞肿瘤发展中通过类似于血液癌的各种机制起作用癌。2.ARG/ETS基因融合体正如上面描述的,本发明提供了 ARG与ETS家族成员基因的融合体。示例性基因融合体序列提供在图36、51和52中。对于TMPRSS2、ERG、ETVl和ETV4来说,提供了GenBank参比序列ID,并使用2004年5月UCSC人类基因组的装配图对外显子进行比对。对于所有鉴定的融合体来说,图36提供了从TMPRSS2基因开始通过融合体到ETS家族成员基因的终止密码子的完整序列。还提供了每个已发表变体的保藏的GenBank序列。某些TMPRSS2:ERG和TMPRSS2:ETV1融合体通过TMPRSS2和ETS家族成员基因的断裂点外显子描述。例如TMPRSS2:ERGa将TMPRSS2的外显子I与ERG的外显子4到11融合,其被鉴定为TMPRSS2:ERG(1,4)。在前列腺癌中,某些基因融合体比其他的更常见。本发明鉴定到50-80%的前列腺癌具有TMPRSS2与ERG、ETVU ETV4或FLIl的复现性基因融合体。其中,50-70%是TMPRSS2-ERG,其中50% -60%来自于21号染色体上TMPRSS2与ERG基因座之间遗传信息的缺失(在下面更详细描述),5-10%是TMPRSS2-ETV1,1_2 %是TMPRSS2-ETV4,1_2%是TMPRSS2-FLI1。在开发本发明的过程中进行的实验表明,某些融合基因表达融合转录物,而其他则不表达有功能的转录物(Tomlins 等,Science, 310 :644-648 (2005) ;Tomlins 等,CancerResearch 66:3396-3400(2006))。a. ERG基因融合体如上所述,发现包含ERG的基因融合体是前列腺癌中最常见的基因融合体。在开发本发明的过程中进行的实验鉴定到位于染色体21q22. 2-3上TMPRSS2和ERG之间的显著基因组缺失。在TMPRSS2:ERG融合体阳性的PCA样品中观察到缺失。缺失出现在共有区域中,但是在该区域内显示出可变性。在Paris等以前发表的工作中(Hum. Mol. Genet. 75 :1303-13 (2004)),CGH分析在CTD-210307BAC中检测到距TMPRSS2着丝粒方向6kb的缺失。 ^ 12. 5% (9/72)的临床局限性PCA样品和33% (5/15)的转移PCA样品中观察到这些缺失。这些结果支持来自本研究的SNP阵列数据,并表明PCA缺失随着发展变得更常见,或者在倾向于发展更快的PCA中更经常鉴定到这些缺失。由于TMPRSS2:ERG重排的显著的肿瘤内均匀性,更可能这些分子亚型与不同的疾病发展特征相关联。评估了 118个临床局限性PCA病例,其中49. 2%带有ERG的重排。在60.3%的这些TMPRSS2: ERG融合体阳性病例中观察到内含子缺失。几乎所有具有显著ERG过表达的PCA样品都具有重排,并且发生过表达和重排的病例数量大致相同。使用Oncomine,其是可公开获得的基因表达数据概览,鉴定到位于常见缺失位点区域中的4个显著下调的基因(图16)。本发明不限于具体的机制。事实上,对于实践本发明来说,对机制的理解不是必需的。然而,结果表明所有PCA中几乎一半可以确定为TMPRSS2:ERG重排。这些肿瘤的绝大部分显示了内含子缺失,其根据寡核苷酸SNP阵列基因组分析在尺寸上是可变的。然而,约30-40%没有显示缺失,因此可能带有TMRPSS2与ERG的平衡易位。这种缺失程度的可变性可能与疾病发展相关,正如对于CML所观察到的。目前的研究鉴定到与肿瘤阶段和淋巴结状态的显著临床关联性。具有缺失的TMPRSS2:ERG重排肿瘤还显示出PSA生化失败率更高的趋势。在开发本发明的过程中进行的其他实验,根据在长期随访下的早期前列腺癌的观察等待组群中TMPRSS2:ERG基因融合体的存在,考察发生转移或前列腺癌特异性死亡的风险。使用92个病例估计了 TMPRSS2:ERG基因融合体的频率。在该基于群体的组群中TMPRSS2:ERG基因融合体的频率是15. 2% (14/92),低于在两个基于住院的组群中观察到的50%的频率。本发明不限于具体的机制。事实上,对于实践本发明来说,对机制的理解不是必需的。然而,TMPRSS2:ERG基因融合如列腺癌中的这种差异可能是由于民族和人种遗传差异。这些差异也可以通过在该观察等待组群与其他非基于群体的研究中相比高级别病例的百分率较低来解释。观察到TMPRSS2:ERG基因融合体与发生远距离转移和前列腺癌特异性死亡之间的显著关联性,累积发病率为3.6(P = .004,95%置信区间=I. 5至8. 9)。这些数据表明TMPRSS2:ERG基因融合前列腺癌具有具有更为浸润性的表型。进一步的实验表明,TMPRSS2:ERG基因融合体中的基因组缺失与晚期和/或转移前列腺癌相关(参见例如实施例5)。本发明还证实了雄激素能够在TMPRSS2-ERG阳性细胞系中,假设通过ARE,诱导ERG的过表达。本发明不限于具体的机制。事实上,对于实践本发明来说,对机制的理解不是必需的。然而,总起来说,结果表明ETS家族活性通过TMPRSS2上游的ARE的异常调节,可能驱动了前列腺癌发展。b. ETVl基因融合体在开发本发明的某些实施方案的过程中进行的其他研究调查了 ETVl异常表达频率与TMPRSS2:ETV1阳性前列腺癌之间的不一致性。结果证实了以前研究鉴定的TMPRSS2:ERG基因融合体是在前列腺癌中驱动ERG过表达的主要机制。然而,在三个过表达ETVl的前列腺癌中,鉴定到新的5’融合配偶体。本发明不限于具体的机制。事实上,对于 实践本发明来说,对机制的理解不是必需的。然而,对于参与ERG和ETVl融合的5’配偶体中这种不一致的原因还不清楚,然而由于TMPRSS2和ERG在21号染色体上的位置相隔约 3MB,因此它们的接近可能有利于TMPRSS2作为ERG的5’配偶体。在转基因小鼠中ETVl在雄激素调控下的过表达,在小鼠前列腺中产生高渗透性mPIN(12个中的9个,75% )。没有观察到癌的发生。这些结果支持了体外研究,其中ETVl的过表达增加了浸润良性前列腺上皮细胞,但是不足以转化,并且以前的研究表明在人类中,ETS融合可能发生在PIN向癌转变期间或前列腺癌发展的早期(Tomlins等,NatGenet 39,41-51(2007)).本发明不限于具体的机制。事实上,对于实践本发明来说,对机制的理解不是必需的。然而,设想了在人类前列腺癌发生中,ETS基因融合出现在较早病变例如失去单个NKX3-1和/或PTEN等位基因的背景中(Tomlins等,Annual Review ofPathology Mechanisms of Disease 1,243-271(2006))。此外,在没有早期发展到癌的ETVl转基因小鼠中mPIN的发生,与人类前列腺癌中这些其他早期事件的小鼠模型相似,例如 NKX3-1+/-和 PTEN+/-小鼠(Kim 等,Proc Natl Acad Sci U S A 99,2884-9 (2002);Abdulkadir 等,Mol Cell Biol 22,1495-503(2002) ;Di Cristofano 等,Nat Genet 27,222-4(2001))。因此,设想了 ARR2Pb-ETVl小鼠与这些小鼠之间的杂交将产生模拟人类前列腺癌发生中的早期事件的癌基因/肿瘤抑制物模型。为了鉴定在RWPE-ETVI中受ETVl调控的转录程序,将表达特征装载在分子概念图
(Molecular Concepts Map)-一种用于探索分子概念或生物学相关基因组集的不断增
加的集合中相互关系网络的分析框架中。除了是用于关联性分析的基因组集的最大集合之夕卜,MCM的独特之处在于计算数据库中所有基因组集之间的成对关联性,允许鉴定和显示关联概念的“富集网络”。该分析显示,在具有ETVl异常表达的前列腺癌中过表达的基因的体内特征,与没有ETS基因异常表达的癌症中相比,富集(P = 0. 003)在RWPE-ETV1细胞中过表达的基因的体外特征中(图41f),支持了体外模型的生物学关联性。更普遍来说,MCM分析鉴定到与细胞浸润相关的分子概念的网络,所述分子概念是在ETVl过表达特征中富集到的,与本报告中描述的表型效应相符。例如,特征共同富集了概念,这些概念代表了在浸润性膀胱癌中相对于浅表性膀胱移行细胞癌中过表达的基因(Modlich等,P = 2. 9E-14,Dyrskjot等,P =I. 2E-8)29,30,以及在浸润性乳腺导管癌中相对于原位导管癌中过表达的基因(Schuetz等,P = 3. 8E-13)。更直接来说,特征共同富集了 InterPro蛋白概念,所述蛋白含有“肽酶MlOA和M12B、基质蛋白酶或adamalysin结构域”(P = 8. 5E-5),其包括基质金属蛋白酶(MMP)和解联蛋白和金属蛋白酶结构域(ADAM)。 几种MMP和尿激酶纤溶酶原活化途径的成员在RWPE-ETV1细胞中过表达(图41g),这两者已知都介导浸润并据报道是ETS转录因子的直接靶。此外,“在RWPE-ETV1中过表达”这一特征,与在过表达STAT3-C癌基因的MCF-10A细胞中过表达的基因特征共有重叠之处(P = 8. 9E-14)。在该模型中,STAT3-C过表达不影响增殖,但是增加了以MMP9依赖性方式进行的浸润。该结果也与尤文氏(Ewing’ s)肉瘤中EWSRl :ETS基因融合的研究平行,所述研究证实了 EWS:FLI1的击倒或过表达影响浸润,但是不影响增殖(Smith等,Cancer Cell 9,405-16 (2006))。RWPE-ETV1特征低表达的MCM分析显示出富集了增殖相关概念(图50),表明了在FACS或增殖测定法中对细胞增殖的微妙影响不明显。本研究还论证了使用异常基因表达指导细胞遗传学研究的用途。例如,尽管存在大量核型分析、SKY和高分辨率阵列CGH研究,但在最常用的前列腺癌体外模型LNCaP中还没有报道隐蔽性 ETVl 重排(Beheshti 等,Mol Diagn 5,23-32 (2000) ;Beheshti 等,Neoplasia 3,62-9(2001) ;Gibas等,Cancer Genet Cytogenet 11,399-404(1984) ;ffatson等,Hum Genet 120,795-805 (2007) ;Pang 等,Prostate 66,157-72 (2006) ;Murillo 等,Genes Chromosomes Cancer 45,702-16 (2006) ;Shi 等,Prostate 60,257-71 (2004);Takaha 等,Cancer Res 62,647-51(2002) ;Strefford 等,Cancer Genet Cytogenet 124,112-21 (2001) ;Thalmann 等,Cancer Res 54, 2577-81 (1994)) 同样地,TMPRSS2:ERG 融合往往由21q上TMPRSS2与ERG之间的染色体内缺失引起,其不能通过核型分析检测。同样,本文中鉴定的HNRPA2B1:ETV1融合也通过跨幅约15MB的染色体内缺失产生。这些结果表明在其他常见上皮癌中可能发生癌基因活化的隐蔽性重排和染色体内缺失。C.ETV4基因融合体进行了实验以审查在Oncomine数据库的前列腺癌情况研究中监测到的所有ETS家族成员的表达(Rhodes等,同上)。从两项研究一项分析大体解剖组织的情况(Lapointe等,同上)(图7A)、另一项分析激光捕获显微切割(LMC)组织1(图7B)的情况的每一项中,在单一前列腺癌病例中鉴定到ETS家族成员ETV4的显著过表达。发现在癌性组织中ETV4与TMPRSS2融合。d.ETV5基因融合体其他实验鉴定到TMPRSS2:ETV5和SLC45A3:ETV5基因融合体(实施例20)。发现ETV5在前列腺癌样品中具有异常表达,并随后发现其存在于基因融合体中。3.HG/ETS基因融合体其他实验鉴定了前列腺癌中的FINRPA2B1:ETV1基因融合体。FINRPA2B1不显示前列腺特异性表达或雄激素调控,并且反倒是在所有肿瘤类型中强烈表达。FINRPA2B1编码遍在表达的异型核核糖核蛋白的成员,并且其启动子与其他持家基因具有结构相似性(Antoniou 等,Genomics 82,269-79 (2003))。此外,已显示 FINRPA2B I 启动子未被甲基化,并在转基因中阻止CMV启动子的转录沉默(Williams等,BMC Biotechnol 5,17 (2005) ) 因此,HNRPA2B1:ETV1代表了常见上皮癌中一类新的基因融合体,其中非组织特异性启动子元件驱动癌基因的表达。尽管MPRSS2:ETS融合体在功能上类似于B细胞恶性肿瘤中的IGH-MYC重排,但HNRPA2B1:ETVl更类似于急性粒细胞白血病中的inv(3) (q21q26)和t (3 ;3) (q21 ;q26),它们被认为导致将EVlI置于组成性表达的RPNl基因的增强子元件控制之下(Suzukawa 等,Blood 84,2681-8 (1994) ;Wieser 等,Leuk Lymphoma 43,59-65(2002))。设想了其他常见上皮癌由组织特异性启动子元件驱动,例如乳腺癌中与癌基因融合的雌激素响应性元件。此外,尽管在本文中鉴定到的前列腺特异性融合体(例如SLC45A3:ETV1)在其他上皮癌中不提供生长优势,但设想包含遍在表达基因例如HNRPA2B1的强启动子的融合体能够引起跨肿瘤类型的癌基因的异常表达。在本文中鉴定到的FINRPA2B1:ETV1融合通过跨度约为15MB的染色体内缺失产生。这些结果表明,在其他常见上皮癌中可能发生癌基因活化的隐蔽型重排和染色体内缺失。II.抗体本发明的基因融合体蛋白、包括其片段、衍生物和类似物,可以用作免疫原来产生可用于下面描述的诊断、研究和治疗方法的抗体。抗体可以是多克隆或单克隆、嵌合、人源化、单链的或Fab片段。本技术领域的普通专业人员已知的各种程序可用于生产和标记这 样的抗体和片段。参见例如Burns主编的《免疫化学方案》(Immunochemical Protocols)第三版,Humana Press (2005) ;Harlow和Lane,《抗体实验室指南》(Antibodies :A LaboratoryManual), Cold Spring Harbor Laboratory(1988) ;Kozbor 等,Immunology Today 4:72(1983) ;K6hler和 Milstein,Nature 256:495(1975)。利用截短的 ETS 家族成员蛋白或嵌合蛋白与其相应的天然蛋白之间的差异的抗体或片段,是特别优选的。III.诊断应用ARG或HG与ETS家族成员基因的融合可以作为DNA、RNA或蛋白质检测。最初,基因融合体可以作为具有来自ARG或HG的转录调控区的5’部分和来自ETS家族成员基因的3’部分的基因组DNA的染色体重排被检测。在转录后,基因融合体可以作为具有来自ARG或HG的转录调控区的5’部分和来自ETS家族成员基因的3’部分的嵌合mRNA被检测。在翻译后,基因融合体可以作为由ARG或HG的转录调控区与ETS家族成员基因融合所产生的氨基端截短的ETS家族成员蛋白、具有来自ARG或HG的转录调控区的氨基端部分和来自ETS家族成员基因的羧基端部分的嵌合蛋白、或上调但在其他方面没有差别的天然ETS家族成员蛋白被检测。截短的ETS家族成员蛋白和嵌合蛋白可能在氨基酸序列、翻译后加工和/或二级、三级或四级结构方面与其相应的天然蛋白不同。这样的差别,如果存在的话,可用于鉴定基因融合体的存在。检测的具体方法在下文更详细描述。本发明提供了基于DNA、RNA和蛋白质的诊断方法,直接或间接检测基因融合体。本发明还提供了用于诊断目的的组合物和试剂盒。本发明的诊断方法可以是定性或定量的。定量诊断方法可用于例如通过截止值或阈值水平区别进展缓慢和蔓延性癌症。当适用时,定性或定量诊断方法也可以包括靶、信号或中间物(例如通用引物)的扩增。初始测定可以证实基因融合体的存在,但是不能鉴定具体的融合。如果需要,然后进行二级测定,以确定具体融合的身份。二次测定可以使用与初始测定不同的检测技术。本发明的基因融合体可以与其他标志物一起以多路或组的格式检测。标志物根据它们单独或与基因融合体相组合的预测价值进行选择。示例性前列腺癌标志物包括但不限于AMACR/P504S(美国专利 6, 262, 245) ;PCA3(美国专利 7, 008, 765) ;PCGEM1(美国专利 6,828,429) ;prostein/P501S、P503S、P504S、P509S、P510S、前列腺酶 /P703P、P710P (美国专利公布No. 20030185830);以及在美国专利5,854,206和6,034,218和美国专利公布No. 20030175736中所公开的,上述每个文献在此以其全文引为参考。用于其他癌症、疾病、感染和代谢病症的标志物也可考虑包含在多路的组格式中。本发明的诊断方法也可以参考将特定基因融合与疾病的阶段、蔓延性或发展或者转移的存在或风险相关联的数据进行修改。最终,由本发明方法提供的信息将帮助医生为特定患者选择最佳治疗过程。A.样品任何怀疑含有基因融合体的患者样品可以按照本发明的方法进行测试。作为非限制性的实例,样品可以是组织(例如前列腺活检样品或通过前列腺切除术获得的组织样品)、血液、尿液、精液、前列腺分泌物或其级份(例如血浆、血清、尿液上清液、尿液细胞沉淀物或前列腺细胞)。尿液样品优选在仔细的直肠指诊(DRE)后立即进行,所述直肠指诊引起来自前列腺的前列腺细胞脱落到尿道中。
患者的样品典型地需要初步加工,用于从样品分离或富集基因融合体或含有基因融合体的细胞。本技术领域的普通专业人员已知的各种技术可用于该目的,包括但不限于离心、免疫捕获、细胞裂解和核酸靶捕获(参见例如欧洲专利No. 1409727,在此以其全文引为参考)。B. DNA 和 RNA 检测本发明的基因融合体可以使用本技术领域的普通专业人员已知的各种核酸技术,作为基因组DNA的染色体重排或嵌合mRNA来检测,所述技术包括但不限于核酸测序、核酸杂交和核酸扩增。I.测序核酸测序技术的说明性而非限制性实例包括但不限于链终止剂(Sanger)测序和染料终止剂测序。本技术领域的普通专业人员将会认识到,因为RNA在细胞中较不稳定并且更易受核酸酶攻击,因此在实验上通常在测序前将RNA反转录成DNA。链终止剂测序使用修饰的核苷酸底物,利用了 DNA合成反应的序列特异性终止。在模板DNA的特定位点处,通过使用与模板该区域处互补的短的放射活性或其他标记的寡核苷酸来引发延伸。寡核苷酸引物使用DNA聚合酶、标准的四种脱氧核苷酸碱基以及低浓度的一种链终止核苷酸——最常用为双脱氧核苷酸进行延伸。该反应在四个独立的试管中重复,每个试管取一种碱基轮流作为双脱氧核苷酸。链终止核苷酸被DNA聚合酶的有限掺入,产生了一系列仅在使用特定双脱氧核苷酸的位置处被终止的相关DNA片段。对于每个反应试管,将片段在板状聚丙烯酰胺凝胶或填充有粘稠聚合物的毛细管中通过电泳按大小进行分离。当从凝胶顶部向底部扫描时,通过读取那个泳道产生来自于标记引物的可视化标志,来确定序列。或者,染料终止剂测序对终止剂进行标记。通过将每种双脱氧核苷酸链终止剂用在不同波长处发射荧光的不同荧光染料标记,可以在单个反应中执行完全测序。2.杂交核酸杂交技术的说明性而非限制性实例包括但不限于原位杂交(ISH)、微阵列和Southern 或 Northern 印迹。原位杂交(ISH)是一种杂交类型,其使用标记的互补DNA或RNA链作为探针,定位组织部分或切片中的特定DNA或RNA序列(原位),或者如果组织足够小,则定位整个组织中(整装制片ISH)的特定DNA或RNA序列。DNA ISH可用于确定染色体的结构。RNA ISH被用于测量和定位组织切片或整装制片中的mRNA和其他转录物。通常对样品细胞和组织进行处理,以将靶转录物固定在位并增加探针的接近。将探针与靶序列在升高的温度下杂交,然后洗掉过量的探针。使用放射自显影、荧光显微术或免疫组织化学,分别对组织中使用放射性、荧光或抗原标记的碱基所标记的探针进行定位和定量。ISH也可以使用两种或以上用放射活性或其他非放射性标记物标记的探针,以同时检测两种或以上的转录物。a. FISH在某些实施方案中,使用荧光原位杂交(FISH)检测融合序列。用于本发明的优选FISH测定法利用了细菌人工染色体(BAC)。它们已被广泛用于人类基因组测序计划(参见 Nature 409 :953-958 (2001)),并且可以通过经销商获得含有特定BAC的克隆,所述经销者可以通过许多来源例如NCBI来定位。来自人类基因组的每个BAC克隆已给出了明确鉴别它的参考名称。这些名称可用于寻找相应的GenBank序列以及从经销商订购克隆的拷贝。在某些实施方案中,检测分析方法是利用了针对ETVl的探针(例如bacRPl 1-692L4)、一组针对c-ERG: t-ERG分裂物的探针(例如bac RPl 1-24A11和作为用于t-ERG RP11-372017或RP11-137J13的探针)的FISH测定法。在其他实施方案中,FISH测定法通过用一组探针检测ETVl缺失或扩增来进行,其中一种探针跨越ETVl基因座(例如bac RP11-692L4),另一种探针与7号染色体杂交(例如染色体着丝粒上的探针)。在其他实施方案中,方法通过使用一组探针检测ERG缺失或扩增来进行,其中一种探针跨越ERG基因座(例如bac RP11-476D17),另一种参比探针位于21号染色体上(例如 PR11-32L6 ;RP11-752M23 ;RP11_1107H21 ;RP11_639A7 或 RP11-1077M21)。在另一个实施方案中,方法通过使用一组探针检测TMPRSS2缺失/扩增来进行,其中一种探针跨越 TMPRSS2(例如 RP11-121A5 ;RP11_120C17 ;PR11_814F13 ;或 RR11-535H11)基因座,另一种参比探针位于 21 号染色体上(例如 PR11-32L6 ;RP11-752M23 ;RP11_1107H21 ;RP11_639A7或RP11-1077M21)。在某些实施方案中,方法还包含使用选自但不限于RP11-121A5、RP11-120C17、PR11-814F13 和 RR11-535H11 的探针进行杂交。本发明还提供了在人类前列腺细胞、人类前列腺组织上或所述人类前列腺细胞或人类前列腺组织周围的流体上进行FISH测定的方法。在某些实施方案中,测定方法包含杂交步骤,其使用选自但不限于下列的探针RP11_372017、RP11-137J13、RP11-692L4、RP11-476D17、PR11-32L6、RP11-752M23、RPl卜 1107H21、RP11-639A7、RP11-1077M21、RP11-121A5、RP11-120C17、PR11-814F13 和 RR11-535H11。可用于FISH方案中检测与本发明相关的重排的具体BAC克隆如下 为了检测ETV1-TMPRSS2融合,可以使用一种跨越ETVl的探针和一种跨越TMPRSS2基因座的探针用于ETVl 的 BAC :RP11_692L4用于TMPRSS2 的 BAC :RP11_121A5,(RP11-120C17,PR11-814F13,RR11-535H11) 使用针对c-ERG: t-ERG分裂物的探针组检测ERG易位用于c-ERG 的 BAC :RP11_24A11用于t-ERG 的 BAC :RP11-372017,RP11-137J13
使用探针组检测ETVl缺失/扩增,一种探针跨越ETVl基因座,一种参比探针位于7号染色体上用于ETVl 的 BAC :RP11_692L4使用探针组检测ERG缺失/扩增,一种探针跨越ERG基因座,一种参比探针位于21号染色体上用于ERG 的 BAC :RP11_476D17用于21号染色体上的参比探针的BAC * 使用探针组检测TMPRSS2缺失/扩增,一种探针跨越TMPRSS2基因座,一种参比探针位于21号染色体上用于TMPRSS2 的 BAC :RP11_121A5,(RP11-120C17,PR11-814F13,RR11-535H11) 用于21 号染色体上的参比探针的 BAC PR11-32L6, RP11-752M23,RP11-1107H21,RP11-639A7, (RP11-1077M21)。用于检测导致TMPRSS2与ERG之间融合的缺失突变的最优选探针是RP11-24A11和RP11-137J13。将这些探针或如上所述的探针,用适合的荧光或其他标志物标记,然后使用在杂交中。本文中提供的实施例部分提出了有效测量缺失的具体方案,但本技术领域的专业人员将会认识到该测定方法的许多变体可以同样好地使用。具体方案在本技术领域中是公知的,并可以容易地改造以适应于本发明。与方法相关的指导可以从许多参考文献获得,包括《原位杂交医学应用》(In situ Hybridization Medical Applications)(G. R. Coulton 和 J. de Belleroche 主编),Kluwer Academic Publishers, Boston (1992);《神经生物学中的原位杂交,方法学改进》(In situ Hybridization In NeurobioloRY Advances in MethodoloRy) (J. H. Eberwine、K. L. Valentino 和 J. D. Barchas 主编),Oxford University Press Inc. , England (1994);《原位杂交实用方法》(In situHybridization A Practical Approach)(D. G. Wilkinson 主编),Oxford UniversityPress Inc. , England (1992) ;Kuo 等,Am. J. Hum. Genet. 49 :112-119 (1991) ;Klinger,等,Am. J. Hum. Genet. 51 :55-65 (1992);以及 Ward 等,Am. J. Hum. Genet. 52 :854-865 (1993)。还存在可商购并为执行FISH测定法提供方案的试剂盒(可以从例如Oncor,Inc.,Gaithersburg,MD获得)。为方法学提供指导的专利包括美国专利5,225,326,5, 545,524、6,121,489和6,573,043。所有这些参考文献在此以其全文引为参考,并可以与本技术领域中相似的参考文献和本文实施例部分中提供的信息一起,用于建立便于具体实验室的程序化步骤。下面的表13显示了可用作FISH探针的其他BAC克隆。表13
其他可用于本发明方法的FISH探针显示在表16中(图46)。b.微阵列被称为微阵列的不同种类的生物测定法包括但不限于DNA微阵列(例如cDNA微阵列和寡核苷酸微阵列)、蛋白质微阵列、组织微阵列、转染或细胞微阵列、化学化合物微阵列和抗体微阵列。DNA微阵列通常被称为基因芯片、DNA芯片或生物芯片,是附着于固相表面(例如玻璃、塑料或硅芯片)上形成阵列的微小DNA斑点的集合,用于同时对数千个基因进行表达谱分析或监测其表达水平。附着的DNA区段被称为探针,在单个DNA微阵列中可以使用数千个探针。通过比较疾病和正常细胞中的基因表达,微阵列可用于鉴定疾病基因。微阵列可以使用各种技术制造,包括但不限于使用尖头针在玻璃载片上印刷;使用预制掩模进行光刻;使用动态微镜器件进行光刻;喷墨印刷;或微电极阵列上的电化学。Southern和Northern印迹法分别用于检测特定DNA或RNA序列。将从样品提取的DNA或RNA片段化,在基质凝胶上电泳分离,并转移到滤膜上。将结合有DNA或RNA的滤膜和与目标序列的互补标记探针进行杂交。检测与滤膜杂交的探针。程序的变化形式是反向Northern印迹,其中附着到膜上的底物核酸是分离的DNA片段的集合,探针是从组织提取并标记的RNA。3.扩增基因组DNA的染色体重排和嵌合mRNA在检测之前或同时可以进行扩增。核酸扩增技术的说明性而非限制性实例包括但不限于聚合酶链反应(PCR)、反转录聚合酶链反应(RT-PCR)、转录介导的扩增(TMA)、连接酶链反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。本技术领域的普通专业人员将会认识到某些扩增技术(例如PCR)需要在扩增前将RNA反转录成DNA (例如RT-PCR),而其他扩增技术直接扩增RNA (例如TMA和NASBA)。聚合酶链反应(美国专利4,683,195,4, 683, 202,4, 800, 159 和 4,965,188,在本文中各以其全文引为参考),通常为称为PCR,使用变性、引物对与相反链的退火以及引物延伸的多个循环来指数级增加靶核酸序列的拷贝数。在被称为RT-PCR的变化形式中,使用反转录酶(RT)从mRNA制造互补DNA (cDNA),然后通过PCR扩增cDNA以产生DNA的多个拷贝。对于PCR的其他各种变换形式,参见例如美国专利No. 4,683,195,4, 683,202和4,800, 159 ;Mullis 等,Meth. Enzymol. 155 :335(1987);以及 Murakawa 等,DNA 7 :287 (1988),在本文中各以其全文引为参考。转录介导的扩增(美国专利No.5,480,784和5,399,491,在本文中各以其全文引为参考),通常被称为TMA,在靶序列的多个RNA拷贝自催化产生附加拷贝的基本上恒定的温度、离子强度和PH条件下,自催化地合成靶核酸序列的多个拷贝。参见例如美国专利No. 5, 399,491和5,824,518,在本文中各以其全文引为参考。在美国专利公布No. 20060046265 (在此以其全文引为参考)中描述的变化形式中,TMA任选结合使用阻断部分、终止部分和其他修饰部分来改进TMA方法的灵敏度和准确性。连接酶链反应(Weiss,R.,Science 254 :1292 (1991),在此以其全文引为参考),通常称为LCR,使用与靶核酸相邻区域杂交的两组互补DNA寡核苷酸。DNA寡核苷酸在热变性、杂交和连接的重复循环中被DNA连接酶共价连接,产生可检测的双链连接寡核苷酸产物。链置换扩增(Walker,G.等,Proc. Natl. Acad. Sci. USA 89 :392-396(1992);美国专利No. 5,270, 184和5,455,166,在本文中各以其全文引为参考),通常被称为SDA’使用下面的循环引物序列对与靶序列的相反链退火、在存在dNTPa S的情况下延伸引物以产生双链体半硫代磷酸酯化引物延伸产物、将半修饰的限制性核酸内切酶识别位点进行核酸内切酶介导的切口、以及聚合酶介导的从切口 3’末端延伸引物来置换现有的链,并产生链用于下一轮的引物退火、切口和链置换,导致产物的几何扩增。嗜热SDA(tSDA)在基本上相同的方法中在较高温度下使用嗜热核酸内切酶和聚合酶(欧洲专利No. 0 684 315)。其他扩增方法包括例如基于核酸序列的扩增(美国专利5,130,238,在此以其全文引为参考),通常被称为NASBA ;使用RNA复制酶扩增探针分子自身的方法(Lizardi等,BioTechnol. 6 :1197(1988),在此以其全文引为参考),通常被称为QP复制酶;基于转录的扩增方法(Kwoh等,Proc. Natl. Acad. Sci. USA 86:1173(1989));以及自持续序列复制(Guatelli 等,Proc. Natl. Acad. Sci. USA 87 :1874 (1990),在本文中各以其全文引为参考)。对于已知扩增方法的进一步讨论,参见Persing, David H.,《诊断医学微生物学原理与应用》中的“体外核酸扩增技术”(“In Vitro Nucleic Acid AmplificationTechniques”, Diagnostic Medical MicrobiologyPrinciples and Applications)(Persing 等主编),pp. 51-87 (美国微生物学会(American Society for Microbiology),Washington, DC (1993))。
4.检测方法可以通过任何常规手段检测未扩增或扩增的基因融合体核酸。例如,可以通过与可检测的标记探针杂交并测量得到的杂交体来检测基因融合体。检测方法的说明性而非限制性实例描述如下。一种说明性检测方法,杂交保护测定法(HPA)包括将化学发光寡核苷酸探针(例如吖啶酯(AE)探针)与靶序列杂交,选择性水解未杂交探针上存在的化学发光标记物,并在照度计中测量从剩余探针产生的化学发光。参见例如美国专利5,283,174和Norman C. Nelson 等,《非同位素探测、印迹和测序》(Nonisotopic Probing, Blotting, andSequencing)第17章(Larry J. Kricka主编,第二版,1995,在本文中各以其全文引为参考)。另一种说明性检测方法为扩增过程提供实时定量评估。“实时地”评估扩增过程包 括在扩增反应过程中连续或周期性测定反应混合物中扩增子的量,以及使用测定值计算样品中最初存在的靶序列的量。用于测定样品中最初存在的靶序列的量的各种基于实时扩增的方法在本技术领域中是公知的。它们包括美国专利No. 6,303,305和6,541,205公开的方法,在本文中各以其全文引为参考。另一种用于测定样品中最初存在的靶序列的量、但是不基于实时扩增的方法,公开在美国专利5,710,029中,在此以其全文引为参考。 扩增产物可以通过使用各种自杂交探针进行实时检测,大部分自杂交探针具有茎环结构。对这些自杂交探针进行标记,使得它们根据探针是处于自杂交状态还是通过与靶序列杂交而处于改变的状态,发射不同的可检测信号。作为非限制性实例,“分子炬”是一类自杂交探针,其包括由连接区(例如非核苷酸接头)相连的、在预定杂交测定条件下彼此杂交的自身互补的不同区域(被称为“靶结合结构域”和“靶封闭结构域”)。在优选实施方案中,分子炬在靶结合结构域中含有长度为I至约20个碱基的单链碱基区域,并允许在链置换条件下与扩增反应中存在的靶序列杂交。在链置换条件下,有利于分子炬的两个可以完全或部分互补的互补区域之间的杂交,除非在存在靶序列的情况下,靶序列将与靶结合结构域中存在的单链区结合并置换所有或部分靶封闭结构域。分子炬的靶结合结构域和靶封闭结构域包括可检测标记物或一对相互作用标记物(例如发光剂/淬灭剂),其位置使得当分子炬自杂交时产生的信号与分子炬同靶序列杂交时产生的信号不同,从而允许在存在未杂交分子炬的情况下检测测试样品中的探针靶双链体。分子炬和各种类型的相互作用探针对公开在美国专利6,534,274中,在此以其全文引为参考。具有自身互补性的检测探针的另一个实例是“分子信标”。分子信标包括具有靶互补序列的核酸分子、在不存在扩增反应中存在的靶序列的情况下将探针保持在封闭构象中的亲和对(或核酸臂)、以及当探针处于封闭构象时相互作用的标记物对。靶序列与靶互补序列的杂交将亲和对的成员分开,从而将探针转变成开放构象。由于标记物对相互作用的降低,向开放构象的转变是可检测的,所述标记物对可以是例如荧光团和淬灭剂(例如DABCYL和EDANS)。分子信标公开在美国专利No. 5,925,517和6,150,097中,在此以其全文引为参考。其他的自杂交探针对于本技术领域的普通专业人员来说是公知的。作为非限制性的实例,具有相互作用标记物的探针结合对,例如美国专利5,928,862 (在此以其全文引为参考)中所公开的,可以适合用于本发明。用于检测单核苷酸多态性(SNP)的探针系统也可用于本发明。其他检测系统包括“分子开关”,例如在美国专利公布No. 20050042638中所公开的,在此以其全文引为参考。其他探针,例如包含嵌入染料和/或荧光染料的探针,也可用于检测本发明的扩增产物。参见例如美国专利5,814,447 (在此以其全文引为参考)。C.蛋白质检测本发明的基因融合体可以使用本技术领域的普通专业人员已知的各种蛋白质技术,作为截短的ETS家族成员蛋白或嵌合蛋白来检测,所述技术包括但不限于蛋白质测序和免疫测定法。I.测序蛋白质测序技术的说明性而非限制性的实例包括但不限于质谱和Edman降解。 原则上说,质谱能够测序任何尺寸的蛋白,但是当尺寸增加时变得更难计算。将蛋白用内切蛋白酶消化,并将得到的溶液通过高压液相色谱柱。在该柱末端,将溶液从充电至高正电势的狭小喷嘴中喷出,进入质谱仪。液滴上的电荷使它们裂成片段,直到只剩单种离子。然后将肽裂成片段并测量片段的质荷比。质谱图通过计算机分析,并通常针对以前测序的蛋白质进行比较,以便确定片段的序列。然后使用不同的消化酶重复该过程,并使用序列重叠来构建蛋白质序列。在Edman降解反应中,将待测序的妝吸附在固相表面上(例如包被有聚凝胺的玻璃纤维)。向吸附的肽加入Edman试剂苯基异硫氰酸酯(PTC)和12%三甲胺的弱碱性缓冲溶液,并与N-端氨基酸的胺基反应。然后通过加入无水的酸选择性脱开该末端氨基酸衍生物。衍生物进行异构化以产生取代的苯基硫代乙内酰脲,其可以被洗掉并通过色谱鉴定,然后重复该循环。每一步的效率约为98%,其允许可靠地测定约50个氨基酸。2.免疫测定法免疫测定法的说明而非限制性实例包括但不限于免疫沉淀、Western印迹、ELISA、免疫组织化学、免疫细胞化学、流式细胞术和免疫PCR。使用本技术领域的普通专业人员已知的各种技术(例如比色、荧光、化学发光或放射活性)进行可检测标记的多克隆或单克隆抗体,适合用于免疫测定法中。免疫沉淀是使用特异性针对抗原的抗体将该抗原从溶液中沉淀出来的技术。通过靶向据认为存在于复合物中的蛋白质,该方法可用于鉴定细胞提取液中存在的蛋白质复合物。通过最初从细菌分离的不溶性抗体结合蛋白例如A蛋白和G蛋白,从溶液中取得复合物。抗体也可以与琼脂糖凝胶珠偶联,其可以容易地从溶液中分离出来。在洗涤后,可以使用质谱、Western印迹或任何数量的用于鉴定复合物中的组分的其他方法来分析沉淀物。Western印迹或免疫印记是在组织匀浆液或提取液的给定样品中检测蛋白质的方法。它使用凝胶电泳根据质量分离变性蛋白。然后将蛋白从凝胶转出,并转移到典型为聚二氟乙烯或硝酸纤维素的膜上,在此使用特异性针对目标蛋白的抗体在膜上探测它们。结果,研究人员能够检测给定样品中的蛋白量并比较几个组之间的水平。ELISA是酶联免疫吸附测定法的简称,是检测样品中抗体或抗原的存在的生物化学技术。它利用至少两种抗体,一种特异性针对抗原,另一种与酶偶联。第二抗体引起产色或产荧光底物产生信号。ELISA的变化形式包括夹心ELISA、竞争性ELISA和ELISP0T。因为可执行ELISA来评估样品中抗原的存在或抗体的存在,它对于测定血清抗体浓度和确定抗原的存在两者来说,都是有用的工具。
免疫组织化学和免疫细胞化学是指通过组织或细胞中的抗原与其相应抗体结合的原理,分别在组织切片或细胞中定位蛋白质的方法。通过用产色或荧光标签标记抗体,使得能够可视化。有色标签的典型实例包括但不限于辣根过氧化物酶和碱性磷酸酶。荧光团标签的典型实例包括但不限于荧光素异硫氰酸酯(FITC)或藻红蛋白(PE)。流式细胞术是用于计数、检测和分拣悬浮在流体流中的显微粒子的技术。它允许对流过光学/电子检测装置的单个细胞的物理和/或化学特性进行同时的多参数分析。将一束单一频率或颜色的光(例如激光)导向流体力学集中的流体流上。多个检测器瞄准液流通过光束的点;一个与光束成一直线(正向散射或FSC),几个与其垂直(侧向散射(SSC)和一个或多个荧光检测器)。每个通过光束的悬浮粒子以某种方式散射光,并且粒子中的荧光化学物质可以被激发以发射频率比光源低的光。散射光和荧光的组合被检测器获取,通过分析每个检测器处亮度的波动,每个荧光发射峰对应一个检测器,能够推导出关于每个单个粒子的物理和化学结构的各种实际情况。FSC与细胞体积相关联,SSC与粒子的密度或内部复杂程度(例如核的形状、细胞质颗粒的量和类型或膜的粗糙度)相关联。
免疫-聚合酶链反应(IPCR)利用核酸扩增技术在基于抗体的免疫测定中增加信号产生。因为不存在等同的蛋白质PCR,也就是说,蛋白质不能以与PCR过程中核酸复制相同的方式进行复制,因此增加检测灵敏度的唯一方式是通过信号放大。靶蛋白与直接或间接结合寡核苷酸的抗体结合。将未结合的抗体洗掉,并对剩余的结合抗体进行其寡核苷酸的扩增。通过使用标准的核酸检测方法包括实时方法检测被扩增的寡核苷酸,来进行蛋白质检测。D.数据分析在某些实施方案中,使用基于计算机的分析程序将检测分析法产生的原始数据(例如给定基因融合体或其他标志物的存在、不存在或量)转变成临床医生使用的预测值数据。临床医生可以使用任何适合的手段评估预测数据。因此,在某些优选实施方案中,本发明提供了进一步的优点,即可能没有在遗传学或分子生物学方面受过训练的临床医生,不需要理解原始数据。数据以其最有用的形式直接呈递给临床医生。然后临床医生能够立即使用信息以便优化对象的护理。本发明设想了能够从执行测定的实验室、信息提供者、医务人员和对象接收、处理和发送信息,或接收、处理和发送信息给执行测定的实验室、信息提供者、医务人员和对象的任何方法。例如,在本发明的某些实施方案中,从对象获得样品(例如活检或血清或尿液样品),并将其送至位于世界任何位置(例如与对象所在或最终使用信息的国家不同的国家)的谱分析服务机构(例如医学机构的临床实验室、基因组谱分析企业等)以产生原始数据。当样品包含组织或其他生物样品时,对象可以就诊于医学中心进行样品获取并将其送往谱分析中心,或对象可以自己收集样品(例如尿液样品)并将其直接送往谱分析中心。当样品包含以前测定的生物信息时,信息可以由对象直接送往谱分析服务机构(例如可以通过计算机扫描含有信息的信息卡,并使用电子通讯系统将数据发送到谱分析中心的计算机)。在谱分析服务机构接收后,对样品进行处理,并产生特异性针对对象所需的诊断或预后信息的谱分析(即表达数据)。然后将谱分析数据制备成适合于由治疗临床医生解释的格式。例如,并非提供原始表达数据,所制备的格式可以表示对象的诊断或风险评估(例如癌症存在的可能性)以及对具体治疗选项的推荐意见。数据可以通过任何适合的方法显示给临床医生。例如,在某些实施方案中,谱分析服务机构产生报告,其可以为临床医生打印(例如在护理位点)或在计算机监视器上显示给临床医生。在某些实施方案中,信息首先在护理位点或地区站进行分析。然后将原始数据送往中央处理站进行进一步分析,和/或将原始数据转变成对临床医生或患者有用的信息。中央处理站提供私密性(所有数据储存在具有统一安全协议的中央站中)、速度和数据分析的统一性的优点。然后中央处理站可以按照对象的治疗控制数据的命运。例如,使用电子通讯系统,中央处理站可以将数据提供给临床医生、对象或研究人员。在某些实施方案中,对象能够使用电子通讯系统直接访问数据。对象可以根据结果选择进一步干预或咨询。在某些实施方案中,数据被用于研究用途。例如,数据可用于进一步优化包含或消除标志物作为疾病具体状况或阶段的有用指示物。E.体内成像 本发明的基因融合体也可以使用体内成像技术检测,所述技术包括但不限于放射性核素成像、正电子发射断层扫描(PET)、计算机轴向断层扫描、X射线或磁共振成像方法、荧光检测和化学发光检测。在某些实施方案中,体内成像技术被用于使动物(例如人类或非人类哺乳动物)中癌症标志物的存在或表达可视化。例如,在某些实施方案中,使用特异性针对癌症标志物的标记抗体来标记癌症标志物的mRNA或蛋白。可以使用体内成像方法在个体中检测特异性结合和标记的抗体,所述方法包括但不限于放射性核素成像、正电子发射断层扫描、计算机轴向断层扫描、X射线或磁共振成像方法、荧光检测和化学发光检测。用于产生针对本发明的癌症标志物的抗体的方法在下文描述。本发明的体内成像方法可用于诊断表达本发明的癌症标志物的癌症(例如前列腺癌)。体内成像被用于使得指示癌症的标志物的存在可视化。这样的技术可以不使用不受欢迎的活检来进行诊断。本发明的体内成像方法也可用于为癌症患者提供预后。例如,可以检测指示癌症可能转移的标志物的存在。本发明的体内成像方法还可用于检测身体的其他部分中的转移癌。在某些实施方案中,特异性针对本发明的癌症标志物的试剂(例如抗体)被荧光标记。将标记的抗体导入对象(例如口服或肠胃外)。使用任何适合的方法检测荧光标记的抗体(例如使用在此引为参考的美国专利6,198,107中描述的装置)。在其他实施方案中,抗体被放射活性标记。使用抗体进行体内诊断在本技术领域中是公知的。Sumerdon等(Nucl. Med. Biol 17 :247-254[1990])描述了优化的抗体-螯合齐U,使用铟-111作为标记物用于肿瘤的放射免疫闪烁成像。Griffin等(J Clin One 9 631-640[1991])描述了使用该药剂在怀疑患有复发结肠直肠癌的患者中检测肿瘤。带有顺磁性离子作为磁共振成像标记物的类似试剂的应用,在本技术领域中是已知的(Lauffer,Magnetic Resonance in Medicine 22 :339-342 [1991])。使用的标记物将取决于所选的成像形式。放射性标记物例如铟-111、锝_99m或碘-131可用于平面扫描或单光子发射计算机断层扫描(SPECT)。发射正电子的标记物例如氟-19也可用于正电子发射断层扫描(PET)。对于MRI来说,可以使用顺磁性离子例如钆(III)或锰(II)。半衰期为I小时至3. 5天的放射性金属可用于结合抗体,例如钪-47(3. 5天)、镓-67 (2. 8天)、镓-68 (68分钟)、锝_99m (6小时)和铟-111 (3. 2天),其中镓-67、锝_99m和铟-111优选用于Y相机成像,镓-68优选用于正电子断层扫描。使用这类放射性金属来标记抗体的有用方法是利用双功能螯合剂,例如二乙烯三胺五乙酸(DTPA),正如由例如 Khaw 等(Science 209 :295[1980])对 In-Ill 和 Tc_99m 的描述,以及Scheinberg等(Science 215 1511 [1982])的描述。也可以使用其他螯合剂,但是I-(对羧基甲氧基苯甲基)EDTA和DTPA的羧基碳酐是有利的,因为使用它们允许结合而基本不影响抗体的免疫反应性。将DPTA与蛋白偶联的另一种方法是使用DTPA的环状酐,如Hnatowich等(Int.J. Appl. Radiat. Isot. 33 327[1982])对于用In-Ill标记白蛋白所描述的,但是其可适用于标记抗体。用Tc-99m标记抗体而不使用DPTA进行螯合的适合方法是Crockford等的亚锡法(pretinning method)(美国专利4, 323, 546,在此引为参考)。用Tc_99m标记免疫球蛋白的优选方法是Wong等(Int. J. Appl :Radiat. Isot,29 251 [1978])描述的用于血浆蛋白的方法,以及最近由Wong等(J. Nucl. Med.,23 : 229[1981])成功应用于标记抗体的方法。在放射性金属与特异性抗体结合的情况下,同样希望将尽可能高比例的放射性标记物导入抗体分子而不破坏其免疫特异性。为了确保抗体上的抗原结合位点得到保护,可以通过在本发明的特定癌症标志物存在下执行放射性标记以获得进一步改进。在标记后分尚抗原。在其他实施方案中,使用体内生物光子成像(Xenogen, Almeda, CA)进行体内成像。该实时体内成像利用萤光素酶。将萤光素酶基因掺入到细胞、微生物和动物中(例如作为与本发明的癌症标志物的融合蛋白)。当活化时,它引起发光反应。使用CCD相机和软件捕获图像并对其进行分析。F.组合物和试剂盒在本发明的诊断方法中使用的组合物包括但不限于探针、扩增寡核苷酸和抗体。特别优选的组合物只有在ARG或HG与ETS家族成员基因融合时才检测到产物。这些组合物包括单个标记探针,其包含与来自ARG或HG的转录调控区的5’部分与来自ETS家族成员基因的3’部分融合的连接处杂交(即跨越基因融合体连接处)的序列;一对扩增寡核苷酸,其中第一个扩增寡核苷酸包含与ARG或HG的转录调控区杂交的序列,第二个扩增寡核苷酸包含与ETS家族成员基因杂交的序列;针对由ARG或HG的转录调控区与ETS家族成员基因的融合所产生的氨基端截短的ETS家族成员蛋白的抗体;或针对具有来自于ARG或HG的转录调控区的氨基端部分和来自ETS家族成员基因的羧基端部分的嵌合蛋白的抗体。然而,其他有用的组合物包括一对标记探针,其中第一个标记探针包含与ARG或HG的转录调控区杂交的序列,第二个标记探针包含与ETS家族成员基因杂交的序列。任何这些组合物,单独地或与本发明的其他组合物组合,可以提供为试剂盒的形式。例如,单个标记探针和一对扩增寡核苷酸可以提供在试剂盒中,用于本发明的基因融合体的扩增和检测。试剂盒还可以包含适合的对照和/或检测试剂。本发明的探针和抗体组合物也可以提供为阵列的形式。IV.预后应用在本发明的开发过程中进行的实验证实了本发明的基因融合体与前列腺癌患者的预后之间的密切关联性(参见例如下面的实施例5)。特别是在融合体由位于TMPRSS2与ERG之间的基因组DNA缺失而产生的情况下,发现癌细胞表现出更具蔓延性的表型。因此,在某些实施方案中,能够检测其中存在居间DNA缺失的TMPRSS2与ERG之间基因融合体的测定方法,可用于提供预后并帮助医生决定适合的治疗策略。例如,在某些实施方案中,具有该特定重排的肿瘤患者进行更强烈的治疗,因为他们的预后比缺乏重排的患者明显更糟。任何测定方法都可用于确定细胞是否呈现出具有上面讨论类型(例如上面描述)的重排。尽管本发明最优选用于获得前列腺癌患者的预后,但也可以检测其他上皮细胞肿瘤,并可以使用本文描述的测定方法和探针确定来自这些肿瘤的癌细胞是否具有可能使其特别具有蔓延性、即可能具有浸润性和转移的重排。可以使用这种程序表征的肿瘤的实例包括乳腺、肺、结肠、卵巢、子宫、食道、胃、肝、肾、脑、皮肤和肌肉的肿瘤。测定方法对于研究人员在细胞系和动物模型中研究这些癌症来说,也是有价值的。
在本发明的开发过程中进行的其他实验证实,通过测定样品以确定是否存在位于缺失区域中的一种或多种基因表达的丧失,能够检测染色体缺失。例如,在TMPRSS2与ERG之间的融合体形成中典型地缺失约2. 8兆碱基的基因组DNA,并且当这种情况发生时位于该区域中的至少四个基因丢失。它们是ETS2基因、WRB基因、PCP4基因和MXl基因。它们中的一个或多个在癌性前列腺细胞中的降低表明预后不良。因此,在某些实施方案中,本发明提供了测定上皮细胞中指示癌症相关重排的染色体DNA缺失的方法,所述方法包含使用至少第一和第二个探针进行FISH测定,其中第一个探针长度为至少15个核苷酸(例如至少15、20、35等)、与第一种荧光标记物相连、并且在严紧条件下与人类基因组中的第一个序列杂交,其中所述第一个序列包括雄激素响应性基因(例如TMPRSS2基因)或ETS家族基因(例如ERG基因、ETVl基因或ETV4基因)的至少一部分;并且第二个探针长度为至少15个核苷酸、与不同于第一种荧光标记物的第二种荧光标记物相连、并且在严紧条件下与人类基因组中不同于第一个序列并包括雄激素响应性基因(例如TMPRSS2基因)或ETS家族基因(例如ERG基因、ETVI基因或ETV4基因)的至少一部分的第二个序列杂交。在其他实施方案中,本发明提供了测定上皮细胞(例如前列腺细胞)中指示癌症相关重排的基因组DNA缺失的方法,所述方法包含获得上皮细胞的测试样品;测定上皮细胞样品以确定一种或多种基因的表达水平,所述基因选自包括但不限于ETS2、WRB、PCP4和MXl ;将步骤b)中测定的表达水平与对照样品中的水平进行比较;以及得出结论,如果在测试样品中测定到的基因表达水平低于对照样品,则缺失发生。V.药物筛选应用在某些实施方案中,本发明提供了药物筛选测定法(例如筛选抗癌药物)。本发明的筛选方法利用了使用本发明的方法鉴定到的癌症标志物(例如包括但不限于本发明的基因融合体)。例如,在某些实施方案中,本发明提供了改变(例如降低)基因融合体表达的化合物的筛选方法。化合物或药剂可以通过例如与启动子区相互作用而干扰转录。化合物或药剂可以干扰从融合体产生的mRNA (例如通过RNA干扰、反义技术等)。化合物或药剂可以干扰融合体生物活性的上游或下游的途径。在某些实施方案中,候选化合物是针对癌症标志物的反义或干扰RNA药剂(例如寡核苷酸)。在其他实施方案中,候选化合物是特异性结合本发明的癌症标志物调控物或表达产物并抑制其生物功能的抗体或小分子。在一种筛选方法中,通过将化合物与表达癌症标志物的细胞相接触,然后测定候选化合物对表达的影响,来评估候选化合物改变癌症标志物表达的能力。在某些实施方案中,通过检测细胞所表达的癌症标志物mRNA的水平,来测定候选化合物对癌症标志物基因的表达的影响。mRNA表达可以通过任何适合的方法检测。在其他实施方案中,通过测量癌症标志物编码的多肽的水平来测定候选化合物对癌症标志物基因的表达的影响。所表达的多肽的水平可以使用任何适合的方法来测量,包括但不限于本文公开的方法。
具体来说,本发明提供了用于鉴定与本发明的癌症标志物结合、对例如癌症标志物表达或癌症标志物活性具有抑制(或刺激)效应、或对例如癌症标志物底物的表达或活性具有刺激或抑制效应的调节物、即候选或测试化合物或药剂(例如蛋白、肽、肽模拟物、类肽、小分子或其他药物)的筛选方法。由此鉴定的化合物可用于在治疗方案中直接或间接调节靶基因产物(例如癌症标志物基因)的活性、阐明靶基因产物的生物功能、或鉴定破坏正常靶基因相互作用的化合物。抑制癌症标志物的活性或表达的化合物可用于增殖性紊乱例如癌症、特别是前列腺癌的治疗。在一个实施方案中,本发明提供了用于筛选候选或测试化合物的测定方法,所述化合物是癌症标志物蛋白或多肽或其生物活性部分的底物。在另一个实施方案中,本发明提供了用于筛选候选或测试化合物的测定方法,所述化合物结合癌症标志物蛋白或多肽或其生物活性部分,或调节它们的活性。 本发明的测试化合物可以使用本技术领域已知的组合文库方法中的大量方法的任一种来获得,所述文库包括生物文库、类肽文库(具有肽的功能性但是带有新的非肽骨架的分子的文库,所述骨架对酶降解具有抗性但仍然保留生物活性;参见例如Zuckennann等,J. Med. Chem. 37 :2678-85 [1994])、空间可寻址平行固相或溶液相文库、需要去褶合的合成文库方法、“一颗珠子一种化合物”的文库方法、以及使用亲和层析选择的合成文库方法。生物文库和类肽文库方法优选用于肽文库,而其他四种方法适用于肽、非肽低聚物、或化合物的小分子文库(Lam(1997) Anticancer Drug Des. 12 :145)。用于合成分子文库的方法的实例可以在本技术领域中发现,例如在下述文献中Deffitt 等,Proc. Natl. Acad. Sci. U. S. A. 90 :6909 [1993] ;Erb 等,Proc. Nad. Acad. Sci.USA 91 :11422 [1994] ;Zuckermann 等,J. Med. Chem. 37 :2678 [1994] ;Cho 等,Science 261 1303 [1993] ;Carre11 等,Angew.Chem.Int.Ed.Engl. 33. 2059[1994] ;Care11 等,Angew.Chem. Int. Ed. Engl. 33 :2061 [1994];以及 Gallop 等,J. Med. Chem. 37 :1233 [1994]。化合物文库可以存在于溶液中(例如Houghten, Biotechniques 13 412-421 [1992]),或存在于珠子(Lam, Nature 354 :82-84[1991])、芯片(Fodor, Nature364 :555-556[1993])、细菌或孢子(美国专利5,223,409 ;在此引为参考)、质粒(Cull等,Proc. Nad. Acad. Sci. USA 89 :1865_1869[1992])或噬菌体上(Scott 和 Smith,Science249 :386-390[1990] ;Devlin Science 249 :404-406[1990] ;Cwirla 等,Proc. Natl. Acad.Sci. 87 :6378-6382[1990] ;Felici, J. Mol. Biol. 222 :301[1991])。在一个实施方案中,测定方法是基于细胞的测定方法,其中将表达癌症标志物mRNA或蛋白或其生物活性部分的细胞与测试化合物相接触,并测定测试化合物调节癌症标志物活性的能力。测定测试化合物调节癌症标志物活性的能力,可以通过监测例如酶活性、破坏或mRNA的变化等来实现。也可以评估测试化合物调节癌症标志物与化合物、例如癌症标志物底物或调节物结合的能力。这可以通过例如将化合物例如底物与放射性同位素或酶标记物偶联来实现,以便化合物例如底物与癌症标志物的结合可以通过检测复合物中的标记化合物例如底物来测定。或者,将癌症标志物与放射性同位素或酶标记物偶联,以监测测试化合物调节癌症标志物与复合物中的癌症标志物底物结合的能力。例如,化合物(例如底物)可以用1251、35S、14C或3H直接或间接标记,并通过对放射性发射进行直接计数或通过闪烁计数来检测放射性同位素。或者,化合物可以用例如辣根过氧化物酶、碱性磷酸酶或萤光素酶进行酶标记,并通过测定适合的底物向产物的转化来检测酶标记物。
化合物(例如癌症标志物底物)与癌症标志物相互作用的能力可以在标记或不标记任何相互作用物的情况下评估。例如,可以使用微生理计在不标记化合物或癌症标志物的情况下检测化合物与癌症标志物的相互作用(McConnell等,Science 257 1906-1912[1992])。当在本文中使用时,“微生理计”(例如细胞传感器)是使用可光寻址的电势测定传感器(LAPS)测量细胞酸化其环境的速率的分析仪器。该酸化速率的变化可用作化合物与癌症标志物之间的相互作用的指示物。在另一个实施方案中,提供了无细胞测定方法,其中将癌症标志物蛋白或其生物活性部分与测试化合物相接触,并评估测试化合物与癌症标志物蛋白、mRNA或其生物活性部分结合的能力。用于本发明的测定方法的癌症标志物蛋白或mRNA的优选生物活性部分包括参与与底物或其他蛋白的相互作用的片段,例如具有高表面概率分值的片段。无细胞测定方法包括制备靶基因蛋白与测试化合物的反应混合物,在足以允许两种组分相互作用和结合的条件下和时间内反应,从而形成可以被取出和/或检测的复合物。也可以使用例如荧光能量转移(FRET)来检测两种分子之间的相互作用(参见例如Lakowicz等,美国专利5,631, 169 ;Stavrianopoulos等,美国专利4,968, 103 ;其每个在此引为参考)。对荧光团标记物进行选择,使得第一个供体分子发射的荧光能量将被第二个“受体”分子上的荧光标记物吸收,所述第二个受体分子进而由于吸收能量而发射荧光。或者,“供体”蛋白分子可以简单地利用色氨酸残基的天然荧光能量。选择的标记物发射不同波长的光,使得“受体”分子的标记物可以与“供体”的相区分。因为标记物之间的能量转移效率与分子相隔的距离相关,因此可以评估分子之间的空间关系。在分子之间发生结合的情形下,“受体”分子标记物的荧光发射将最大化。通过本技术领域公知的标准荧光测定手段(例如使用荧光计),可以方便地测量FRET结合事件。在另一个实施方案中,癌症标志物蛋白或mRNA与靶分子结合的能力的测定,可以使用实时生物分子相互作用分析(BIA)来实现(参见例如Sjolander和Urbaniczky, Anal.Chem. 63 :2338-2345 [1991]以及 Szabo 等,Curr. Opin. Struct. Biol. 5 :699-705 [1995])。“表面等离激元共振”或“BIA”不用标记任何相互作用物即可实时检测生物特异性相互作用(例如BIAcore)。结合表面处质量的变化(表明结合事件)导致表面附近光的折射率的改变(表面等离激元共振(SPR)的光学现象),产生可检测信号,其可用作生物分子之间实时反应的指示。在一个实施方案中,将靶基因产物或测试物质锚定在固相上。锚定在固相上的靶基因产物/测试化合物复合物可以在反应结束时检测。优选,靶基因产物可以锚定在固相表面上,并且测试化合物(其没有被锚定)可以用本文中讨论的可检测标记物直接或间接
I■■己 O将癌症标志物、抗癌症标志物抗体或其靶分子固定化,以便于将复合形式中的一种或两种蛋白与未复合形式的分离,以及适应于测定方法的自动化,可能是理想的。测试化合物与癌症标志物蛋白的结合,或癌症标志物蛋白与靶分子在候选化合物存在或不存在下的相互作用,可以在适合于包含反应试剂的任何容器中进行。这种容器的实例包括微量滴定板、试管和微量离心管。在一个实施方案中,可以提供融合蛋白,其添加了允许所述蛋白中的一种或二者与基质结合的结构域。例如谷胱甘肽S转移酶-癌症标志物融合蛋白或谷胱甘肽S转移酶/靶融合蛋白可以吸附在谷胱甘肽琼脂糖凝胶珠子(Sigma Chemical,St. Louis,MO)或谷胱甘肽衍生化的微量滴定板上,然后将其与测试化合物或测试化合物与 未吸附的靶蛋白或癌症标志物蛋白合并,并将混合物在引起复合物形成的条件下(例如在盐和PH的生理条件下)温育。在温育后,清洗珠子或微量滴定板的孔以除去任何未结合的组分,在珠子的情况下将基质固定化,如上所述直接或间接测定复合物。或者,可以将复合物从基质上解离,并使用标准技术测定癌症标志物的结合或活性水平。用于将癌症标志物蛋白或靶分子固定化在基质上的其他技术包括使用生物素和链亲和素的结合。生物素化的癌症标志物蛋白或靶分子可以使用本技术领域已知的技术(例如生物素化试剂盒,Pierce Chemicals, Rockford, EL)从生物素-NHS (N_轻基-琥拍酰亚胺)制备,并固定化在链亲和素包被的96孔板(Pierce Chemical)的孔中。为了进行测定,将未固定化的组分添加到含有锚定组分的包被表面上。在反应完成后,在使任何形成的复合物保持固定化在固体表面上的条件下除去(例如通过洗涤)未反应组分。锚定在固相表面上的复合物的检测可以用各种方式实现。当事先未固定化的组分被预先标记时,检测到在表面上固定化的标记物表明复合物形成。当事先未固定化的组分没有预先标记时,可以使用间接标记物检测锚定在表面上的复合物,例如使用特异性针对固定化的组分的标记抗体(该抗体又可以用例如标记的抗IgG抗体直接标记或间接标记)。这种测定方法使用与癌症标志物蛋白或靶分子具有反应性但是不干扰癌症标志物蛋白与其靶分子结合的抗体来进行。这样的抗体可以衍生化到板的孔上,并且未结合的靶或癌症标志物蛋白通过抗体结合捕获在孔中。用于检测这种复合物的方法,除了上述用于GST固定化复合物的方法之外,还包括使用与癌症标志物蛋白或靶分子具有反应性的抗体进行复合物的免疫检测,以及依赖于检测与癌症标志物蛋白或靶分子相关的酶活性的酶联测定法。或者,无细胞测定方法可以在液相中进行。在这样的测定方法中,通过多种标准技术中的任一种将反应产物与未反应的组分分离,所述技术包括但不限于差速离心(参见例如,Rivas和Minton,Trends Biochem Sci 18 :284_7[1993])、层析(凝胶过滤层析、离子交换层析)、电泳(参见例如Ausubel等主编《分子生物学现代方法》(Current Protocolsin Molecular Biology), 1999, J. Wiley New York.)以及免疫沉淀(参见例如 Ausubel 等主编《分子生物学现代方法》(Current Protocols in Molecular Biology), 1999, J. Wiley New York.)。这样的树脂和层析技术对于本技术领域的专业人员来说是公知的(参见例如Heegaard J. Mol. Recognit 11 141-8[1998] ;Hageand Tweed J.Chromatogr. Biomed. Sci.Appl 699 :499-525[1997])。此外,也可以如本文中所述方便地利用荧光能量转移,不需从溶液中进一步纯化复合物即可检测结合。测定方法可以包括将癌症标志物蛋白、mRNA或其生物活性部分与结合癌症标志物的已知化合物结合以形成测定混合物,将测定混合物与测试化合物相接触,并测定测试化合物与癌症标志物蛋白或mRNA相互作用的能力,其中测定测试化合物与癌症标志物蛋白或mRNA相互作用的能力包括测定测试化合物与已知化合物相比优先结合癌症标志物或其生物活性部分、或调节靶分子活性的能力。对于癌症标志物在体内能够与一种或多种细胞或细胞外大分子、例如蛋白质相互作用的程度来说,这种相互作用的抑制剂是有用的。均相测定方法可用于鉴定抑制剂。
例如,制备靶基因产物与相互作用的细胞或细胞外结合配偶体产物的预制复合物,使得靶基因产物或其结合配偶体被标记,但是由标记物产生的信号由于复合物形成而被淬灭(参见例如美国专利4,109, 496,在此引为参考,其利用了这种免疫测定方法)。添加与来自预制复合物的一种物质竞争并取代它的测试物质,将导致产生高于背景的信号。通过这种方式,可以鉴定破坏靶基因产物-结合配偶体相互作用的测试物质。或者,癌症标志物蛋白可以在双杂交测定法或三杂交测定法中用作“诱饵蛋白”(参见例如美国专利 5, 283, 317 ;Zervos 等,Cell 72 :223-232[1993] ;Madura 等,J. Biol.Chem. 268. 12046-12054[1993] ;Bartel 等,Biotechniques 14 :920-924[1993] ;Iwabuchi等,Oncogene 8 1693-1696 [1993];以及&'ent WO 94/10300 ;其每个在此引为参考),以鉴定与癌症标志物结合或相互作用(“癌症标志物结合蛋白”或“癌症标志物_bp”)和参与癌症标志物活性的其他蛋白。这样的癌症标志物_bp可以是癌症标志物蛋白的信号或作为例如癌症标志物介导的信号传导途径的下游元件的靶的激活剂或抑制剂。也可以鉴定癌症标志物表达的调节物。例如,将细胞或无细胞混合物与候选化合物相接触,并相对于不存在候选化合物的情况下癌症标志物mRNA或蛋白的表达水平,评估癌症标志物mRNA或蛋白的表达。当癌症标志物mRNA或蛋白的表达在候选化合物存在下高于其不存在下的表达时,候选化合物被鉴定为癌症标志物mRNA或蛋白表达的刺激剂。或者,当癌症标志物mRNA或蛋白的表达在候选化合物存在下低于(即统计学显著低于)其不存在下的表达时,候选化合物被鉴定为癌症标志物mRNA或蛋白表达的抑制剂。癌症标志物mRNA或蛋白表达的水平可以通过本文描述的用于检测癌症标志物mRNA或蛋白的方法来确定。可以使用基于细胞的或无细胞的测定方法鉴定调节剂,并且药剂调节癌症标志物蛋白活性的能力能够在体内得到证实,例如在动物例如疾病的动物模型(例如患有前列腺癌或转移的前列腺癌的动物;或带有来自于动物(例如人类)的前列腺癌异种移植物的动物)、或来自由前列腺癌转移产生的癌症(例如转移到淋巴结、骨或肝脏)的细胞、或来自前列腺癌细胞系的细胞中。本发明还涉及通过上述的筛选测定法鉴定到的新的药剂(参见例如下面癌症治疗的描述)。因此,在本发明的范围内还包括将如本文所述鉴定到的药剂(例如癌症标志物调节剂、反义癌症标志物核酸分子、siRNA分子、癌症标志物特异性抗体或癌症标志物结合配偶体)进一步使用在适合的动物模型中(例如本文描述的模型),以确定使用这种药剂的治疗的效能、毒性、副作用或作用机制。此外,通过上述筛选测定法鉴定到的新药剂可以例如用于本文所述的治疗。VI.治疗性应用在某些实施方案中,本发明提供了癌症(例如前列腺癌)的疗法。在某些实施方案中,疗法直接或间接靶向本发明的基因融合体。A. RNA干扰和反义疗法在某些实施方案中,本发明靶向基因融合体的表达。例如,在某些实施方案中,本发明使用了包含寡聚反义或RNAi化合物、特别是寡核苷酸(例如在上面描述的药物筛选方 法中鉴定的寡核苷酸)的组合物,用于调节编码本发明的癌症标志物的核酸分子的功能,最终调节表达的癌症标志物的量。I. RNA 干扰(RNAi)在某些实施方案中,使用RNAi抑制融合蛋白功能。RNAi代表了用于控制大多数真核生物包括人类中外来基因表达的进化保守的细胞防御机制。RNAi典型地由双链RNA(dsRNA)触发,并对dsRNA做出响应引起单链靶RNA同源物的序列特异性mRNA降解。mRNA降解的介导物是小干扰RNA双链体(siRNA),其通常在细胞中通过酶切割长dsRNA而产生。siRNA通常长度约为21个核苷酸(例如长度为21-23个核苷酸),并具有以两个核苷酸3’ -突出为特征的碱基配对结构。在将小RNA或RNAi导入细胞后,据认为序列被递送到被称为RISC(RNA诱导的沉默复合物)的酶复合物。RISC识别靶并使用内切核酸酶将其切开。应该注意的是,如果将较大的RNA序列递送到细胞,RNase III酶(Dicer)将较长dsRNA转变成21-23nt的ds siRNA片段。在某些实施方案中,RNAi寡核苷酸被设计成靶向融合蛋白的连接区域。化学合成的siRNA已经变成在培养的体细胞中对哺乳动物基因功能进行全基因组分析的有力试剂。除了它们用于验证基因功能的价值之外,siRNA作为基因特异性治疗剂也具有极大潜力(Tuschl 和 Borkhardt,Molecular Intervent. 2002 ;2(3) :158-67,在此引为参考)。将siRNA转染到动物细胞中,引起特定基因的强有力、持久的转录后沉默(Caplen等,Proc Natl Acad Sci U. S. A. 2001 ;98 :9742-7 ;Elbashir 等,Nature. 2001 ;411 :494-8 ;Elbashir 等,Genes Dev. 2001 ; 15 188-200 ;以及 Elbashir 等,EMBO J. 2001 ;20 =6877-88,其全部在此引为参考)。使用siRNA执行RNAi的方法和组合物描述在例如美国专利6,506,559中,在此引为参考。siRNA格外有效地降低被靶向的RNA的量,并推广到蛋白质,经常降低到通常检测不到的水平。沉默效应能够持续几个月,并且是格外特异性的,因为靶RNA与siRNA的中心区域之间一个核苷酸的错配经常足以阻止沉默(Brummelkamp等,Science 2002 ;296 550-3 ;以及 Holen 等,Nucleic Acids Res. 2002 ;30 :1757-66,两者在此引为参考)。在siRNA设计中的重要因素是存在可及的siRNA结合位点。Bahoia等(J. Biol.Chem. ,2003 ;278 :15991-15997 ;在此引为参考)描述了使用一种被称为扫描阵列的DNA阵列来发现mRNA中用于设计有效siRNA的可及位点。这些阵列包含的寡核苷酸的尺寸范围从单体到一定的最大值,通常为Comer,其使用物理屏障(掩膜)通过逐步添加序列中的每个碱基来合成。因此阵列代表了靶基因区域的全部寡核苷酸互补物。靶mRNA与这些阵列的杂交提供了该靶mRNA区域的穷举的可及谱。这样的数据可用于设计反义寡核苷酸(范围从7聚体到25聚体),其中重要的是在寡核苷酸长度与结合亲和性之间实现折衷,以保留效能和靶特异性(Sohail 等,Nucleic Acids Res. ,2001 ;29(10) :2041-2045)。用于选择 siRNA 的其他方法和考虑描述在例如 WO 05054270,W005038054AUW003070966A2, J MolBiol.2005 May 13 ;348(4) :883-93,J Mol Biol. 2005 May 13 ;348(4) :871-81和NucleicAcids Res. 2003 Aug I ;31(15) :4417-24中,其每个在此以其全文引为参考。此外,用于选择siRNA的软件(例如,MWG在线siMAX siRNA设计工具)是商业或公众可获得的。2.反义在其他实施方案中,使用与一种或多种编码本发明的癌症标志物的核酸特异性杂交的反义化合物调节融合蛋白表达。寡聚体化合物与其靶核酸的特异性杂交干扰了所述核
酸的正常功能。这种通过与靶核酸特异性杂交的化合物对靶核酸功能的调节一般被称为“反义”。被干扰的DNA功能包括复制和转录。被干扰的RNA的功能包括所有至关重要的功能例如RNA向蛋白翻译位点的易位、从RNA翻译蛋白、剪接RNA以获得一种或多种mRNA物质、以及可能由RNA参与或促进的催化活性。这种干扰靶核酸功能的总体效应是调节本发明的癌症标志物的表达。在本发明的情形中,“调节”是指基因表达的增加(刺激)或降低(抑制)。例如,可以抑制表达以潜在地阻止肿瘤增殖。优选靶向特异性核酸以求反义。在本发明的情形中,将反义化合物“靶向”特定核酸是多步骤的过程。该过程通常始于鉴定要调节功能的核酸序列。这可以是例如其表达与特定障碍或疾病状态相关的细胞基因(或从基因转录的mRNA),或来自感染性因子的核酸分子。在本发明中,靶是编码本发明的基因融合体的核酸分子。靶向过程还包括确定该基因中的位点,所述位点用于反义相互作用以便产生所需效应例如蛋白表达的检测或调节。在本发明的情形中,优选的基因内位点是涵盖基因的开放阅读框(ORF)的翻译起始或终止密码子的区域。因为翻译起始密码子典型为5’-AUG (在转录的mRNA分子中;在相应的DNA分子中为5’ -ATG),因此翻译起始密码子也被称为“AUG密码子”、“起始密码子”或“AUG起始密码子”。少部分基因具有RNA序列为5’ -GUG、5’ -UUG或5’ -CUG的翻译起始密码子,并且5’ -AUA、5’ -ACG和5’ -CUG已显示在体内有功能。因此,术语“翻译起始密码子”和“起始密码子”可以涵盖许多密码子序列,尽管在每种情况下初始氨基酸典型为甲硫氨酸(在真核生物中)或甲酰基甲硫氨酸(在原核生物中)。真核和原核基因可以具有两种以上可变起始密码子,其任一种可以优选用于具体细胞类型或组织、或在一组具体条件下的翻译起始。在本发明的情形中,“起始密码子”和“翻译起始密码子”是指在体内用于从编码本发明的肿瘤抗原的基因转录的mRNA分子启动翻译的密码子,而不管这些密码子的序列。基因的翻译终止密码子(或“终止密码子”)可以具有三种序列之一(即5’ -UAA、5’ -UAG和5’ -UGA ;相应的DNA序列分别为5’ -TAA、5’ -TAG和5’ -TGA)。术语“起始密码子区”和“翻译起始密码子区”是指这种mRNA或基因涵盖了从翻译起始密码子起在任一方向(即5’或3’)上约25至约50个连续核苷酸的部分。同样地,术语“终止密码子区”和“翻译终止密码子区”是指这种mRNA或基因涵盖了从翻译终止密码子起在任一方向(即5’或3’)上约25至约50个连续核苷酸的部分。
开放阅读框(ORF)或“编码区”是指翻译起始密码子与翻译终止密码子之间的区域,也是可以被有效靶向的区域。其他靶区域包括5’非翻译区(5’UTR),其是指mRNA从翻译起始密码子起5’方向上的部分,因此包括了 mRNA的5’帽位点与翻译起始密码子之间的核苷酸或基因上的相应核苷酸,以及3’非翻译区(3’ UTR),其是指mRNA从翻译终止密码子起3’方向上的部分,因此包括了 mRNA的翻译终止密码子与3’末端之间的核苷酸或基因上的相应核苷酸。mRNA的5’帽包含通过5’ -5’磷酸三酯键与mRNA的最5’端残基相连的N7-甲基化鸟苷残基。mRNA的5’帽区被认为包含了 5’帽结构本身以及与帽相邻的前50个核苷酸。帽区也可以是优选的靶区域。尽管一些真核mRNA转录物直接翻译,但许多含有一个或多个被称为“内含子”的区域,内含子在翻译之前从转录物中切除。剩余的(以及因此被翻译的)区域被称为“外显子”,并被剪接在一起形成连续的mRNA序列。mRNA剪接位点(即内含子_外显子连接处)也可以是优选的靶区域,并且在异常剪接与疾病相关或特定mRNA剪接产物的过表达与疾病相关的情况下特别有用。由于重排或缺失造成的异常融合体连接处也是优选的靶。还已发现,对于靶向例如DNA或mRNA前体的反义化合物来说,内含子也可以是有效的、并因此优选的靶区域。·在某些实施方案中,用于反义抑制的靶位点使用可商购软件程序来鉴定(例如Biognostik,Gottingen,德国;SysArris Software,Bangalore,印度;Antisense ResearchGroup, University of Liverpool, Liverpool,英格兰;GeneTrove, Carlsbad, CA)。在其他实施方案中,反义抑制的靶位点使用在PCT公布No. W00198537A2中描述的可及位点方法来鉴定,所述文献在此引为参考。一旦鉴定到一个或多个靶位点后,选择与靶具有足够互补性(即杂交足够好并具有足够特异性)的寡核苷酸以提供所需效果。例如,在本发明的优选实施方案中,反义寡核苷酸靶向起始密码子或其附近。在本发明的情形中,对于反义组合物和方法来说,“杂交”是指互补核苷或核苷酸碱基之间的氢键形成,其可以是Watson_Crick、Hoogsteen或反向Hoogsteen氢键形成。例如,腺嘌呤和胸腺嘧啶是通过形成氢键配对的互补核酸碱基。应该理解,反义化合物的序列不需要与其靶核酸100%互补才能特异性杂交。当反义化合物与靶DNA或RNA分子的结合干扰了靶DNA或RNA的正常功能,引起功用丧失,并存在足够程度的互补性以避免在特异性结合所需的条件下(即在体内测定或治疗性治疗情况中的生理条件下,或体外测定情况中的执行测定的条件下)反义化合物与非靶序列的非特异性结合时,反义化合物就是可特异性杂交的。反义化合物通常被用作研究试剂和诊断试剂。例如,能够特异性抑制基因表达的反义寡核苷酸可用于阐述特定基因的功能。反义化合物也可用于例如辨别生物途径的各个成员的功能。反义的特异性和灵敏度也适用于治疗性应用。例如,反义寡核苷酸已在动物和人类的疾病状态的治疗中用作治疗性部分。反义寡核苷酸已安全有效地给药于人类,并且大量临床试验目前正在进行中。因此确定了寡核苷酸是有用的治疗模式,其可以被配置成可用于治疗细胞、组织和动物特别是人类的治疗方案中。尽管反义寡核苷酸是反义化合物的优选形式,但本发明包含了其他寡聚反义化合物,包括但不限于例如下面描述的寡核苷酸模拟物。本发明的反义化合物优选包含约8至约30个核酸碱基(即约8至约30个相连的碱基),尽管更长和更短的序列也可以在本发明中找到应用。特别优选的反义化合物是反义寡核苷酸,更优选的是包含约12至约25个核酸碱基的反义寡核苷酸。可用于本发明的优选反义化合物的具体实例包括含有修饰骨架或非天然核苷间连键的寡核苷酸。正如在本说明书中所定义的,具有修饰骨架的寡核苷酸包括在骨架中保留磷原子和在骨架中不具有磷原子的寡核苷酸。出于本说明书的目的,在其核苷间骨架中不具有磷原子的修饰的寡核苷酸也可以被当作寡核苷酸。优选的修饰寡核苷酸骨架包括例如具有正常的3’ -5’连键的硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷 基膦酸酯包括3’-亚烷基膦酸酯和手性膦酸酯、亚膦酸酯、氨基磷酸酯包括3’-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、硫逐氨基磷酸酯、硫逐烷基膦酸酯、硫逐烷基磷酸三酯和硼代磷酸酯,它们的2’ -5’连接的类似物,以及具有颠倒极性、其中相邻的核苷单元对以3’ -5’到5’ -3’或2’ -5’到5’ -2’连接的类似物。还包括各种盐、混合盐和游离酸形式。优选的其中不包括磷原子的修饰寡核苷酸骨架,具有由短链烷基或环烷基核苷间连键、混合的杂原子和烷基或环烷基核苷间连键、或一个或多个短链杂原子或杂环核苷间连键形成的骨架。它们包括具有吗啉代连键(部分从核苷的糖部分形成)的骨架,硅氧烷骨架,硫醚、亚砜和砜骨架,甲酰乙酰和硫代甲酰乙酰骨架,亚甲基甲酰乙酰和硫代甲酰乙酰骨架,含亚烷基骨架,氨基磺酸酯骨架,亚甲基亚氨基和亚甲基肼基骨架,磺酸酯和磺酰胺骨架,酰胺骨架,以及其他具有混合的N、O、S和CH2组成部分的骨架。在其他优选的寡核苷酸模拟物中,核苷酸单元的糖和核苷间连键(即骨架)被新的基团代替。维持了碱基单元与适合的核酸靶化合物杂交。一种这样的寡聚化合物是已显示出具有出色的杂交性质的寡核苷酸模拟物,被称为肽核酸(PM)。在PNA化合物中,寡核苷酸的糖骨架被含有酰胺的骨架、特别是氨基乙基甘氨酸骨架代替。核酸碱基被保留,并与骨架的酰胺部分的氮杂氮原子直接或间接相连。教授PNA化合物的制备的代表性美国专利包括但不限于美国专利No. 5,539,082,5, 714,331和5,719,262,其每个在此引为参考。关于PNA化合物的进一步讲授可见于Nielsen等,Science 254 1497 (1991)。本发明的最优选实施方案是具有硫代磷酸酯骨架的寡核苷酸,和具有杂原子骨架、特别是上面引用的美国专利 5,489, 677 的一CH2、一NH-O-CH2—、一CH2—N (CH3) —0—CH2--[被称为亚甲基(甲基亚氨基)或MMI骨架]、--CH2-O-N(CH3)—CH2—、一CH2—N(CH3) —N(CH3) -CH2--和一O-N (CH3) -CH2-CH2-[其中天然磷酸二酯骨架被表示成--O--P--O-CH2--]骨架以及上面引用的美国专利5,602,240的酰胺骨架的寡聚核苷。此外,优选的是具有上面引用的美国专利5,034,506的吗啉代骨架结构的寡核苷酸。修饰的寡核苷酸也可以含有一个或多个取代的糖部分。优选的寡核苷酸在2’位置包含下列之一 0H ;F ;0-、S-或N-烷基;0-、S-或N-烯基;0-、S-或N-炔基;或0-烷基-0-烷基,其中烷基、烯基和炔基可以是取代或未取代的C1到Cltl烷基或C2到Cltl烯基和炔基。特别优选的是 0[ (CH2)n0]mCH3、O(CH2)n0CH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2 和0(CH2)n0N[(CH2)nCH3)]2,其中n和m是I至约10。其他优选的寡核苷酸在2’位置包含下列之一 C1到Cltl短链烷基、取代的短链烷基、烷芳基、芳烷基、0-烷芳基或0-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改进寡核苷酸的药物动力学性质的基团或用于改进寡核苷酸的药效学性质的基团,以及其他具有类似性质的取代基。优选的修饰包括2’ -甲氧基乙氧基(2’ -O--CH2CH2OCH3,也被称为2’ -0-(2-甲氧基乙基)或 2’ -M0E) (Martin 等,Helv. Chim. Acta 78 :486[1995]),即烧氧基烧氧基基团。其他优选的修饰包括2’ 二甲基氨基氧基乙氧基(即O(CH2)2ON(CH3)2基团),也被称为2’-DMA0E,以及2’-二甲基氨基乙氧基乙氧基(在本技术领域中也称为2’-0-二甲基氨基乙氧基乙基或 2’ _DMAE0E),即 2’ _0—CH2—0—CH2一N(CH2)2。其他优选的修饰包括2’-甲氧基(2’-0—CH3)、2’_氨基丙氧基(2’-OCH2CH2CH2NH2)和2’ -氟(2’ -F)。类似的修饰也可以在寡核苷酸的其他位置上作出,特别是在3’末端核苷酸上的糖的3’位置或在2’ -5’连接的寡核苷酸中以及5’末端 核苷酸的5’位置。寡核苷酸也可以具有糖模拟物例如环丁基部分代替戊呋喃糖基糖。寡核苷酸也可以包括核酸碱基(在本技术领域中经常简称为“碱基”)修饰或取代。当在本文中使用时,“未修饰的”或“天然”核酸碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G),以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核酸碱基包括其他合成和天然的核酸碱基,例如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基尿嘧啶和胞嘧啶、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、
4-硫尿嘧啶、8-卤代、8-氨基、8-巯基、8-硫代烷基、8-羟基和其他8-取代腺嘌呤和鸟嘌呤、5-卤代特别是5-溴、5-三氟甲基和其他5-取代尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-去氮杂鸟嘌呤和7-去氮杂腺嘌呤、以及
3-去氮杂鸟嘌呤和3-去氮杂腺嘌呤。其他核酸碱基包括在美国专利3,687,808中公开的。这些核酸碱基中的某些对于增加本发明的寡聚化合物的结合亲和性特别有用。它们包括
5-取代的嘧啶、6-氮杂嘧啶和N-2、N-6和0-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代已显示出将核酸双链体的稳定性增加0. 6-1. 2°C,并且是目前优选的碱基取代,特别是当与2’ -0-甲氧基乙基糖修饰组合时。本发明的寡核苷酸另一种修饰涉及向寡核苷酸化学连接一个或多个增强寡核苷酸的活性、细胞分布或细胞摄取的部分或结合物。这样的部分包括但不限于脂类部分例如胆固醇部分、胆酸、硫醚(例如己基-S-三苯甲基硫醇)、硫代胆固醇、脂族链(例如十二烷二醇或十一烷基残基)、磷脂(例如二 -十六烷基-消旋甘油或1,2- 二 -0-十六烷基-消旋甘油-3-H-膦酸三乙基铵)、多胺或聚乙二醇链或金刚烷乙酸、棕榈基部分或十八胺或己基氨基-羰基-氧基胆固醇部分。相关技术领域的专业人员非常了解如何产生含有上述修饰的寡核苷酸。本发明不限于上面描述的反义寡核苷酸。可以利用任何适合的修饰或取代。在给定化合物中不是所有位置都需要一致修饰,事实上单一化合物乃至寡核苷酸内的单一核苷内可以掺入超过一种上述修饰。本发明还包括作为嵌合化合物的反义化合物。在本发明的情形中,“嵌合”反义化合物或“嵌合体”是含有两种或多种化学上不同的区域的反义化合物、特别是寡核苷酸,其中每个区域由至少一个单体单元、即在寡核苷酸化合物的情况下的核苷酸构成。这些寡核苷酸典型地含有至少一个区域,其中寡核苷酸被修饰以便赋予寡核苷酸对核酸酶降解的抗性增加、细胞摄取增加和/或对靶核酸的结合亲和性增加。寡核苷酸的其他区域可以用作能够切开RNA:DNA或RNA:RNA杂合体的酶的底物。例如,RNaseH是能够切开RNA = DNA双链体的RNA链的细胞内切核酸酶。因此,RNase H的活化导致切开RNA靶,从而极大增强寡核苷酸抑制基因表达的效率。因此,当使用嵌合寡核苷酸时,相比于与相同靶区域杂交的硫代磷酸酯脱氧寡核苷酸,以更短的寡核苷酸往往能够获得类似的结果。RNA靶的切开可以通过凝胶电泳以及如果需要的话通过本技术领域已知的相关核酸杂交技术来常规检测。
本发明的嵌合反义化合物可以作为上面描述的两种或多种寡核苷酸、修饰的寡核苷酸、寡聚核苷和/或寡核苷酸模拟物的复合结构来形成。本发明还包括如下所述的包含本发明的反义化合物的药物组合物和剂型。B.基因治疗本发明设想了使用任何遗传操作用于调节本发明的基因融合体的表达。遗传操作的实例包括但不限于基因敲除(例如使用例如重组将融合基因从染色体上除去)、带有或不带诱导型启动子的反义构建物的表达等。在体外或体内将核酸构建物递送到细胞,可以使用任何适合的方法来进行。适合的方法是将核酸构建物导入细胞使得所需事件(例如反义构建物的表达)发生的方法。遗传治疗也可用于递送siRNA或在体内表达(例如在被诱导型启动子(例如雄激素响应性启动子)刺激后)的其他干扰分子。将携带遗传信息的分子导入细胞是通过各种方法中的任一种来实现的,所述方法包括但不限于直接注射裸DNA构建物、使用载有所述构建物的金粒子进行轰击、以及使用例如脂质体、生物聚合物等进行的大分子介导的基因转移。优选的方法使用源自于病毒的基因递送载体,所述病毒包括但不限于腺病毒、反转录病毒、痘苗病毒和腺相关病毒。由于与反转录病毒相比具有更高的效率,源自于腺病毒的载体是用于在体内将核酸分子转移到宿主细胞中的优选基因递送载体。已经显示,腺病毒载体在动物模型的各种实体肿瘤中以及在免疫缺陷小鼠的人类实体肿瘤异种移植物中,提供了非常有效的体内基因转移。用于基因转移的腺病毒载体和方法的实例描述在PCT公布WO 00/12738和WO 00/09675以及美国专利申请 No. 6,033,908,6, 019,978,6, 001,557,5, 994,132,5, 994,128,5, 994,106、5981,225,5, 885,808,5, 872,154,5, 830,730 和 5,824,544 中,其每个在此以其全文引为参考。载体可以以各种方式给药于对象。例如,在本发明的某些实施方案中,使用直接注射将载体给药到肿瘤或与肿瘤相联的组织中。在其他实施方案中,通过血液或淋巴循环给药(参见例如PCT公布99/02685,在此以其全文引为参考)。腺病毒载体的示例性剂量水平优选向灌注液添加IO8至IO11个载体粒子。C.抗体治疗在某些实施方案中,本发明提供了靶向表达本发明的基因融合体的前列腺肿瘤的抗体。在本文公开的治疗方法中可以利用任何适合的抗体(例如多克隆、多克隆或合成的抗体)。在优选实施方案中,用于癌症治疗的抗体是人源化抗体。将抗体人源化的方法在本技术领域中是公知的(参见例如美国专利No. 6, 180, 370,5, 585, 089,6, 054, 297
5,565,332,其每个在此引为参考)。
在某些实施方案中,治疗性抗体包含针对本发明的基因融合体产生的抗体,其中抗体与细胞毒性剂结合。在这样的实施方案中,产生了不靶向正常细胞的肿瘤特异性治疗齐U,从而减少了传统化疗的许多不利副作用。对于某些应用来说,设想治疗剂将是可用作连接抗体的有用药剂的药理学药剂,特别是具有杀死或抑制内皮细胞生长或细胞分裂的细胞毒性或其他抗细胞药剂。本发明设想了使用任何能够与抗体结合并以活性形式递送的药理学药剂。示例性的抗细胞药剂包括化疗药剂、放射性同位素和细胞毒素。本发明的治疗性抗体可以包括各种细胞毒性部分,包括但不限于放射活性同位素(例如碘-131、碘-123、锝-99m、铟-111、铼-188、铼-186、镓-67、铜-67、钇-90、碘-125或砹-211)、激素例如甾类、抗代谢物例如胞嘧啶(例如阿拉伯糖苷、氟尿嘧唆、氨甲蝶呤或氨基喋呤;蒽环类药物;丝裂霉素C)、长春花生物碱(例如秋水仙胺、依托泊苷、光神霉素)以及抗肿瘤烷基化药剂例如苯丁酸氮芥或美法仑。其他实施方案可以包括药剂例如抗凝剂、细胞因子、生长因子、细菌内毒素或细菌内毒素的脂A部分。例如,在某些实施方案中,治疗药剂可以包括植物、真菌或细菌来源的毒素,例如A链毒素、核糖体失活蛋白、a-帚曲菌素、曲霉菌素、局限曲菌素、核糖核酸酶、白喉毒素或假单胞菌外毒素,这仅仅是举几个例子。在某些优选实施方案中,使用去糖基化蓖麻毒蛋白A链。 在任何情况下,已经提出例如这些的药剂,如果需要可以使用已知的结合技术(参见例如Ghose等,Methods Enzymol. ,93 280[1983])与抗体成功结合,所述结合的方式将允许它们根据需要在被靶向的肿瘤细胞位点处寻靶、内化、释放或呈递给血液组分。例如,在某些实施方案中,本发明提供了靶向本发明的癌症标志物(例如ERG或ETVl融合体)的免疫毒素。免疫毒素是特异性靶向药剂、典型为肿瘤定向抗体或片段与细胞毒性药剂例如毒素部分的结合物。靶向药剂将毒素导向携带有被靶向抗原的细胞并因此选择性杀死它们。在某些实施方案中,治疗性抗体使用提供高的体内稳定性的交联剂(Thorpe 等,Cancer Res. ,48 :6396 [1988])。在其他实施方案中,特别是涉及实体肿瘤治疗的实施方案中,抗体被设计成通过抑制血管内皮细胞的生长或细胞分裂而对肿瘤血管系统具有细胞毒性或其他抗细胞效应。这种攻击目的在于引起肿瘤局域性血管崩坍,剥夺肿瘤细胞、特别是血管系统远端的肿瘤细胞的氧气和营养物,最终引起细胞死亡和肿瘤坏死。在优选实施方案中,基于抗体的治疗药物被配制成如下所述的药物组合物。在优选实施方案中,给药本发明的抗体组合物导致癌症可测量的缩小(例如肿瘤的缩小或消除)。D.药物组合物本发明还提供了药物组合物(例如包含调节本发明的基因融合体的表达或活性的药剂)。取决于需要的是局部还是全身治疗并取决于待治疗的区域,本发明的药物组合物可以用多种方式给药。给药可以是局部(包括眼部和粘膜包括阴道和直肠递送)、肺部(例如通过吸入或吹入粉末或气溶胶,包括通过喷雾器;气管内、鼻内、表皮和透皮)、口或肠胃外给药。肠胃外给药包括静脉内、动脉内、皮下、腹膜内或肌肉内注射或灌注;或颅内例如鞘内的或脑室内给药。用于局部给药的药物组合物和制剂可以包括透皮贴片、软膏、洗剂、霜剂、凝胶、滴齐U、栓剂、喷剂、液体和粉剂。常规的药物载体、水性、粉末或油性基料、增稠剂等,可以是需要或合乎需要的。用于口服给药的组合物或制剂包括粉剂或颗粒剂、在水或非水性介质中的悬液或溶液、胶囊、袋剂或片剂。增稠剂、调味剂、稀释剂、乳化剂、分散助剂或粘合剂可能是合乎需要的。用于肠胃外、鞘内或脑室内给药的组合物和制剂可以包括无菌水性溶液,其还可以包含缓冲剂、稀释剂和其他适合的添加剂例如但不限于渗透增强剂、载体化合物和其他可药用载体或赋形剂。本发明的药物组合物包括但不限于溶液、乳液和含脂质体的制剂。这些组合物可以从各种各样的组分产生,包括但不限于预制液体、自乳化固体和自乳化半固体。可以方便地以单位剂型存在的本发明的药物剂型,可以按照制药工业中公知的常规技术来制备。这样的技术包括将活性成分与药物载体或赋形剂进行混合的步骤。一般来说,通过将活性成分与液体载体或细分的固体载体或两者均匀充分地混合,然后如果需要 对产品进行成形,来制备剂型。本发明的组合物可以配制成许多可能剂型中的任一种,所述剂型例如但不限于片齐U、胶囊、液体糖浆、软凝胶、栓剂和灌肠剂。本发明的组合物也可以配制成在水性、非水性或混合介质中的悬液。水性悬液还可以含有增加悬液粘度的物质,包括例如羧甲基纤维素钠、山梨糖醇和/或葡聚糖。悬液还可以含有稳定剂。在本发明的一个实施方案中,药物组合物可以作为泡沫剂配制并使用。药物泡沫剂包括的制剂例如但不限于乳液、微乳液、霜剂、胶冻和脂质体。尽管在本质上基本相似,但这些剂型在组分和终产物的稠度方面各不相同。在细胞水平上增强寡核苷酸摄取的药剂也可以添加到本发明的药物和其他组合物中。例如,阳离子脂类例如Iipofectin(美国专利5,705, 188)、阳离子型甘油衍生物和聚阳离子分子例如聚赖氨酸(W0 97/30731),也增加寡核苷酸的细胞摄取。本发明的组合物可以另外含有常规见于药物组合物中的其他辅助组分。因此,例如,组合物可以含有附加的、相容的、有药物活性的物质,例如止痒剂、收敛剂、局部麻醉剂或抗炎剂,或者可以含有对本发明组合物的各种剂型的物理配制有用的其他材料,例如染料、调味剂、防腐剂、抗氧化剂、乳浊剂、增稠剂和稳定剂。然而,这样的材料在添加时,不应该过度地干扰本发明组合物的组分的生物活性。制剂可以被灭菌,并且如果需要,可以与不与制剂的核酸发生有害相互作用的辅助剂混合,所述辅助剂例如润滑剂、防腐剂、稳定剂、润湿剂、乳化剂、影响渗透压的盐类、缓冲剂、着色剂、调味剂和/或芳香物质等。本发明的某些实施方案提供了药物组合物,其含有(a) —种或多种反义化合物,以及(b) —种或多种通过非反义机制起作用的其他化疗药剂。这样的化疗药剂的实例包括但不限于抗癌药物例如道诺红菌素、更生霉素、阿霉素、博来霉素、丝裂霉素、氮芥子气、苯丁酸氮芥、美法仑、环磷酰胺、6-巯基嘌呤、6-硫鸟嘌呤、阿糖胞苷(CA)、5_氟尿嘧啶(5-FU)、5-氟脱氧尿苷(5-FUdR)、氨甲蝶呤(MTX)、秋水仙素、长春新碱、长春碱、依托泊苷、替尼泊苷、顺钼和己烯雌酚(DES)。抗炎药物包括但不限于非甾族抗炎药物和皮质类固醇,以及抗病毒药物包括但不限于利巴韦林、阿糖腺苷、阿苷洛韦和更昔洛韦,也可以组合在本发明的组合物中。其他非反义化疗药剂也在本发明的范围内。两种或多种组合的化合物可以一起或相继使用。
剂量取决于待治疗疾病状态的严重性和响应性,其中治疗过程持续数日至数月,或直到实现治愈或获得疾病状态的消减。可以从患者体内药物积累的测量值计算出最适的给药日程安排。给药的医生可以容易地确定最适剂量、给药方法和重复频率。最适剂量可以随着各寡核苷酸的相对效力而变,一般可以根据在体外和体内动物模型中发现有效的EC5q或根据本文所述的实例进行估算。一般来说,剂量为每kg体重0. 01 y g至100g,并且可以每日、每周、每月或每年给药一次或多次。治疗医生可以根据药物在体液或组织中的测量的停留时间和浓度估算给药的重复频率。在成功治疗后,可能希望使对象经历维持治疗以防止疾病状态的复发,其中寡核苷酸以维持剂量给药,其范围从每kg体重0. Olii g至100g,每日一次或多次到每20年一次。VII.转基因动物本发明设想了包含本发明的外源癌症标志物基因(例如基因融合体)或其突变体和变体(例如截短或单核苷酸多态性)的转基因动物的产生。在优选实施方案中,转基因动物与野生型动物相比显示出改变的表型(例如标志物的增加或减少出现)。分析这些表型的存在或不存在的方法包括但不限于本文公开的方法。在一些优选实施方案中,转基因 动物还表现出肿瘤生长或癌症依据的增加或减少。本发明的转基因动物可用于药物(例如癌症治疗)筛选。在某些实施方案中,将测试化合物(例如怀疑可用于治疗癌症的药物)和对照化合物(例如安慰剂)给药于转基因动物和对照动物,并对效应进行评估。转基因动物可以通过各种方法产生。在某些实施方案中,使用处于各种发育阶段的胚胎细胞来导入转基因,用于产生转基因动物。根据胚胎细胞的发育阶段使用不同的方法。合子是用于未注射的最好的靶。在小鼠中,雄原核达到直径约20微米的大小,允许可重复地注射1-2皮升(pi)的DNA溶液。使用合子作为基因转移的靶的主要优点在于,在大多数情况下被注射的DNA将在第一次卵裂前掺入到宿主基因组中(Brinster等,Proc. Natl.Acad. Sci. USA 82 :4438-4442 [1985])。结果,转基因非人类动物的所有细胞将带有掺入的转基因。这一般也将反映在转基因向建立者后代的有效传递中,因为50%的生殖细胞将带有转基因。美国专利4,873,191描述了合子的微注射方法;该专利的公开内容在此以其全文引为参考。在其他实施方案中,使用反转录病毒感染将转基因导入非人类动物。在某些实施方案中,通过将反转录病毒载体注入卵母细胞的卵周空间,利用反转录病毒载体转染卵母细胞(美国专利6,080,912,在此引为参考)。在其他实施方案中,可以将发育中的非人类胚胎在体外培养到囊胚阶段。在此期间,卵裂球可以作为反转录病毒感染的靶(Janenich,Proc. Natl. Acad. Sci. USA 73 :1260[1976])。卵裂球的有效感染可以通过酶处理以除去透明带来获得(Hogan 等,《操作小鼠胚胎》(Manipulating the Mouse Embryo), Cold SpringHarbor Laboratory Press, Cold Spring Harbor, N. Y. [1986])。用于导入转基因的病毒载体系统典型为带有转基因的复制缺陷型反转录病毒(Jahner等,Proc. Natl. Acad Sci.USA 82 :6927[1985])。通过将卵裂球在单层病毒产生细胞上培养,可以容易有效地获得转染(Stewart等,EMBO J.,6 :383 [1987])。或者,感染可以在更晚的阶段执行。可以将病毒或病毒产生细胞注射到囊胚腔中(Jahner等,Nature 298 :623 [1982])。大多数建立者对于转基因是嵌合的,因为掺入只发生在形成转基因动物的一部分细胞中。此外,建立者可能在基因组的不同位置处包含转基因的各种反转录病毒插入,其在后代中一般将分离。此外,还可能通过妊娠中期胚胎的子宫内反转录病毒感染将转基因导入种系,尽管效率较低(Jahner等,同上[1982])。本技术领域已知的使用反转录病毒或反转录病毒载体产生转基因动物的其他手段,包括将反转录病毒粒子或丝裂霉素C处理的反转录病毒产生细胞微注射到受精卵或早期胚胎的卵周空间中(PCT国际专利申请WO 90/08832 [1990],以及Haskell和Bowen, Mol.Reprod. Dev. ,40 :386[1995])。在其他实施方案中,将转基因导入胚胎干细胞中,并使用转染的干细胞形成胚胎。ES细胞通过将预先植入的胚胎在体外的适合条件下培养来获得(Evans等,Nature 292 154 [1981] ;Bradley 等,Nature 309 :255 [1984] ;Gossler 等,Proc. Acad. Sci. USA 83:9065[1986];和Robertson等,Nature 322 :445[1986])。转基因可以利用本技术领域已知的各种方法通过DNA转染有效地导入ES细胞,所述方法包括磷酸钙共沉淀、原生质体或原生质球融合、脂转染和DEAE-葡聚糖介导的转染。转基因也可以通过反转录病毒介导的转导或通过微注射导入到ES细胞中。这些转染的ES细胞在导入到囊胚阶段胚胎的囊胚腔中之后定植于胚胎,并促成所产生的嵌合动物的种系(综述参见Jaenisch, Science 240 1468 [1988])。在将转染的ES细胞导入囊胚腔之前,可以对转染的ES细胞实施各种选择方 案以富集整合有转基因的ES细胞,假如所述转基因具有这样的选择手段的话。或者,可以使用聚合酶链反应筛选整合有转基因的ES细胞。这种技术不需要将转染的ES细胞在转入囊胚腔之前在适合的选择条件下生长。在其他实施方案中,使用同源重组来敲除基因功能或产生缺失突变体(例如截短突变体)。同源重组的方法描述在美国专利5,614,396中,在此引为参考。实验提供了下面的实施例以便对本发明的某些优选实施方案和方面进行演示和进一步说明,这些实施例不应被解释为对本发明范围的限制。实施例I :ERG与ETVl基因融合体A.材料和方法癌症异常值谱分析(COPA)对Oncomine 3. 0中包含10,486个微阵列实验的132个基因表达数据组进行了COPA分析。此外,COPA分析中包括来自99个扩增的激光捕获显微切割前列腺组织样品的数据。COPA分三步进行。首先,将基因表达值以中位数为中心,将每个基因的中位数表达值设为零。其次,计算中位数的绝对偏差(MAD),并通过将每个基因表达值除以其MAD而以I为标度。使用中位数和MAD而不是平均值和标准偏差进行变换,以便异常表达值不过份影响分布估算值,因此在归一化后得到保留。第三,对于每个基因将变换过的表达值的75th、9(^和95th百分位数制表,然后将基因按照其百分位数分值进行排序,提供了异常值谱的以优先顺位排列的名单。样品使用的组织来自于密歇根大学(University of Michigan)的根治性前列腺切除术系列和快速尸检计划(Rapid Autopsy Program) (Shah等,Cancer Res 64,9209 (Dec 15,2004)), 二者都是密歇根大学前列腺癌杰出研究专项(Specialized Program of ResearchExcellence) (S. P. 0. R. E.)组织核心的一部分。
也从Ulm大学医院(Ulm,德国)的根治性前列腺切除术系列获得组织。所有样品在得到每个相应机构的学术审查委员会批准后从同意的患者中收集。使用Trizol (Invitrogen),按照制造商的说明书从所有样品分离总RNA。也从RWPE、PC3、PC3+AR(Dai 等,Steroids 61,531 (1996) )、LNCaP、VCaP 和 DuCaP 细胞系分离总 RNA。RNA 的完整性通过变性福尔马林凝胶电泳或Agilent Bioanalyzer 2100进行验证。还使用了可商购的良性前列腺组织总RNA的合并物(CPP,Clontech)。定量PCR (QPCR)定量PCR(QPCR)在 Applied Biosystems 7300 实时 PCR 系统上,使用 SYBR Green染料基本上按照描述进行(Chinnaiyan 等,Cancer Res 65, 3328 (2005) ; Rub in 等,CancerRes 64,3814(2004))。简单来说,使用 Superscript III (Invitrogen),在存在随机引物或随机引物和寡聚dT引物的情况下,将1-5 u g总RNA反转录成cDNA。所有反应使用SYBRGreen Master Mix (Applied Biosystems)和正向与反向引物各25ng,使用制造商推荐的热循环条件进行。所有反应经历了解链曲线分析,并将来自所选实验的产物在I. 5%琼脂 糖凝胶上通过电泳进行分离。对于每个实验来说,在QPCR反应的指数期中使用序列检测软件 I. 2. 2 版(Sequence Detection Software version I. 2. 2) (Applied Biosystems)设置阈值水平。使用比较阈值循环(Ct)方法(Applied Biosystems用户手册#2)测定了每个样品的每个靶基因相对于持家基因甘油醛-3-磷酸脱氢酶(GAPDH)的量,其中在每个实验中用作校准物的cDNA样品描述在图例说明中。所有寡核苷酸引物由Integrated DNATechnologies 公司合成。GAPDH 引物如(Vandesompele 等,Genome Biol 3, RESEARCH0034 (2002))中所述,并列出了所有其他引物(表4)。使用前列腺癌cDNA或质粒模板的连续稀释液证实了引物的效率近似相等,以便使用比较Ct方法。RNA连接酶介导的cDNA末端快速扩增(RLM-RACE)RNA连接酶介导的cDNA末端快速扩增使用GeneRacer RLM-RACE试剂盒(Invitrogen),按照制造商的说明书来进行。首先,通过QPCR根据ERG或ETVl的表达来选择样品。将5微克总RNA用牛肠磷酸酶进行处理以从截短的mRNA和非mRNA除去5’磷酸,并用烟草酸性焦磷酸酶去帽。将GeneRace RNA寡聚物连接到全长转录本上,并使用Superscript III进行反转录。为了获得5’末端,对于ETVl使用GeneRacer 5’引物和ETVl外显子4-5_r、或者对于ERG使用GeneRacer 5’引物和ERG外显子4a_r或ERG外显子4b_r,使用 Platinum Taq High Fidelity (Invitrogen)扩增第一链 cDNA。给出了引物序列(表S2)。将产物在I. 5%琼脂糖凝胶上通过电泳分离,并将条带切下、纯化并T0P0 TA克隆到pCR 4-T0P0中。使用M13反向和M13正向(-20)引物或T3和T7引物,在ABI Model3730自动测序仪上对来自至少4个克隆的纯化的质粒DNA进行双向测序,测序由密歇根大学 DNA 测序中心(University of Michigan DNA Sequencing Core)进行。RLM-RACE 得到的cDNA不用于其他测定。TMPRSS2:ERG融合体的反转录PCR在如上所述使用QPCR鉴定到TMPRSS2:ERG阳性病例后,使用Platinum Taq HighFi de I i ty和TPRSS2: ERG引物,对同样的cDNA样品进行PCR扩增。将产物通过电泳分离,克隆到pCR 4-T0P0中并如上所述进行测序。体外雄激素响应性将用人类雄激素受体(PC3+AR) (3)稳定转染的RWPE、LNCaP、VCap DuCaP、PC3和PC3细胞用I %乙醇对照或InM合成的雄激素R1881处理24小时。分离总RNA并如上所述使用ERG外显子5-6_f和_r引物进行反转录和QPCR。将每个样品的ERG/GAPDH的相对量针对RWPE对照样品进行校正。荧光原位杂交(FISH)使用来自正常外周血淋巴细胞和转移的前列腺癌样品MET-26和MET-28的福尔马林固定的石蜡包埋(FFPE)组织切片进行间期荧光原位杂交(FISH)分析。此外,在含有来自13个临床局限性前列腺癌和16个转移前列腺癌样品的FFPE切片的核心的组织微阵列上,进行了间期FISH。使用双色双信号方法,使用了跨越大部分相应基因座的探针评估 TMPRSS2与ETVl的融合体。生物素-14-dCTP BAC克隆RP11-124L22用于ETVl基因座,地高辛-dUTP标记的BAC克隆RPP11-35CD用于TMPRSS2基因座。为了分析包含ERG的基因重排,使用了分离信号探针策略,使用了跨过ERG基因座的两个探针(生物素-14-dCTP标记的BAC克隆RP11-476D17和地高辛-dUTP标记的BAC克隆RP11-95I21)。所有BAC克隆从奥克兰研究所儿童医院(Children,s Hospital of Oakland Research Institute)(CHORD获得。在组织分析之前,所有探针的完整性和纯度通过与正常外周血淋巴细胞的中期涂片进行杂交来验证。组织杂交、清洗和颜色检测按照描述进行(Rubin等,Cancer Res64,3814(2004) ;Garraway 等,Nature 436,117(2005))。B.结果癌症异常值谱分析近年来,使用DNA微阵列进行的基因表达谱分析已变成研究癌症转录组学的常用方法。微阵列研究为癌症的分子异质性提供了深入的了解,常常鉴定到与肿瘤组织学、患者结果和治疗响应相对应的新的疾病分子亚型(Valk等,N Engl J Med 350,1617 (2004)) 0然而,一般来说,转录组分析不导致发现新的致癌基因。据假定,引起癌基因显著过表达的重排和高水平拷贝数变化,在转录组数据中应该是明显的,但以传统分析方法不一定明显。在绝大部分癌症类型中,已经观察到癌基因活化的异质样式,因此,在一类癌症样品中搜索基因的共同活化的传统分析方法(例如t_检验或信噪比)不能发现这样的癌基因表达谱。相反,需要搜索在一部分病例中明显过表达的方法。在开发本发明的过程中进行的实验导致开发出癌症异常值谱分析(COPA)。COPA通过在基因表达谱的中位数和中位数绝对偏差的基础上进行简单的数字变换,设法突出并鉴定异常值谱(Ross等,Blood 102,2951 (2003))。这种方法显示在图5A中。将COPA应用于Oncomine数据库(Bittner等,Nature 406,536 (2000)),该数据库包含了代表10,486个微阵列实验的132个基因表达数据组的概览。在已知发生复现性重排或高水平扩增的特定癌症类型中,COPA正确鉴定到了基因的几个异常值谱。分析集中于由癌基因普查(Cancer Gene Census)所确定的已知致癌基因的异常值谱(Vasselli 等,Proc Natl Acad Sci U S A 100,6958 (2003)),其在Oncomine数据组中排序在前10位异常值情况中(表I和表3)。例如,在Valk等的急性粒细胞性白血病(AML)数据组中,RUNX1T1 (ETO)在95th百分位数处具有最强的异常值谱,与该基因在AML亚组中已知的易位和致癌活性相符(Davis等,Proc Natl Acad Sci U S A100,6051 (2003))(表I)。异常值谱与具有已记载的融合了 RUNXl (AMLl)和RUNX1T1 (ETO)的t(8;21)易位的病例精确相关(图5B)。同样地,在Ross等的急性成淋巴细胞白血病(ALL)数据组中,PBXl在90th百分位数处显示出最强的异常值谱,与在ALL亚组中已知发生的 E2A-PBX1 易位相一致(Segal 等,J Clin Oncol 21,1775(2003))(表 I)。同样地,异常值表达谱与该ALL组中特征性t (I ;19)E2A-PBX1易位精确相关(图51C)。在前列腺癌中鉴定ETS家族成员ERG和ETVl的异常值谱接下来对新的COPA预测进行检验。在几个独立的数据组中,COPA鉴定到了 ERG和ETVl在前列腺癌中的强的异常值谱,ERG和ETVl是已知与尤文氏肉瘤和粒细胞性白血病中的致癌易位相关的两种ETS家族转录因子(Lapointe等,Proc Natl Acad Sci USA101,811 (2004) ;Tian 等,N Engl J Med 349, 2483 (2003))。在 Dhanasekaran 等(Keats 等,Blood 105,4060 (2005))、Welsh 等(Dhanasekaran 等,Faseb J 19, 243 (2005))和 Lapointe等(Wang等,Lancet 365,671 (2005))的前列腺癌基因表达数据组中,ERG在75th百分位数处具有分值最高的异常值谱(表I),而在Lapointe等和Tomlins等(Welsh等,Cancer Res 61,5974(2001))的数据组中,ETVl在90th百分位数处具有分值最高的异常值谱(表I)。总的来说,在七次独立的前列腺癌谱分析研究中,COPA将ERG或ETVl九次排序在前十位异常值基因中。ERG和ETVl 二者都与尤文氏肉瘤中的致癌易位相关。EWS基因的5’活化结构域与ETS家族成员高度保守的3’ DNA结合结构域的融合,例如ERG (t (21 ;22) (q22 ;ql2))或 ETVl (t (7 ;22) (p21 ;ql2)),是尤文氏肉瘤的特征(Lapoint 等,同上;Zhan 等,Blood 99,1745(2002) ;Fonseca 等,Cancer Res 64,1546(2004))。因为涉及 ETS 家族成员的易位在致癌转化中是功能上冗余的,因此在每个尤文氏肉瘤病例中典型地只观察到一种类型的易位。设想了如果ERG和ETVl同样地参与前列腺癌的发生,它们的异常值谱应该是相互排斥的,也就是说,在每个病例中应该只过表达两种基因中的一种。在功能上冗余的基因或相同致癌途径的基因中的突变,在肿瘤发展中不可能被共同选择。在几个前列腺癌数据组中检查了 ERG和ETVl的联合表达谱,并发现它们显示出互相排斥的异常值谱。鉴定了来自两项大规模转录组学研究(Wang等,同上;Cheok等,Nat Genet 34,85 (2003))的ERG和ETVl的表达谱(图1A,左图和中图),所述研究使用不同的微阵列平台对大体切片的前列腺组织进行了谱分析。由Lapointe等进行的研究对良性前列腺组织、临床局限性前列腺癌和转移前列腺癌进行了谱分析,其中ERG和ETVl的异常表达仅限于前列腺癌和转移的前列腺癌,而由Glinsky等进行的研究只对临床局限性前列腺癌样品进行了谱分析。在这两项研究中,前列腺癌排他性地表达ERG或ETVl (图1A,右图)。在通过激光捕获显微切割(LCM)获得的99个前列腺组织样品的谱分析研究中,发现了相似的结果(Welsh等,同上)。除了ERG或ETVl的排他性的异常表达之外(图1B,右图),LCM研究的结果还证实,ETVl和ERG只在来自前列腺癌或转移前列腺癌的上皮细胞中过表达,而在一般认定的前期病变前列腺上皮内瘤(PIN)或附近的良性上皮中没有过表达。为了直接确定观察到的排他性异常值样式是否与其中活化基因能够与多种配偶体融合的其他易位相一致,对Zhan等的多发性骨粒细胞瘤数据组(Dhanasekaran等,Nature 412,822 (2001))进行了检查。免疫球蛋白重链启动子分别与CCNDl或FGFR3、t (11,14)或t (4,14)的复现性融合,表征了多发性骨髓瘤的特定亚组(Wigle等,Cancer Res 62, 3005 (2002)) 这些易位反映在异常值谱分析中(图1C),因为CCNDl在75th百分位数处是分值最高的异常值,FGFR3在95th百分位数处是分值第三高的异常值(表I)。除了两个病例之外,骨髓瘤样品显示出CCNDl或FGFR3的排他性过表达(图1C,右图)。合在一起,在多种前列腺癌数据组中ERG和ETVl的异常值谱与各种人类恶性肿瘤中的其他致病突变相一致。这种在个体前列腺癌样品中ERG或ETVl的排他性过表达与其中活化基因能够与生物学冗余配偶体基因融合的其他肿瘤、例如多发性骨髓瘤相一致。在前列腺癌中TMPRSS2与ERG或ETVl的复现性基因融合体的发现接下来研究了 ERG和ETVl在个体前列腺癌样品中过表达的机制。通过执行定量PCR(QPCR)鉴定了过表达ERG或ETVl的前列腺癌细胞系和临床样本(图2A)。通过QPCR发现,LNCaP前列腺癌细胞系和从死于激素抗拒性转移前列腺癌的患者获得的两个样本(MET-26RP,前列腺中的残余原发癌,以及淋巴结转移肿瘤MET-26LN)显著过表达ETVl (图2A)。通过DNA微阵列分析发现,来自该患者的不同解剖位置的5个独立的转移病灶以及前列腺中的残余癌也过表达ETVl (Welsh等,同上),表明ETVl活化发生在广泛转移之前的原发肿瘤中。在来自死于激素抗拒性转移前列腺癌的第二个患者的淋巴结转移肿瘤 (MET-28LN)和两个前列腺癌细胞系VCaP和DuCaP中,也鉴定到了过表达的ERG (图2A)。这些细胞系从患有激素抗拒性前列腺癌的第三个患者的椎骨转移肿瘤(VCaP)和硬膜转移肿瘤(DuCaP)独立分离(Golub 等,Science 286, 531 (1999) ;Rosenwald 等,Cancer Cell 3,185(2003))。在这两个细胞系中ERG的共同过表达,再一次表明ERG活化发生在广泛转移之前。合在一起,这些结果表明在前列腺肿瘤发生期间,特定遗传事件可能活化了个体样品中的ERG或ETVl。为了尝试对这些遗传事件进行表征,试验了具有高ERG或ETVl表达的样品在其相应基因座处(7p21. 2和21q22. 3)的染色体扩增。通过对基因组DNA进行QPCR,在样品中没有发现ERG或ETVl的扩增以及相应的转录物过表达(Sotiriou等,Proc Natl Acad Sci US A 100,10393(2003))。接下来,检测了 DNA重排的发生。因为用于上述QPCR的引物位于尤文氏肉瘤中ERG和ETVl的已知断点的5’端,因此在前列腺癌中不可能发生相同的易位。因此,在上面鉴定到的表现出ETVl过表达的样品中通过外显子步移QPCR测量了 ETVl外显子的表达水平。使用了跨越ETVl外显子2到7的5个引物对,并且LNCaP细胞显示了所有测量到的ETVl外显子的基本上一致的过表达,并且两个MET26样本都显示出ETVl外显子2和3与外显子4-7相比表达降低>90% (图2B)。该结果的可能解释包括可变剪接、新的癌症特异性同种型或未报道的重排。为了对全长ETVl转录物进行表征,对LNCaP细胞和MET26-LN进行了 5’ RNA连接酶介导的cDNA末端快速扩增(RLM-RACE)。此外,进行了 RLM-RACE以获得MET28-LN中ERG的全长转录物。为了从RLM-RACE cDNA对ETVl进行PCR扩增,使用了与连接到完整转录物的5’末端的RNA-寡核苷酸互补的正向引物和在LNCaP细胞和MET26-LN两者中过表达的最靠近5’端的外显子一外显子4中的反向引物。利用与上述相似的策略,确定了 ERG的外显子4在MET28-LN中过表达。使用该外显子中的反向引物对RLM-RACE cDNA进行PCR扩增。克隆产物的测序显示出前列腺特异性基因TMPRSS2(28) (21q22. 2)在MET26-LN中与ETVl融合,在MET28-LN中与ERG融合(图2C)。在MET26-LN中,鉴定到两种RLM-RACE PCR产物。第一种产物TMPRSS2: ETVla导致TMPRSS2的完整外显子I与ETVl的外显子4的开始端融合(图2C)。第二个产物TMPRSS2:ETVlb导致TMPRSS2的外显子I和2与ETVl的外显子4的开始端融合(图6)。这两种产物都与上面描述的外显子步移QPCR相一致,其中MET26-LN显示出失去了外显子2和3的过表达。在MET28-LN中,鉴定到单个RLM-RACE PCR产物,并且测序显示TMPRSS2的完整外显子I与ERG的外显子4的开始端融合(TMPRSS2:ERGa)(图 2C)。前列腺癌中TMPRSS2:ERG和TMPRSS2:ETV1基因融合体的验证根据这些结果设计了 QPCR引物对,其中正向引物在TMPRSS2中,反向引物在ERG和ETVl的外显子4中。使用这两种引物对在来自于42个临床局限性前列腺癌和转移前列腺癌病例的一组样品中进行了 SYBR Green QPCR,并对代表性结果进行图示(图2D和E)。这些结果证明,只有具有高水平ETVl或ERG的样品才表达相应的与TMPRSS2的融合产物。尽管在某些阴性样品中,在35个循环后QPCR产生了可测量的产物,但解链曲线分析显示在阳性和阴性样品中产物不同,并且在40个循环的QPCR分析后产物的凝胶电泳显示出在阴性融合样品中只有引物二聚体(图2D和E)。引物二聚体的形成可以用由于高GC含量 (80. 3% )导致设计在TMPRSS2的整个外显子I中的引物的困难性来部分解释。然而,使用Taqman QPCR,利用跨越相应融合体的正向引物,证实了 TMPRSS2:ERGa、TMPRSS2:ETVla和TMPRSS2:ETVlb融合体的特异性表达,并且在每种情况下,只在与SYBR Green QPCR相同的病例中检测到产物(Sotiriou等,同上)。为了进一步证实用于SYBR Green QPCR的引物和扩增子的特异性,使用与SYBR Green QPCR相同的引物对一组表达TMPRSS2:ERGa的样品进行了标准的反转录PCR。获得了大小相似的产物,并且对克隆产物的测序证实了TMPRSS2:ERGa的存在。鉴定到了两个分别表达高水平ETVl或ERG、但是通过QPCR没有显示出易位迹象的病例PCA16和PCA17(图2D和E)。RLM-RACE支持了这些结果,因为在PCA16中使用ETVl引物产生的产物的测序没有显示出融合转录物的迹象,并且在PCA17中使用ERG引物不能获得产物。对于LNCaP细胞获得了类似结果,通过RLMRACE或QPCR没有获得融合的证据,与上述的外显子步移QPCR相一致。前列腺癌样品中TMPRSS2与ETS家族成员融合转录物的证据归纳对TMPRSS2: ERG和TMPRSS2: ETVl融合转录物进行了三种不同测定,包括RLM-RACE产物的测序、QPCRJP RT-PCR产物的测序,结果概括在表2中。除了对TMPRSS2融合体的QPCR是在所有样品中进行之外,使用了几种技术在选定的样品上证实这些融合体的存在。例如,在PCAl (前列腺癌样品I)中,使用RLMRACE产物的测序、QPCR以及RT-PCR产物的测序来鉴定TMPRSS2:ERGa。通过QPCR解链曲线分析和QPCR产物的凝胶电泳,PCA4产生了比预期更大的扩增子。随后的RLM-RACE分析证实了 TMPRSS2的完整外显子I与ERG的外显子2的开始端的融合(TMPRSS2:ERGb)(图6)。使用跨越TMPRSS2:ERGb连接处的正向引物进行Taqman QPCR,证实了 TMPRSS2 :ERGb仅存在于PCA4中,使用跨越TMPRSS2 :ERGa连接处的正向引物进行Taqman QPCR,在该样本中不产生产物(27)。TMPRSS2:ERG和TMPRSS2:ETV1融合体的证据只在通过QPCR或DNA微阵列检测到分别过表达ERG或ETVl的病例中发现。这些结果与在异常值分析中观察到的排他性表达相一致。荧光原位杂交(FISH)证实TMPRSS2: ETVl易位和ERG重排在证实了 TMPRSS2:ETV1和TMPRSS2:ERG融合转录物的存在之后,在福尔马林固定的石蜡包埋(FFPE)样本上使用间期荧光原位杂交(FISH)获得了染色体水平上这些重排的证据。使用了两种不同的探针策略双色融合信号方法用于检测TMPRSS2:ETV1易位,以及双色分离信号方法用于检测ERG基因座的重排。在最初用于RLM-RACE的两个病例MET26和MET28上对这些探针策略进行了确认(图3)。使用用于TMPRSS2和ETVl的探针,正常的外周血淋巴细胞(NPL)显示出一对红色和一对绿色的信号(图3A)。MET26显示出一对信号的融合,表明探针重叠(图3B,黄色箭头),与该样品中TMPRSS2:ETV1转录物的表达相一致。此外,鉴定到ETVl基因座的一致的低水平扩增,正如ETVl的两个残留信号所指示的(图3B,红色箭头)。同样地,使用跨过ERG基 因座的5’和3’区域的探针,在NPL中观察到一对黄色信号(图3C)。在MET28中,一对探针分裂成单独的绿色和红色信号,表明了 ERG基因座处的重排(图3D,绿色和红色箭头)。该结果与该病例中TMPRSS2:ERG转录物的表达相一致。根据这些结果,对含有来自13个局域性前列腺癌病例和16个转移前列腺癌病例的核心的系列组织微阵列进行了上面描述的个体FISH分析(图3E)。正如矩阵所显示的,29个病例中的23个(79. 3% )显示出TMPRSS2:ETV1融合(7个病例)或ERG重排(16个病例)的迹象。此外,29个病例中的12个(41. 4% )显示出ETVl基因座处低水平扩增的迹象。以前的报告已经将ETVl的基因组位置7p鉴定为局域性和转移性前列腺癌中最经常扩增的区域之一 (Slamon等,Science 235,177(1987))。然而,似乎不是7p的扩增驱动了ETVl表达,因为在6个具有ERG重排的病例中发生了 ETVl扩增,并且我们的转录物数据证实在19个样品中无一具有高ERG表达,而且TMPRSS2:ERG融合体也具有高ETVl表达。此夕卜,当通过FISH发现ETVl扩增和TMPRSS2:ETV1融合均存在时,只有ETVl个体信号被扩增,而没有融合信号。然而,该FISH分析的结果在基因组水平上证实了 TMPRSS2:ETV1和ERG重排的存在,与上面描述的转录物数据相一致。TMPRSS2是雄激素调控基因,并且与ERG的融合导致了 ERG的雄激素调控。TMPRSS2最初被鉴定为前列腺特异性基因,在LNCaP细胞中其表达被雄激素增加,并且在其启动子中也含有雄激素响应兀件(ARE) (Huang 等,Lancet 361,1590 (2003) ;Schwartz 等,CancerRes 62,4722(2002))。随后的研究证实了在正常和肿瘤前列腺组织中的高表达,并证明了在雄激素敏感性前列腺细胞系中TMPRSS2受雄激素调控(Schwartz等,Cancer Res62,4722(2002) ;Ferrando 等,Cancer Cell 1,75(2002) ;Chen 等,Mol Biol Cell 14,3208(2003) ;LaTulippe 等,Cancer Res 62,4499(2002))。此外,尽管在雄激素不敏感性前列腺癌细胞系PC3中雄激素不增加TMPRSS2的表达,但PC3细胞中雄激素受体的稳定表达导致TMPRSS2变成雄激素响应性(Schwartz等,同上;Ferrando等,同上;Chen等,同上;LaTulippe等,同上)。相反,用雄激素处理的LNCaP前列腺细胞系的微阵列研究没有将ERG或ETVl鉴定为雄激素响应性(Jain等,Cancer Res 64,3907 (2004)),并且对它们的启动子序列进行的研究没有揭示出共有的ARE(Sotiric)U等,同上)。DuCaP和VCaP细胞系中的TMPRSS2:ERGa融合在每种细胞系中通过三种独立的测定方法得以证实(表2),预期所述融合将导致ERG的雄激素调控。使用QPCR测定ERG表达,证实了尽管ERG在VcaP和DuCaP细胞中高表达,但用合成的雄激素R1881进行处理,导致与未处理的对照相比,ERG的表达在DuCaP细胞中增加2. 57倍,在VCaP细胞中增加5. 02倍(图4)。在R1881处理后,与未处理的对照相比,ERG的表达在RffPE (I. 37倍)、LnCaP (O. 86倍)、PC3 (I. 28倍)和表达雄激素受体的PC3细胞(O. 73倍)中是最低限度的或基本上不变。同样样品的微阵列分析证实了在DuCaP和VCaP细胞中ERG只对雄激素做出响应而上调(Sotiriou等,同上)。本发明不限于具体的机制。事实上,对于实践本发明来说,对机制的理解不是必需的。然而,设想了这些结果表明了当存在相应的与TMPRSS2的融合体时,ERG或ETVl的异常表达在前列腺癌中的可能机制。表I.癌症异常值谱分析(COPA)。显示了已知在癌症中经历致病突变的、具有强烈的异常值谱的基因。“X”表示所获得的病理基因组易位的文献证据。“XX”表示特定易位以及特定研究中用于对该易位进行表征的样品的文献证据。“Y”表示与已知扩增相一致。“**”表示前列腺癌中ERG和ETVl的异常值谱。表I·
权利要求
1.一种用于在患者中鉴定前列腺癌的方法,所述方法包含 (a)提供来自于患者的样品;以及 (b)检测样品中具有来自于SLC45A3基因的转录调控区的5’部分和来自于ERG基因的3’部分的基因融合体的存在或不存在, 其中在样品中检测到所述基因融合体的存在鉴定患者患有如列腺癌。
2.权利要求I的方法,其中SLC45A3基因的转录调控区包含SLC45A3基因的启动子区。
3.权利要求I的方法,其中步骤(b)包含检测具有来自于SLC45A3基因的转录调控区的5’ DNA部分和来自于ERG基因的3’ DNA部分的基因组DNA的染色体重排。
4.权利要求I的方法,其中步骤(b)包含检测具有从SLC45A3基因的转录调控区转录的5’ RNA部分和从ERG基因转录的3’ RNA部分的嵌合mRNA转录物。
5.权利要求I的方法,其中样品选自组织、血液、血浆、血清、尿液、尿液上清液、尿液细胞沉淀物、精液、前列腺分泌物和前列腺细胞。
6.一种用于在患者中鉴定前列腺癌的方法,所述方法包含 (a)提供来自于患者的样品;以及 (b)检测样品中具有来自于FLJ35294基因的转录调控区的5’部分和来自于ETS家族成员基因的3’部分的基因融合体的存在或不存在, 其中在样品中检测到所述基因融合体的存在鉴定患者患有如列腺癌。
7.权利要求6的方法,其中FLJ35294基因的转录调控区包含FLJ35294基因的启动子区。
8.权利要求6的方法,其中ETS家族成员基因是ETVl。
9.权利要求6的方法,其中步骤(b)包含检测具有来自于FLJ35294基因的转录调控区的5’ DNA部分和来自于ETS家族成员基因的3’ DNA部分的基因组DNA的染色体重排。
10.权利要求6的方法,其中步骤(b)包含检测具有从FLJ35294基因的转录调控区转录的5’ RNA部分和从ETS家族成员基因转录的3’ RNA部分的嵌合mRNA转录物。
11.权利要求6的方法,其中样品选自组织、血液、血浆、血清、尿液、尿液上清液、尿液细胞沉淀物、精液、前列腺分泌物和前列腺细胞。
12.一种用于在患者中鉴定前列腺癌的方法,所述方法包含 (a)提供来自于患者的样品;以及 (b)检测样品中具有来自于DDX5基因的5’部分和来自于ETS家族成员基因的3 ’部分的基因融合体的存在或不存在, 其中在样品中检测到所述基因融合体的存在鉴定患者患有如列腺癌。
13.权利要求12的方法,其中ETS家族成员基因是ETV4。
14.权利要求12的方法,其中步骤(b)包含检测具有来自于DDX5基因的5’DNA部分和来自于ETS家族成员基因的3’ DNA部分的基因组DNA的染色体重排。
15.权利要求12的方法,其中步骤(b)包含检测具有从DDX5基因转录的5’RNA部分和从ETS家族成员基因转录的3’ RNA部分的嵌合mRNA转录物。
16.权利要求12的方法,其中步骤(b)包含检测具有DDX5基因编码的氨基端部分和ETS家族成员基因编码的羧基端部分的嵌合蛋白。
17.权利要求12的方法,其中样品选自组织、血液、血浆、血清、尿液、尿液上清液、尿液细胞沉淀物、精液、前列腺分泌物和前列腺细胞。
18. 一种组合物,其包含下列至少一种 (a)寡核苷酸探针,其包含与嵌合基因组DNA或嵌合mRNA的连接处杂交的序列,其中嵌合基因组DNA或嵌合mRNA的5’部分来自于SLC45A3基因的转录调控区、和嵌合基因组DNA或嵌合mRNA的3’部分来自于ERG基因; (b)第一个寡核苷酸探针,其包含与来自于SLC45A3基因的转录调控区的嵌合基因组DNA或嵌合mRNA的5’部分杂交的序列,以及第二个寡核苷酸探针,其包含与来自于ERG基因的嵌合基因组DNA或嵌合mRNA的3’部分杂交的序列; (c)第一个扩增寡核苷酸,其包含与来自于SLC45A3基因的转录调控区的嵌合基因组DNA或嵌合mRNA的5’部分杂交的序列,以及第二个扩增寡核苷酸,其包含与来自于ERG基因的嵌合基因组DNA或嵌合mRNA的3’部分杂交的序列; (d)寡核苷酸探针,其包含与嵌合基因组DNA或嵌合mRNA的连接处杂交的序列,其中嵌合基因组DNA或嵌合mRNA的5’部分来自于FLJ35294基因的转录调控区、和嵌合基因组DNA或嵌合mRNA的3’部分来自于ETVl基因; (e)第一个寡核苷酸探针,其包含与来自于FLJ35294基因的转录调控区的嵌合基因组DNA或嵌合mRNA的5 ’部分杂交的序列,以及第二个寡核苷酸探针,其包含与来自于ETVl基因的嵌合基因组DNA或嵌合mRNA的3’部分杂交的序列; (f)第一个扩增寡核苷酸,其包含与来自于FLJ35294基因的转录调控区的嵌合基因组DNA或嵌合mRNA的5’部分杂交的序列,以及第二个扩增寡核苷酸,其包含与来自于ETVl基因的嵌合基因组DNA或嵌合mRNA的3’部分杂交的序列; (g)寡核苷酸探针,其包含与嵌合基因组DNA或嵌合mRNA的连接处杂交的序列,其中嵌合基因组DNA或嵌合mRNA的5’部分来自于DDX5基因、和嵌合基因组DNA或嵌合mRNA的3’部分来自于ETV4基因; (h)第一个寡核苷酸探针,其包含与来自于DDX5基因的嵌合基因组DNA或嵌合mRNA的5’部分杂交的序列,以及第二个寡核苷酸探针,其包含与来自于ETV4基因的嵌合基因组DNA或嵌合mRNA的3’部分杂交的序列; (i)第一个扩增寡核苷酸,其包含与来自于DDX5基因的嵌合基因组DNA或嵌合mRNA的5’部分杂交的序列,以及第二个扩增寡核苷酸,其包含与来自于ETV4基因的嵌合基因组DNA或嵌合mRNA的3’部分杂交的序列; (j)针对具有DDX5基因编码的氨基端部分和ETV4基因编码的羧基端部分的嵌合蛋白的抗体。
全文摘要
本发明描述了前列腺癌中雄激素调控基因或持家基因与ETS家族成员基因的复现性基因融合体。还提供了在前列腺癌诊断、研究和治疗中有用的组合物和方法。
文档编号C12Q1/68GK102812130SQ200980154834
公开日2012年12月5日 申请日期2009年11月18日 优先权日2008年11月18日
发明者阿鲁·M·辛莱岩, 韩博, 昌达·库马尔 申请人:密歇根大学董事会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1