肿瘤分级和癌症预后的制作方法

文档序号:570958阅读:571来源:国知局
专利名称:肿瘤分级和癌症预后的制作方法
技术领域
本发明涉及具有与癌症临床相关性的基因表达图谱或模式的鉴定和使用。具体地说,本发明部分基于其表达与肿瘤等级相关的基因的一致性。基因表达水平形成了能够确定患者的肿瘤等级并预测临床结果以及该患者预后的分子指标。癌症的这一分子评级可以选择性地与第二种分子指标组合用于诊断癌症及其预后。无论是以核酸表达、蛋白质表达或其他表达形式的基因表达图谱可以用于预测患有癌症的对象的临床结果、预测癌症复发、和/或预测转移性癌症的发生。所述图谱也可用于癌细胞的研究和/或诊断,以及用于研究对象的预后。当用于诊断或预后时,所述图谱用于在预期生命、癌症复发、和/或癌症转移可能性的基础上确定癌症的治疗方案。
背景技术
全基因组表达图谱研究已经为乳癌的预后基因标签建立了一股“小洪流”。一个重要问题是这些标签在预后空间中是否重合以及几个这些标签的组合是否能提供更精确的预后。在一个比较研究中,发现通过使用不同患者组和方法学开发的4种标签(内在亚型、 70-基因标签、创伤反应标签和复发评分)在将患者分为低风险和高风险组中高度一致。而且,将这些标签加以组合没有产生预测精确性的显著提高,这说明由这些标签所跨越的预后信息空间高度重合。已经确定了肿瘤评级的预后重要性(CianfroccaM,Goldstein LJ 0ncologist9 606-16,2004)。先前已经报道了用于癌症预后的各种分子指标。例子包括建立在已显示出高度预后性的97个评级相关基因(Sotiriou C,Wirapati P,Loi S等,J Natl Cancer Inst 98 :262-72,2006) ;70-基因标签(van' t Veer LJ, Dai H, van de Vijver MJ 等, Nature 415 :530-6,2002);以及致癌型 DX-21 基因复发评分算法(Paik S, Shak S, Tang G 等,N Engl J Med 351 =2817-26,2004)基础上的基因组评级指标(GGI)。据报道,97-基因肿瘤评级标签在无关的队列中与70-基因标签和复发评分算法相当,并且假定这些标签的大部分预后能力来自于与细胞增殖相关的基因。上述标签的比较提示肿瘤评级相关基因是这些标签的共同点(参见例如 Sotiriou C, Wirapati P, Loi S J Natl Cancer Inst 98 :262-72,2006 ;Desmedt C, Sotiriou C Cell Cycle 5 :2198-202,2006 ;Loi S, Haibe-Kains B,Desmedt C 等,J Clin Oncol 25 :1239-46,2007 ; VX R Sotiriou C, Piccart MJ Nat Rev Cancer 7 :545-53, 2007)。最近已经提出用一种通过比较肿瘤原性的低⑶44+⑶24-乳癌细胞和正常乳房上皮细胞得到的186-基因“入侵性基因标签”(IGS)将基于增殖的预后空间向外扩展。然而, 仔细检查显示,由于IGS与肿瘤评级标签高度相关(r = 0. 81),其预后能力可能也来自与增殖相关的基因。由于肿瘤评级在预后中的重要性以及存在其表达水平与肿瘤评级和增殖高度相关的几百条基因,可以开发出多种貌似不同的预后标签可能并不令人惊讶。此外,这些基因的预后稳固性和冗余性说明,包括其中一些基因的简单得多的检测可能就足够了。例如,已经注意到,对于预后仅需用于GGI的97个基因中的一部分。在一个独立研究中,Ivshina 等也证明了在硅芯片计算机中(insilico)可以将沈4_基因肿瘤评级标签减少为6个基因 (Ivshina AV, George J, Senko 0 等Genetic reclassification of histologic grade delineates new clinical subtypes of breast cancer(组织学等级的遗传再分类描绘出乳癌的新临床亚型).Cancer Res 66 :10292-301,2006) 这里对文献的引用不能解释为承认所引用的任何文献是相关的在先技术。而且, 其引用不表示对相关公开的搜索。关于所述文献的数据和内容的所有陈述基于可获得的信息,并且不是对其精确性或正确性的承认。发明概述本发明部分基于对肿瘤细胞中与肿瘤评级相关的基因表达水平的发现和确定。除了将所鉴定的基因的表达水平用作肿瘤评级标签之外,该表达水平可以用于提供诸如肿瘤复发的预后信息以及诸如对某些治疗的反应性的预测信息。本发明所鉴定的一个基因编码了 BublB。因此,并且在本发明的第一个方面中,描述了使用BublB基因表达研究或确定肿瘤评级以提供预后信息和/或提供临床反应预测的组合物和方法。在一些情况下,对来自诊断为I级、III级或中间级肿瘤的对象的肿瘤细胞进行确定。用于本发明的细胞的非限制性的例子包括从所述对象新鲜分离的细胞、分离后冷冻的细胞、以及固定和/或包埋的细胞(如福尔马林固定的、石蜡包埋的(FFPE))。在一些实施方式中,所述细胞是乳房细胞,如乳癌细胞。第二个方面,本发明公开了使用4个其他基因表达水平确定肿瘤等级以提供预后信息和/或提供临床反应预测的组合物和方法。这些额外基因编码了 CENPA、NEK2、RACGAP1 和RRM2。因此,本发明部分基于5个基因的发现,这些基因的表达水平可用于确定患有癌症的对象中的肿瘤等级并对该对象提供预后和预测决定。虽然这5个基因中任何一个的表达水平可以单独用于研究或确定肿瘤等级或提供额外信息,本发明的第三个方面包括使用这5个公开的基因的任意组合。因此,在一些实施方式中,可以使用BublB和所述其他4个基因中任何1个、2个或3个的表达水平的组合。 类似地,可以使用CENPA和BubIB、NEK2、RACGAP1或RRM2中任何1个、2个或3个的表达水平的组合;NEK2和BublB、CENPA、RACGAP1或RRM2中任何1个、2个或3个的表达水平的组合;RACGAP1和BublB、CENPA、NEK2或RRM2中任何1个、2个或3个的表达水平的组合;RRM2 和BublB、CENPA, NEK2或RACGAP1中任何1个、2个或3个的表达水平的组合。在一种实施方式中,公开了 5-基因肿瘤等级标签(或分子等级指标)形式的所有 5个表达水平的组合。这一指标(或MGI)在两个不相关队列中能够以与97-基因GGI相仿的表现重现肿瘤等级并预测临床结果。MGI也作为针对癌症复发和/或生存结果的预后因
ο另一个方面,本发明包括组合使用所述5-基因MGI和用于癌症的第二种分子指标。在一种实施方式中,所述组合包括所述第二种分子指标和所有5个公开的基因。在其他实施方式中,所述组合可以包含所述5个公开的基因中的任何1个、2个、3个或4个。在一些情况下,所述第二种分子指标是建立在HoxB13和IL17BR这两个基因表达水平基础上的。具体地说,HoxB13表达相对于IL17BR表达的双基因比率(或HoxB13 :IL17BR比率)可以用作所述第二种分子指标(参见US 2005/0239079A1 ;US 2005/0239083A1 ;和US 2006/0154267A1)。在另一实施方式中,所述第二种指标可以是HoxB13表达相对于CHDH表达的双基因比率。HoxB13 :IL17BR(H I)比率是在对常规预后因素之外的具有临床结果预测性的新的生物标记的研究的基础上发现的。根据肿瘤阶段和等级将癌症复发患者与未复发患者加以比对。发现简单的H I比率适合于接受了辅助它莫西芬治疗的雌激素受体阳性(ER+) 乳癌患者中的癌症复发预测。随后的研究(Ma XJ,Hilsenbeck SG,ffang W等,J Clin Oncol 24 :4611-9,2006 ;Goetz MP, Suman VJ, Ingle JN 等,Clin Cancer Res 12 :2080-7,2006 ; Jerevall PL, Brommesson S, Strand C 等,Breast Cancer Res Treat, 2007 ;以及 Jansen MP, Sieuwerts AM, Look MP 等,J Clin Oncol 25 :662-8,2007)进一步显示,在追溯性和随机性临床试验中,该比率既是预后性的(如作为肿瘤侵略性的一个指标),也是对它莫西芬的益处(即它莫西芬反应/抗性)具有预测性的。在使用实时逆转录聚合酶链式反应(RT-PCR)对所公开的5-基因MGI和H I比率分析的情况下,发现所述组合提供了比任何一种指标单独所能提供的更好的复发风险分级。这反映了一个预料之外的发现,因为这表示H I比率是独立于肿瘤等级的。因此,所述两种指标的组合通过有效分析与癌症相关的独立参数,改进了癌症诊断并使更精确地确定其预后提供了可能。在其他实施方式中,公开的5-基因标签中1个或更多基因的表达可以与其他基因或其他分子指标组合用于癌症预后。非限制性的例子包括基于97-肿瘤等级相关基因 (Sotiriou等,见上文)和这97个基因中的基因子集的基因组等级指标(GGI) ;MammaPrint 70-基因标签(van' t Veer等,见上文)和这70个基因中的基因子集;OncotypeDX 21-基因复发评分算法O^aik等,见上文)和这21个基因中的基因子集;以及Veridex 76基因检测法(Wang等,Lancet, 365 (9460) :671-679,2005)和这76个基因中的基因子集。在其他情况下,公开的5-基因肿瘤等级标签中1个或更多基因的表达可以与其表达与增殖表型相关的1个或更多基因的表达水平组合使用。在一些情况下,其表达与增殖表型相关的基因在上述97、70、21和76个基因的集合范围内。其表达与增殖表型相关的基因的非限制性例子是Ki-67、STK15、生存素(Survivin)、细胞周期蛋白Bl (Cyclin Bi)和MYBL2。因此所述 5个MGI基因中的任何1个、2个、3个或4个基因的表达水平可以与其他基因或其他分子指标用于癌症预后或用作临床结果的预测指标。当然,所有5个基因的表达水平作为一种分子评级指标也可以与以上及下文所述的其他基因或其他指标组合使用。此外,所述MGI基因中的1个、一些或所有基因与其他基因的表达水平的组合也可以进一步与以上及下文所述的H I比率组合,作为一种预后因素或一种临床结果的预测指标。因此,本发明的实施方式包括用于检测所述MGI基因的1个、一些或所有基因、和可选的一个或多个如上所述的其他基因的表达、以及可选地与H I比率组合,作为一种预后因素或一种治疗结果预测指标的方法。这样的检测方法可以用于针对预后值和预测值对 ER+对象进行分级。作为预后值,所述分级可以建立在与作为非限制性例子的肿瘤侵略性相关并由此指示肿瘤侵略性的差异表达水平的基础上。作为预测指标,所述分级可以建立在与化疗反应性(或敏感性)和/或无反应性(或抗性)相关并对此进行指示的差异性表达水平上,这也可以看作化疗益处的一个预测指标。作为一个非限制性实例,所述分级(基于表达水平)可以用于预测内分泌抗性(如作为非限制性实例的它莫西芬抗性)和/或对靶向于内分泌抗性乳癌的抑制剂的益处加以预测。这样的抑制剂的非限制性实例包括靶向mT0R(雷帕霉素的哺乳动物靶点,一种丝氨酸/苏氨酸蛋白激酶)、PI3K(磷酸肌醇3激酶)、一种AKT家族丝氨酸/苏氨酸蛋白激酶(其成员包括人体内的Akt 1、Akt2和Akt3)、 和/或EGFR(表皮生长因子受体;人体内的HER1)的抑制剂。当然可以在任何含有这里所述样本的适当细胞中检测基因表达。在本发明的其他实施方式中,与H I比率无关的肿瘤等级可以与一种不同的分子指标(替代MGI基因中的1个、一些或所有基因)组合用于癌症预后。这样的指标的非限制性实例包括基于97-肿瘤等级相关基因(Sotiriou等,见上文)和这97个基因中的基因子集的基因组等级指标(GGI) ;MammaPrint 70-基因标签(van' t Veer等,见上文)和这 70个基因中的基因子集;0nCOtypeDX21-基因复发评分算法(Paik等,见上文)和这21个基因中的基因子集;以及Veridex 76基因检测法(Wang等,Lancet,365 (9460) :671-679, 2005)和这76个基因中的基因子集。在其他情况下,H I比率可以与其表达与增殖表型相关的1个或更多基因的表达水平组合使用。在一些情况下,其表达与增殖表型相关的基因在上述97、70、21和76个基因的集合范围内。其表达与增殖表型相关的基因的非限制性例子是Ki-67基因、STK15、生存素、细胞周期蛋白Bl和MYBL2。因此,在一些实施方式中,本发明包括对H 1比率的表达以及与之组合的诸如从 Ki-67、STK15、生存素、细胞周期蛋白Bl和MYBL2中选择的一个或多个基因的一个或多个额外基因表达水平的检测。这样的检测方法可以用于针对预后值和预测值对ER+对象进行分级。作为预后值,所述分级可以建立在与作为非限制性例子的肿瘤侵略性相关并由此指示肿瘤侵略性的差异表达水平的基础上。作为预测指标,所述分级可以建立在与化疗反应性 (或敏感性)和/或无反应性(或抗性)相关并对此进行指示的差异性表达水平上,这也可以看作化疗益处的一个预测指标。作为一个非限制性实例,所述分级(基于表达水平)可以用于预测内分泌抗性(如作为非限制性实例的它莫西芬抗性)和/或对靶向于内分泌抗性乳癌的抑制剂的益处加以预测。这样的抑制剂的非限制性实例包括靶向mTOR(雷帕霉素的哺乳动物靶点,一种丝氨酸/苏氨酸蛋白激酶)、PI3K (磷酸肌醇3激酶)、一种AKT家族丝氨酸/苏氨酸蛋白激酶(其成员包括人体内的Akt 1、Akt2和Akt3)、和/或EGFR(表皮生长因子受体;人体内的HER1)的抑制剂。当然可以在任何含有这里所述样本的适当细胞中检测基因表达。另一个方面,选自BublB、CENPA、NEK2、RACGAPl和RRM2的一个或多个基因的表达可以用作预后因素或临床结果的预测指标,或用于具有良性乳房疾病的对象(如在不存在本发明的情况下可能诊断为具有良性乳房疾病的对象)中肿瘤等级的确定。Hartmarm等 (N. Engl. J. Med.,2005,353 :3)讨论了良性乳房疾病的重要性。良性乳房疾病的非限制性实例包括非增殖性病变、无异型性的增殖性病变、和异型增生的组织学发现。鉴于良性乳房疾病诊断后发生乳癌这一观察结果,推测在一些良性乳房疾病中 (诸如涉及具有异型性或异型增生的病变的情况)存在乳癌的前体。因此,本发明包括在对象的乳房细胞(如来自习惯于诊断为良性乳房疾病的组织样本的细胞)中确定肿瘤等级的方法。所述方法可以包括对来自一个对象的乳房细胞样本检测BublB、CENPA、NEK2、RACGAPl 和RRM2的表达水平,其中所述表达水平与I级或III级肿瘤、或甚至中间级肿瘤相关。另外,所述方法可以包括检测这5个基因的任意子集、直至任一所述基因,以确定I级、III级或中间级肿瘤细胞存在的可能性。在一些实施方式中,所述细胞来自习惯于诊断为存在具有异型性或异型增生的病变的样本。当然,本发明还包括在患有良性乳房疾病的对象的样本中使用MGI和H I比率以确定该对象是否面临随后发展成乳癌的风险。另外,本发明提供了对这样的样本仅使用 H I比率以确定乳癌发生的风险。另一个方面,可以将选自BublB、CENPA、NEK2、RACGAPl和RRM2的一个或多个基因的表达用作患有乳腺导管原位癌(或DCIS)的对象中的预后因素或临床结果的预测指标, 或用以确定肿瘤等级。因此,本发明包括在患有或疑似患有DCIS的对象的乳房细胞中确定肿瘤等级的方法。所述方法可以包括对来自对象的乳癌细胞样本检测BublB、CENPA、NEK2、 RACGAP1和RRM2的表达水平,其中所述表达水平用作预后因素或临床结果的预测指标,或其与I级或III级肿瘤、或甚至中间级肿瘤相关。另外,所述方法可以包括对这5个基因的任意子集、直至所述基因中的任何一个进行检测,作为预后因素或临床结果的预测指标,或用以确定I级、III级或中间级肿瘤细胞的存在。另一方面,本发明包括用于检测选自BublB、CENPA、NEK2和RRM2的一个或多个基因表达以用作DCIS中癌症局部复发的预后因素的组合物和方法。在一些实施方式中,基于所述表达水平的方法优选用于含有来自患有DCIS的对象的样本的乳癌细胞。作为一个非限制性实例,所述细胞可以是用于对象中癌症诊断的手术前组织学样本。对于这样的对象, 常规护理是外科手术去除DCIS,其中乳房保留手术优于乳房切除术。这通常跟随着手术后放疗,可选地伴有内分泌疗法(如用它莫西芬、选择性雌激素受体调节剂SERM、选择性雌激素受体下调剂SERD、或芳香酶抑制剂AI的治疗)和/或化疗。但这一针对癌症复发可能性的方案在不会经历癌症复发的许多患者中引起过度治疗,并在癌症复发的情况下导致失败。因此,本发明包括检测所有5个所述基因的表达,其中MGI高表达表示在对象中由于乳房保留手术以及随后的放疗和/或内分泌疗法或化疗失败导致的局部癌症复发可能性的提高。在其他实施方式中,这样的方法采用H I比率的检测作为高MGI表达的替代指标。当然,本发明包括将高MGI和H I比率的检测加以组合,作为DCIS治疗后局部癌症复发可能性提高的指标。另外,所述方法可以包括检测所述5个MGI基因中的任意子集、 直至所述基因中的任何一个基因,并选择性地与H I比率组合,作为DCIS治疗后局部癌症复发可能性提高的指标。所述方法可以进一步包括将对象鉴定为很可能或不大可能经受局部癌症复发的, 并选择性地进一步包括根据预计结果调节针对所述对象的治疗方式。作为一种非限制性实例,对复发的低可能性的确定可以用于确定乳房保留手术的适宜性或选择乳房保留手术, 选择性地结合减少术后治疗,如省略放疗和/或省略内分泌疗法或化疗。作为另一个非限制性实例,对复发的高可能性的确定可以用于确定乳房切除术的适宜性或选择乳房切除术,并包含术后治疗,如放射性和/或内分泌疗法或化疗。
在另一方面,本发明包括使用选自BublB、CENPA, NEK2、RACGAP1和RRM2的一个或多个基因或所有5个基因作为预后因素或临床结果的预测指标,或用于确定基于对早期乳癌初期治疗的 2005 St. Gallen 专家共识(参见 Goldhirsch 等,Ann. Oncol.,2005,16 1569-1583)进行评估的对象中的肿瘤等级。因此,本发明包括对对象的乳房细胞中MGI基因中的一个、一些或所有基因的表达进行评估的方法,作为基于专家共识的差异化诊断和选择疗法的一部分。可以与所公开的方法结合使用的所述专家共识的一部分的非限制性实例包括针对早期乳癌的辅助性全身治疗的选择的算法;对内分泌疗法的反应性或无反应性或不确定的激素反应性;以及结节状态(nodal status) 0当然,也预期了在所述专家共识中包括作为整体的本发明的一个或多个方面。在其他实施方式中,所公开的分子基因表达图谱用于确定低风险和高风险组的分类,并用于将至少一些中等风险类对象确定为低风险或高风险组。在一些情况下,所公开的方法可以用于对诊断为癌症的更年期前或更年期后妇女的疗法的选择或排除。更年期前妇女包括年龄小于约35岁的妇女。在这些对象中,高MGI 表达式癌症复发的指标。因此,如DCIS的情况,本发明包括在更年期前的对象中使用选自 BublB、CENPA、NEK2、RACGAPl和RRM2的一个或多个基因的表达水平作为乳癌复发的预后因素。可选地,也检测H I比率并与MGI基因组合使用。所述方法可以包括检测来自对象的含有样本的乳癌细胞中这些基因的表达。作为一个非限制性实例,所述细胞可以是来自于用于对象癌症诊断的手术前组织学样本。在其他情况下,所述方法包括使用所有这5个基因作为一种实施方式,其中高MGI表达是更年期前对象中癌症复发可能性提高的指标。所述方法可以包括将更年期前对象鉴定为很可能或不大可能经受癌症复发的,并可选择地进一步包括根据预期结果调整对对象的治疗方式。作为一种非限制性实例,确定复发的低可能性可以用于确定乳房保留手术的适宜性或选择乳房保留手术,选择性地结合减少术后治疗,如省略放疗和/或省略内分泌疗法或化疗。作为另一个非限制性实例,对复发的高可能性的确定可以用于确定乳房切除术的适宜性或选择乳房切除术,并包含术后治疗,如放射性和/或内分泌疗法或化疗。在其他情况下,所述方法可以用于帮助选择疗法,如在内分泌疗法、化疗、放疗或其组合中选择。在一些实施方式中,本发明包括用于确定5个MGI基因中的一个或多个基因或所有5个基因的表达水平作为内分泌疗法有效性预测指标的组合物和方法。在一些情况下,所述预测指标可以是对诸如它莫西芬的SERM或SERD的反应性或无反应性。这包括其中对来自对象的含样本的乳癌细胞的检测显示高MGI,说明对它莫西芬可能无反应性的情况。在其他情况下,所述预测指标可以是一种形式的内分泌疗法的有效性优于另一种内分泌疗法。这包括确定MGI基因中的一个、一些或所有基因的表达水平,作为与它莫西芬或另一种SERM或SERD相比,对芳香酶抑制剂(Al)具有更高反应性的指标的方法。所述方法可以包括鉴定一个或所有5个MGI基因的高表达,这表示对AI比它莫西芬更高反应性的可能性。AI的非限制性实例包括非类固醇类抑制剂(如来曲唑(letrozole)和阿那曲唑 (anastrozole))和不可逆类固醇类抑制剂(如依西美坦(exemestane))。在其他情况下,本发明包括用于使用5个MGI基因中的一个或多个或所有5个基因的表达水平作为化疗结果预测指标的组合物和方法。可选地,也检测H I比率并与MGI 基因组合使用。因此,所述基因的表达水平可以用于预测化学敏感性,诸如对作为非限制性实例的紫杉醇/FAC(紫杉醇后续5-氟尿嘧啶、阿霉素和环磷酰胺)或紫杉酚(taxol)或蒽环类治疗的化学敏感性。因此,本发明包括检测所有5个基因的表达,其中高MGI表达是对化疗(如用作为非限制性实例的紫杉醇/FAC的术后治疗(手术后介入))的完全病理反应 (pCR)可能性提高的指标。作为非限制性实例,所述检测可以是针对来自用于对象中癌症诊断的含有样本的术前细胞的癌细胞中表达的。另外,所述方法可以包括对所述5个MGI基因的任意子集、直至所述基因中的任何一个基因的检测,作为对化疗敏感性或抗性的预测指标。所述方法还包括将对象鉴定为很可能或不大可能经受pCR的,并可选地进一步包括根据预期结果调整对该对象的治疗方式。作为非限制性实例,确定PCR的低可能性可以用于确定用诸如紫杉醇/FAC的化疗治疗的适宜性或选择化疗治疗。作为另一种非限制性实例,确定PCR的高可能性可以用于确定省略化疗(如省略紫杉醇/FAC)的适宜性或选择省略化疗,倾向于其他治疗方式,如包括诸如放疗的术后治疗的乳房切除术。本发明还包括将5个MGI基因中的一个或多个基因、或所有5个基因的表达水平用作对于放疗的癌症反应性(敏感性)的预测指标的组合物和方法。可选地,也检测H I 比率并与MGI基因组合使用。因此,高MGI表达可以用于预测乳癌患者对放疗(如手术后介入)的反应性。因此,本发明包括检测所有5个基因的表达,其中高MGI表达是对放疗术后敏感性的指标。作为一种非限制性实例,所述癌细胞可以是来自用于对象中癌症诊断的术前组织学样本的细胞。另外,所述方法可以包括检测所述5个MGI基因的任何子集、直至所述基因中的任何一个基因,作为对放疗反应性的预测指标。所述方法可以进一步包括将对象鉴定为手术介入后对放疗很可能具有反应性或不大可能具有反应性的,并可选地进一步包括根据预期结果调整该对象的治疗方式。作为一种非限制性实例,确定对手术后放疗反应性(敏感性)的可能性可以用于确定放疗的适宜性或选择放疗。作为另一种非限制性实例,确定对手术后放疗反应性(敏感性)的低可能性可以用于确定省略放疗或选择省略放疗,可选地倾向于化疗。


图1,A部分,显示了通过无监督主成分分析(unsupervised principle component analysis)将5_基因表达谱合并成单一指标评分(分子等级指标或MGI)。该MGI与肿瘤等级高度相关。图1,B部分,显示了对整个数据集的基于模型的MGI聚类,产生双峰分布, 其中自然分界点约为0。这一分界点将大部分等级1和等级3肿瘤正确分类(89%总精确度),并将等级2肿瘤分为两组(在低和高MGI组中分别为59%和41% )。图1的C部分中在MGI值彡0和> 0的基础上将等级2肿瘤对象在12年内的存活概率作图,以显示MGI 的预后性能力。图2显示了 MGI和GGI与肿瘤等级和临床结果相关性的对比。A-C部分显示了在 Uppsala队列中所述5基因表达图谱与GGI的对比,而D-F部分对应于斯德哥尔摩队列。A和 D部分是用于区分等级1和等级3肿瘤的MGI和GGI的接受者操作特性(ROC)曲线分析。B-F 部分显示了表示依据MGI或GGI状态(高对低)的乳癌特异性死亡概率的Kaplan-Meier 存活曲线。图3显示了 TRANSBIG队列中依据76-基因预后标签或MGI的Kaplan-Meier存活曲线。A和B部分是针对所有患者的。C和D部分对应于ER+肿瘤等级1或2亚组。图4显示了 MGH队列中通过RT-PCR iTaqManTM检测法确定的MGI。A部分说明了 MGI与肿瘤等级的相关性。B-D部分显示了依据所有患者(B部分)、淋巴结阴性(C部分) 或淋巴结阳性(D部分)患者MGI的无远距离转移生存率的Kaplan-Meier分析。图5显示了在MGH队列中依据MGI (A部分)、H I比率(B部分)、或通过组合MGI 和H I比率(C部分)产生的3个组(低、中等和高风险)、或Oxford队列中相同的三个风险组(D部分)的无远距离转移存活率的Kaplan-Meier分析。图5E显示了在表1队列中MGI和H I比率之间的交互作用。对队列中的淋巴结阴性内分泌疗法或内分泌疗法+ 化疗治疗患者(n = 93)进行了 MGI和H I比率之间交互作用的分析。MGI最适用于在高 Η0ΧΒ13 :IL17BR患者中预测远距离转移,类似地,H I比率在高MGI患者中最适用。图6显示了在表1队列的淋巴结阴性内分泌疗法患者中通过实时RT-PCR确定的 H I比率和MGI与ER、PR和HER2表达的相关性。X轴是通过H I比率、MGI或它们的组合确定的组。Y轴是如标识的ER、PR或HER2的相对表达水平。图7显示了在最后队列中MGI和H I比率之间的交互作用。与表1的队列类似, MGI和H I比率相互提供额外的预后信息。在两种指标中都具有高值的的肿瘤与仅具有一个高值的肿瘤相比,与差得多的结果相关联。图8显示了使用MGI以更精确地将根据Gallen方案区分的中等和低风险人群鉴定为高、中等和低风险人群。图9说明了 MGI值2. 1的假定结果及其与5年内19%的癌症复发风险的相关性。图10显示了按照临床治疗或缺乏临床治疗的通过MGI的患者分级的 Kaplan-Meier曲线分析。A栏显示了没有接受全身性治疗的患者的结果。B栏显示了仅接受了内分泌疗法的患者的结果。HR=由单因素Cox回归分析得到的风险比,并且ρ值通过对数秩检验(log-rank test)获得。图11显示了 MGI对化疗敏感性的预测能力。图12显示了按照更年期前或更年期后状态通过MGI的患者分级的Kaplan-Meier 曲线分析。A栏显示了更年期后妇女(年龄>50)的结果。B栏显示了更年期前妇女的(年龄<50)的结果。HR=由单因素Cox回归分析得到的风险比,并且ρ值通过对数秩检验获得。发明实施方式的详细描述这里所使用的术语的定义基因表达“图案”或“图谱”或“标签”是指在两种或多种临床结果、癌症结果、癌症复发和或生存结果之间与能够区分所述结果相关的一个或多个基因的相对表达。在一些情况下,所述结果是乳癌的结果。“基因”是编码了一种离散产物的一个多核苷酸,所述产物可以是RNA或蛋白质性质的。应当认识到,一种离散产物可以由一个以上的多核苷酸编码。根据染色体定位和在正常有丝分裂过程中重组的能力,该术语包括等位基因和编码了相同产物、或其功能上相关(包括功能的获得、丢失或调节)类似物的一个基因的多态形式。术语“与...相关”或“相关”或其等价语是指通过如本发明所述的方法加以鉴定的一个或多个基因的表达与细胞的一种生理状态有关,以排除一种或多种其他状态。一个基因可以以较高或较低水平表达,并仍与一种或多种癌症状态或结果相关。“多核苷酸”是任何长度的核苷酸的聚合物形式,可以是核糖核苷酸或脱氧核糖核苷酸。这一术语仅指所述分子的初级结构。因此,这一术语包括双链和单链的DNA和RNA。 它也包括已知类型的修饰和无修饰形式的多核苷酸,这些修饰包括本领域内已知的标签、 “帽”结构、用一种类似物取代一个或多个天然核苷酸、以及诸如无电荷联接(如硫代磷酸酯、二硫代磷酸酯等等)的核苷酸间修饰。按照宽泛含义使用的术语“扩增”表示可以用DNA或RNA聚合酶以酶学方式实现扩增产物的创建。这里所使用的“扩增”通常是指产生所需序列(尤其是样本的所需序列) 的多拷贝的过程。“多拷贝”是指至少两个拷贝。“拷贝”不一定表示与模板序列的完全互补或一致。“相应的”是指一个核酸分子与另一个核酸分子共享充分数量的序列一致性。充分数量表示至少95%、通常至少98%、更常见至少99%,且序列一致性是通过Altschul等 (1990),J. Mol. Biol. 215 :403-410(使用公布的默认设置,即参数w = 4,t = 17)所述的 BLAST算法确定的。扩增mRNA的方法是本领域内熟知的,并包括逆转录PCR(RT-PCR)和美国专利申请10/062,857 (2001年10月25日提交)、美国临时专利申请60/298,847 (2001年 6月15日提交)和60/257,801 (2000年12月22日提交)中所述的内容,所有这些文献通过参考完整地结合在本申请中。可以使用的另一种方法是定量PCR(或Q-PCR)。另外,RNA 可以通过本领域内已知的方法以相应的cDNA的形式直接标记。“微阵列”实在诸如但不限于玻璃、塑料或合成膜的固体支撑物表面上形成的优选离散区域的线性或二维阵列,其中每个区域具有定义的面积。微阵列上所述离散区域的密度是由单一固相支撑物表面上待检测的全部数量的固定化多核苷酸决定的,优选至少约 50/厘米2,更优选至少约100/厘米2,更优选至少约500/厘米2,但优选低于约1,000/厘米2。优选地,所述阵列总共包含少于约500、约1000、约1500、约2000、约2500、或约3000 个固定化的多核苷酸。如这里所使用的,DNA微阵列是放置在用于与来自样本的扩增的或克隆的多核苷酸杂交的芯片或其他表面上的寡核苷酸或多核苷酸的阵列。由于该阵列中每组具体引物的位置是已知的,在其与该微阵列中一个具体位置结合的基础上,可以确定样本多核苷酸的特征。因为本发明依赖于过表达或低表达基因的鉴定,本发明的一种实施方式涉及通过样本细胞的mRNA、或其扩增或克隆形式与对于一个具体基因序列具有唯一性的多核苷酸的杂交确定表达。优选的此类多核苷酸含有没有在其他基因序列中发现的一个基因序列的至少约20、至少约22、至少约对、至少约沈、至少约观、至少约30、或至少约32个连续碱基对。 上一句中使用的术语“约”是指对所陈述的数值增加或减少1。更优选的是没有在其他基因序列中发现的一个基因序列的至少约50、至少约100、至少约150、至少约200、至少约250、 至少约300、至少约350、或至少约400个碱基对。上一句中使用的术语“约”是指对所陈述的数值增加或减少10%。这样的多核苷酸也可以称为多核苷酸探针,它们能够与这里所述的基因序列或其唯一性的部分杂交。优选地,所述序列是由所述基因编码的mRNA序列、与这样的mRNA对应的cDNA序列、和/或这样的序列的扩增形式。在本发明的优选实施方式中,所述多核苷酸探针在阵列上、其他装置上、或在定位所述探针的单独的点中固定化。在本发明的另一实施方式中,通过诸如聚合酶链式反应(PCR)及其变化形式(诸如但不限于定量PCR、逆转录PCR、以及实时PCR、可选地实时RT-PCR)可以对所公开序列的全部或部分进行扩增和检测。这样的方法会采用与所公开的序列的一部分互补的一个或两个引物,其中所述引物用于引导核酸合成。可选地对新合成的核酸进行标记并可以直接或通过与本发明的多核苷酸杂交进行检测。新合成的核酸可以在允许其杂交的条件下与本发明的多核苷酸(含有序列)接触。另外,在本发明的另一实施方式中,可以通过使用对所述细胞样本中单独的基因产物(蛋白质)的一个或多个表位特异性的一种或多种抗体分析感兴趣的细胞样本中所表达的蛋白质来确定基因表达。这样的抗体优选加以标记,使其结合基因产物后易于检测。术语“标记”是指能够产生指示所述标记分子存在的可检测信号的组合物。适当的标记包括放射性同位素、核苷发色基团、酶、底物、荧光分子、化学发光部分、磁颗粒、生物发光部分等等。因此,标记是可以通过分光光度、光化学、生物化学、免疫化学、电学、光学或化学手段检测的任何组合物。术语“支撑物”是指诸如珠、颗粒、量杆、纤维、滤纸、膜的常规支撑物以及诸如玻片的硅烷或硅酸盐支撑物。如这里所使用的,“癌组织样本”或“癌细胞样本”是指含有从患有相应癌症的个体中分离的组织样本的细胞。所述样本可以来自通过外科程序(如活组织切片)取出的材料。这样的样本是初级分离物(不同于培养的细胞),并可以通过本领域内认可的任何适当方法收集。在一些实施方式中,所述“样本”可以通过非入侵性方法(包括但不限于磨蚀、 细针抽吸)收集。“乳房组织样本”或“乳房细胞样本”是指从疑似患有乳癌或具有乳癌发生风险的个体中分离的乳房组织或体液的样本。这样的样本是初级分离物(与培养的细胞不同), 并可以通过任何非入侵性方法(包括但不限于导管灌洗、细针抽吸、穿刺活检、美国专利 6,328,709中所述的装置和方法或本领域内认可的任何其他适当的方法)收集。另外,所述 “样本”可以通过入侵性方法(包括但不限于外科活组织检查)收集。“表达”和“基因表达”包括核酸材料的转录和/或翻译。当然,如果这样指出了, 该术语也可以限制为仅表示核酸的转录。如这里所使用的,术语“包含”及其同类词以其包括性含义使用;即等同于术语“包括”及其相应的同类词。“允许”事件发生的条件或“适于”事件发生(如杂交、链延伸等等)的条件、或“适当的”条件,是指不阻碍这样的事件发生的条件。因此,这些条件允许、增强、有助于、和/或有益于所述事件。本领域内已知的并在这里描述的这样的条件依赖于例如核苷酸序列的性质、温度以及缓冲条件。这些条件也依赖于什么事件是所希望的,如杂交、切割、链延伸或转录。如这里所使用的,序列“突变”是指与参照序列相比,这里所公开的一个基因的序列中的任何序列改变。序列突变包括单个核苷酸改变、或由于诸如替代、缺失或插入等机制引起的序列中一个以上核苷酸的改变。单核苷酸多态性(SNP)也是这里所使用的一种序列突变。因为本发明基于基因表达的相对水平,如这里所公开的基因非编码区内的突变也可以在本发明的实践中进行检测。“检测”包括任何检测手段,这包括对基因表达和其中变化的直接和间接检测。例如,可以直接或间接观察“较少可检测”产物,并且该术语表示任何减少(包括不存在可检测信号)。类似地,“较多可检测”产物是指任何增加(无论直接或间接观察)。通过以下基于与正常细胞中表达相比的百分比或倍数改变的术语对所公开序列的表达的增加和减少进行定义。增加可以是相对与正常细胞中表达水平的10、20、30、40、 50、60、70、80、90、100、120、140、160、180、或200%的增加。另外,倍数增加可以是相对于正常细胞中表达水平的 1、1· 5、2、2· 5、3、3· 5、4、4· 5、5、5· 5、6、6· 5、7、7· 5、8、8. 5、9、9· 5、或 10 倍。减少可以是相对于正常细胞中表达水平的10、20、30、40、50、55、60、65、70、75、80、82、 84、86、88、90、92、94、96、98、99 或 100%。除非另有定义,这里所使用的所有技术和科学术语具有本发明所属技术领域内普通技术人员所通常理解的相同含义。鍵本发明中,通过数据推动和知识推动手段,开发了一种5基因肿瘤等级标签 (MGI),并在稳定的RT-PCR检测法中得以实现。所述MGI的一个重要特征是其计算不涉及集中于临床结果的复杂的加权。相反,它是肿瘤等级的分子关联指标并由肿瘤等级推导其预后性能力(所谓的“颠倒”手段)。MGI相对于组织学肿瘤等级的优势是双重的。首先, 与GGI —样,它将等级2肿瘤划分至等级1类或等级3类,这消除了病理肿瘤分级的大部分模糊性。第二,并且由于基于RT-PCR的检测法可以在临床实验室中标准化,它也消除了与病理分级相关的主观性和观察者间/观察者内可变性。公开的结果也显示,通过同时考察H I比率可以增强MGI的预后精确性,反之亦然,这提出了一种将患者划分入3个风险组的简单算法。如所观察到的H I比率但不是 MGI与雌激素信号相关这一结果所示,MGI和H I比率看来代表了乳癌中两种不同的预后模块。除了其预后能力,MGI和H I比率也分别是化疗和内分泌疗法的治疗收益的潜在预测因素。高肿瘤等级或有丝分裂指标预示在淋巴结阴性乳癌患者中化疗的受益。类似地,已经显示,复发评分算法(Recurrence Score algorithm)中基因的增殖组在ER+淋巴结阴性患者中预示化疗收益。事实上,高MGI预示用术前紫杉醇后续5-氟尿嘧啶、阿霉素和环磷酰胺治疗的ER+乳癌患者中的完全病理反应。H I比率的两个最近的研究显示了其作为除雌激素和孕酮受体之外的新的激素反应性生物标记的潜力。在一复发乳癌的研究中,低H I与对主要的它莫西芬治疗的反应高度相关。类似地,在对来自比较它莫西芬治疗2年和5年的前瞻性随机分组临床试验的肿瘤样本的分析中,低H0XB13或低H I比率有效预测了延长它莫西芬治疗的益处。这些结果与雌激素反向调节H0XB13并正向调节IL17BR表达这一观察结果吻合。因此,在ER+ 肿瘤中,可以将高H0XB13或H I指标视为雌激素信号障碍的标志。MGI和H I比率的双重功能在用于早期阶段乳癌的治疗方法选择的最新O005) Gallen共识指引中尤其相关。St. (fallen指引将ER+淋巴结阴性乳癌患者分为低风险和
中等风险组,其中大部分属于中等风险组。是否对中等风险组中的一些患者不使用化疗是一个重要的治疗决定,这是两个新的前瞻性临床试验所针对的问题。在这里所述的表1的队列中,使用St. (fallen指引导致将86%的患者归入中等风险组,这可以通过MGI和H I 比率再次划分为低(43% )、中等(26% )或高(31% )风险。
低风险患者良好的无疾病生存概率提示,他们可能可以免受有毒性的化疗而不危害其预后,而对高风险组应当加入更高强度的化疗方案或新的治疗剂。因此,可以向已有的指引添加基于MGI和H I比率的风险分类及其各自的预测能力,以更好地平衡现有治疗方式的风险-收益比。因此,本发明包括一种作为ER+乳癌中强有力的预后因素的经证实的MGI0此夕卜, 可以组合MGI和H I比率以提供比任意一种单独所能提供的更精确的预后信息。通过这两种生物标记对具有非常糟糕的结果的患者子集的鉴定有助于针对这些具有高MGI和高 HI比率的癌症的临床试验设计。MGI所公开的其表达与具体肿瘤等级相关的基因提供了将基因表达分析仅集中于那些有助于确定一个对象相对于另一个对象而言很可能具有特定的预后或临床结果的能力的基因的能力。癌症细胞中其他基因的表达可能相对地不能提供与这些识别相关的信息, 并因而不能对此有所帮助。为了在本发明的实践中确定基因的表达水平,可以采用本领域内已知的任何方法。在一些实施方式中,使用了基于检测与这里所鉴定并公开的基因杂交的RNA的表达。这可以通过本领域内已知或认为等价的任何RNA检测或扩增+检测方法方便地实现,这些方法诸如但不限于逆转录PCR、美国专利申请No. 10/062,857(2001年10月25日提交)和美国临时专利申请60/298,847 (2001年6月15日提交)及60/257,801 (2000年12月22日提交)中公开的方法、以及检测RNA稳定化或去稳定化序列的存在或缺失的方法。另外,可以使用基于检测DNA状态的表达。对所鉴定基因的DNA的甲基化或缺失的检测可以用于表达减少的基因。这可以通过基于本领域内已知方法的PCR方便地实现, 这些方法包括但不限于Q-PCR。相反地,对所鉴定基因的扩增的检测可以用于与具体乳癌结果相关的表达提高的基因。这可以通过本领域内已知的基于PCR的方法、荧光原位杂交 (FISH)和染色体原位杂交(CISH)方法方便地实现。也可以使用基于蛋白质水平或活性的存在、提高或减少的检测的表达。可以通过本领域内已知的并认为适于蛋白质检测的任何基于免疫组化(IHC)的、基于血液的(尤其对于分泌蛋白质)、基于抗体的(包括针对该蛋白质的自身抗体)、基于脱落细胞(来自癌) 的、基于质谱的、以及基于成像(包括使用标记的配体)的方法进行检测。基于抗体和成像的方法额外可以用于对通过非入侵性程序(如导管灌洗或细针抽吸)所获得的细胞进行癌症确定后的肿瘤定位,其中癌细胞的来源是未知的。标记的抗体或配体可以用于患者中癌的定位。使用基于核酸的检测法以确定表达的一种实施方式是通过将这里所鉴定的基因的一个或多个序列固定化在固体支撑物上,所述固体支撑物包括但不限于如本领域内已知的阵列、小珠或基于小珠的技术的固体支撑物。另外,也可以使用本领域内已知的基于溶液的表达检测法。固定化的基因可以是具有唯一性或以其它方式对所述基因具有特异性的多核苷酸形式的,从而使得该多核苷酸可能能与所述基因相应的DNA或RNA杂交。这些多核苷酸可以是所述基因的全长或所述基因的短序列(通过本领域内已知的从序列的5’或3’端删除直至比全长序列短一个核苷酸),这样的短序列可选地最低程度产生妨碍(如由于错配或插入的非互补碱基对),从而不影响与所述基因相应的DNA或RNA的杂交。在一些情况下,所使用的多核苷酸来自基因的3’末端,如距离基因或表达序列的聚腺苷化信号或聚腺苷化位点约350、约300、约250、约200、约150、约100或约50个核苷酸范围内。也可以使用含有相对于所公开基因序列的突变的多核苷酸,只要所述突变的存在仍允许杂交以产生可检测信号。固定化的基因可以用于确定由癌症样本或样本对象(例如获得样本的患者)的结果未知的乳房细胞所制备的核酸样本的状态或用于证实已经对样本对象作出判断的结果。 不限于本发明,这样的细胞可以来自具有ER+乳癌的患者。固定化的多核苷酸仅需要足以在适当条件下与源于所述样本的相应核酸分子特异性杂交。本发明部分建立在诸如采用来自FFPE组织、冷冻样本或新鲜样本的癌症样本的基于基因表达的预后因素和临床结果和肿瘤等级预测指标这一发现的基础上。这些基因的表达水平如这里所述的与肿瘤等级和临床结果以及确定对象预后相关。所鉴定的基因具有如下的细胞周期内功能和报道的峰值表达
基因 BUBlB CENPA NEK2
表达峰值 G2/M G2/M G2/M
RACGAP1未确定 RRM2 S
在细胞周期中的功能有丝分裂纺锤体装配检查点着丝粒装配中心体复制启动细胞浆移动 DNA复制这些基因的序列已经在本领域内报道并进行了特征描述。例如,人BUBlB基因被鉴定为Unigene Hs. 631699,其在2007年9月6日通过273个相应序列加以特征描述。也在同一天,人CENPA、NEK2、RACGAP1和RRM2基因被分别鉴定为Hs. 1594 (1 个相应序列)、Hs. 153704 (221个相应序列)、Hs. 696319 (349个相应序列)和Hs. 226390 (1348 个相应序列)。对应于这些Unigene标识符中每一个的序列通过参考完整地整合在本申请中并可由精通本领域的人员以适当方式用于本发明的实践。在序列表中公开了鉴定为Unigene Hs. 631699的12个代表性BUBlB mRNA序列中的2个;在序列表中还公开了鉴定为Unigene Hs. 1594的11个代表性CENPA mRNA序列中的2个;在序列表中公开了鉴定为Unigene Hs. 15704的17个代表性NEK2 mRNA序列中的2 个;在序列表中公开了鉴定为Unigene Hs. 696319的15个代表性RACGAP1 mRNA序列中的 2个;在序列表中公开了鉴定为Unigene Hs. 226390的M个代表性RRM2 mRNA序列中的2 个。在列表中公开的序列对于本发明的实践不是限制性的,而是作为本领域中对于所公开基因序列的实际知识的证据加以提供。此外,精通本领域的人员完全可以对这些基因中的每个基因的任何两个或多个已知序列进行比对,以确定作为鉴定这些基因中每个基因的区域的相同的或保守改变的范围。也对来自于其他动物的相同基因的序列进行了鉴定和特征描述。因此,精通本领域的人员清楚地知道如何相对于其他动物基因鉴定所公开的基因。精通本领域的人员也可以选择性地将所公开基因的已知序列与不同动物来源的进行比较以鉴定这些基因相对于其他基因的保守区域和唯一性序列。类似地,如这里所述的STK15、生存素、细胞周期蛋白Bl和MYBL2的使用得到精通本领域的人员已知的关于这些基因和每个基因代表性序列的先前报道的支持。精通本领域的人员应当认识到,上述的一些相应序列包含与所公开序列的唯一性无关的3’聚腺苷(或互补链上的聚胸腺嘧啶)片段。因此,本发明可以用缺失3’聚腺苷 (或聚胸腺嘧啶)片段的序列实施。所公开序列的唯一性是指仅在所公开基因的核酸中发现的该序列的一部分或全部,这包括在基因的3’非翻译部分发现的唯一序列。实施本发明的优选唯一性序列是构成三个集合中每个集合的共有序列的序列,从而使得所述唯一序列可以用于各个个体中的表达检测,而不是对一些个体中存在的多态性特异的。另外,可以使用对一个个体或分组队列唯一的序列。优选的唯一序列优选具有这里所述的本发明的多核苷酸的长度。在本发明的实施中为了确定上述序列的表达水平(提高或降低),可以使用本领域内任何已知方法。本发明的一种实施方式中,使用了基于检测与含有上述序列的多核苷酸杂交的RNA的表达。这可以通过本领域内已知的或认为等价的任何RNA检测或扩增+检测方法方便地实现,这些方法包括但不限于逆转录PCR(可选实时PCR) ,2001年 10月25日提交的名为“核酸扩增”的美国专利申请No. 10/062,857和美国临时专利申请 60/298,847(2001年6月15日提交)和60/257,801 (2000年12月22日提交)中公开的方法、美国专利No. 6,291, 170中公开的方法、以及定量PCR。也可以使用鉴定提高的RNA稳定性(导致观察到表达提高)或降低的RNA稳定性(导致观察到表达降低)的方法。这些方法包括检测提高或降低含有所述基因序列的mRNA的稳定性的序列。这些方法也包括检测 mRNA降解的增强。在本发明的一些实施方式中,将包含存在于上述序列3’非翻译和/或非编码区中的序列的多核苷酸用于检测癌或乳房细胞中的基因序列表达水平。这样的多核苷酸可以选择性地包含存在于上述序列编码区3’部分的序列。包含编码区和3’非编码区的序列组合的多核苷酸优选地具有连续排列的序列,其中没有插入的异源序列。另外,可以用包含存在于癌或乳房细胞中的所述基因的5’非翻译和/或非编码区中的序列的多核苷酸实施本发明,以检测其表达水平。这样的多核苷酸可以选择性地包含存在于编码区5’部分的序列。含有编码和5’非编码区序列组合的多核苷酸优选地具有连续排列的序列,其中没有插入的异源序列。也可以用存在于所公开基因编码区中的序列实施本发明。非限制性多核苷酸包含来自3’或5’非翻译和/或非编码区至少约20、至少约22、 至少约24、至少约26、至少约28、至少约30、至少约32、至少约34、至少约36、至少约38、 至少约40、至少约42、至少约44、或至少约46个连续核苷酸的序列。上一句中使用的术语 “约”是指对所述数值增加或减少1。更优选的是含有至少或约50、至少或约100、至少或约 150、至少或约200、至少或约250、至少或约300、至少或约350、至少或约400个连续核苷酸的序列的多核苷酸。上一句中使用的术语“约”是指比所述数值增加或减少10%。存在于本发明的多核苷酸中来自上述编码区的3’或5’末端的序列与上述序列长度相同,除了它们可能受到编码区长度的天然限制。编码区的3’末端可以包括直至该编码区3’ 一半的序列。相反,编码区的5’末端可以包括直至该编码区5’ 一半的序列。当然, 上述序列或包含其部分的编码区和多核苷酸可以整体使用。由3’非翻译和/或非编码区及编码区的相关3’末端组合成的多核苷酸可以是至少或约100、至少或约150、至少或约200、至少或约250、至少或约300、至少或约350、或至少或约400个连续的核苷酸。优选地,所使用的多核苷酸来自基因的3’末端,如距离基因或表达序列的聚腺苷化信号或聚腺苷化位点约350、约300、约250、约200、约150、约100、 或约50个核苷酸范围内。可以使用含有相对于所公开基因序列的突变的多核苷酸,只要所述突变的存在仍然允许杂交以产生可检测信号。在本发明的另一实施方式中,可以使用含有从上述序列5’和/或3’端删除核苷酸的多核苷酸。所述删除优选从5’和/或3’端去除1-5、5-10、10-15、15-20、20-25、 25-30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-125、125-150、 150-175、或175-200个核苷酸,虽然删除的程度可能受到所公开序列长度和能够将所述多核苷酸用于检测表达水平的需要的天然限制。来自以上公开序列3’端的本发明的其他多核苷酸包括用于定量PCR的引物和可选择探针。在一些实施方式中,引物和探针是扩增距离基因或表达序列的聚腺苷化信号或聚腺苷化位点少于约350、少于约300、少于约250、少于约200、少于约150、少于约100、少于约50个核苷酸的区域的序列。在本发明的其他实施方式中,可以使用包含以上公开的含3’端的序列的部分的多核苷酸。这样的多核苷酸可以包含来自所公开序列3’端的至少或约50、至少或约100、至少或约150、至少或约200、至少或约250、至少或约300、至少或约350、至少或约400个连续的核苷酸。本发明也包括用于检测乳房细胞中基因表达的多核苷酸。所述多核苷酸可以包括由存在于以上基因中的序列和与所述序列非天然组合存在的异源序列组合构成的较短的多核苷酸。非限制性实例包括来自克隆载体或存在于用于制备如这里所述的探针或引物的限制性片段中的短序列。如这里所述,本发明包括其表达可以用于提供与癌症相关的预后信息的基因的特征鉴定。具体地说,这些基因的表达水平可以用于与乳癌关联。在一些方法中,所述基因的表达谱与具有良性或恶性癌症复发和/或生存结果相关(并因此可以加以区分)。在其他实施方式中,本发明包括将来自患者的癌细胞样本中的基因表达水平与所述基因表达图谱比较,以确定该患者可能的临床或治疗结果或无干预情况下的自然生物学结果。由于能预测患者是否很可能会从特定的治疗方式中受益或患者是否更适于另一种治疗方式的能力, 本发明的这些实施方式可以优选地用于满足重要的未满足的诊断需求。例如,低H I比率值与一线的它莫西芬治疗反应高度相关。并且对来自比较2年和5年它莫西芬治疗的前瞻性随机分组临床试验的肿瘤样本的分析显示,低H0XB13或低H0XB13 JL17BR明显预测了延长它莫西芬治疗的受益。类似地,MGI预测等级I相对于等级III肿瘤存在的能力能使相关领域内的临床医生选择适合于这两个等级的癌症的治疗方法。MGI不仅证实通过其他方法区分的等级I 和等级III,而且可以与H I比率组合,更精确地将已经通过其他方法错误分类的肿瘤划分为低、中等或高风险。这在图8中加以说明,其中通过使用公开的MGI和H I比率,充分修正了基于2005 . Gallen方案的分类。因此,本发明包括将一名患者从具有癌细胞的患者群中鉴定为属于具有较好预后或较差预后的分组患者群的方法。与具有较差预后的分组患者群(类似于鉴定为具有等级 III肿瘤的对象)相比,具有较好预后的分组队列类似于鉴定为具有等级I肿瘤的对象。当然,所公开的方法在应用中不需要表现完美,并且可能一个特定患者会被鉴定为具有介于等级I和III之间的“中间”肿瘤等级。在此情况下,精通本领域的实施人会对其进行相应治疗。但本发明仍然提供了用于具有等级I、中间等级、或等级III肿瘤的患者的鉴定的非主观方法,所述鉴定可以由精通本领域的实施者用于患者的治疗受益。重要的是,所公开的方法可以将其他方法所识别的“中间”等级肿瘤区分为等级I或等级III状态。这为相应的患者分组群提供了巨大的受益,否则会按照具有“中间”等级肿瘤加以治疗。因此,在一些实施方式中,通过使用公开的5基因MGI,提供了一种减少“中间”等级分类数量的方法。因此,本发明包括了通过检测这里所公开的表达谱确定预后和/或生存结果的方法。因此,在先前可能已经使用主观解释来确定癌症患者预后和/或治疗的情况下,本发明提供了客观的基因表达图谱,它可以单独或与主观标准组合使用,提供对患者结果(包括生存和癌症复发)更精确的评估。在一些情况下,所述检测包括检测BublB的表达水平,其中所述表达水平与等级I或等级III的肿瘤相关。所公开的基因被鉴定为与肿瘤等级和临床结果相关,从而使得其表达水平与确定患者的治疗方案相关。因此,在一些实施方式中,本发明提供了一种通过确定所述患者预后来确定癌症患者治疗方式的方法,该方法包括通过检测来自所述患者癌细胞样本的这里所述的表达水平以确定肿瘤等级,以及对具有这样等级的肿瘤患者选择治疗方法。在一些情况下,所述检测包括检测BublB的表达水平,其中所述表达水平与等级I或等级III的肿瘤相关。在一组实施方式中,本发明的方法可以包括检测来自癌症对象的癌细胞样本的 BublB表达水平,其中该表达水平将癌症相应地分为等级I或等级III肿瘤,或将该对象鉴定为具有很可能癌症复发的预后,或预测该对象对内分泌疗法、化疗或放疗的反应性。所述检测可以包括用这里所述的或精通本领域的人员已知的任何适当方式测量或检测或确定所述基因的表达水平。在许多情况下,所述癌症是乳癌,且所述对象是病人。此外,所述癌细胞可以是肿瘤细胞和/或来自淋巴结阴性(癌的淋巴结阴性)或淋巴结阳性(癌的淋巴结阳性)对象的细胞。当然,所述方法可以与检测MGI其他基因中的一个或多个基因共同实施,其中组合使用的基因的表达水平如本方法所提供的用于分类、鉴定或预测。表达水平的必需水平可以是针对所使用的基因通过这里所述的方法可以鉴定的水平。此外,所述检测可以包括从样本制备RNA,可选地用于PCR(聚合酶链式反应)或这里所述的其他分析方法。PCR方法可选地是RT-PCR(逆转录PCR)或定量PCR,如实时RT-PCR。另外,所述检测可以通过使用阵列进行,如相关领域内已知的微阵列。可选地,所述癌细胞样本从由所述对象中取出或获得的组织上剖开。如这里所述的,可以使用各种样本类型,包括作为非限制性实例的福尔马林固定的石蜡包埋(FFPE)样本。并且如这里所述的,所述方法可以包括如这里所公开的检测或确定样本中的H I比率(HoxB 13和ILl7BR表达水平之比)。作为非限制性实例,如这里所公开的,可以检测MGI的所有5个基因并用于检测对应于“高风险”值(大于分界值)MGI的表达水平,或用于检测对应于“低风险”值(等于或低于分界值)MGI的表达水平。在一些情况下,MGI分界阀值可以是0,这样其中表达水平的测量值用标准偏差1对0进行标准化。在其他实施方式中,所述分界值可以等于或约0. 05,等于或约0. 10、等于或约0. 15、等于或约0. 20、等于或约0. 25、等于或约-0. 05、 等于或约-0. 10、等于或约-0. 15、等于或约-0. 20、等于或约-0. 25、等于或约-0. 30、等于或约-0. 35、等于或约-0. 40、等于或约-0. 45、等于或约-0. 50、等于或约-0. 55、等于或约-0. 60、等于或约-0. 65、等于或约-0. 70、等于或约-0. 75、等于或约-0. 80、等于或约-0. 85、等于或约-0. 90、等于或约-0. 95、等于或约-1. 0、等于或约-1. 1、等于或约-1. 2、 等于或约-1. 3、等于或约-1. 4、等于或约-1. 5、等于或约-1. 6、等于或约-1. 7、等于或约-1.8、等于或约-1.9、等于或约-2.0或更低。对于H I比率,其确定可以如这里所参考的Ma等Q004)和Ma等Q006)中所述的进行。例如,0. 06的值可以用于确定样本是否具有“高风险”(> 0. 06)或“低风险”(< 0. 06)H I比率。这样,通过使用作为包含所有5个基因的MGI的非限制性实例的阀值或分界值0, 所公开的方法为一个特定样本提供了两种可能的检测结果“高风险MGI”对应于高于0的值,“低风险MGI”对应于小于等于0的值。“高风险MGI”是包括乳癌在内的“高风险”癌的指标,这与通过本领域内已知的方法和标准定义的等级III肿瘤类似。“低风险MGI”是包括乳癌在内的“低风险”癌的指标,这与通过本领域内已知的方法和标准定义的等级I肿瘤类似。将癌分类为两个组显示在图1的C栏和图4的B栏中,其中由“高风险MGI”确定的风险水平是癌症复发可能性提高的指标,如癌转移或癌的远侧复发,包括乳癌的复发。在许多实施方式中,这一复发风险的存在与采取或不采取它莫西芬或其他内分泌疗法无关。 在这里所公开的实施方式中,所述复发可以是局部的DCIS复发。由“低风险MGI”确定的风险水平是癌症复发可能性降低的指标,包括乳癌复发可能性的降低。在许多实施方式中,这一降低的复发风险与是否采用它莫西芬治疗无关。复发风险、或不复发的可能性可以看作随时间发展的风险,如在约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12 或更多年的时期内。因此,通过MGI提供的风险评估可以用作对象癌症复发和/或生存结果的预后指标。本发明还包括在通过这里所述的方法确定与复发风险相关的MGI值的基础上确定随时间的复发风险。图9显示了作为非限制性实例的MGI值为2. 1及其指示的5年内 19%的癌症复发风险。该图进一步说明了复发风险与MGI值相关,并且选择0作为阀值或分界值是非限制性的,因为也可以是使用其他值。当与H I比率组合时,4种可能的检测结果如下1) “高风险MGI”和“高风险H I ”可以认为与单独的“高风险MGI ”相似的“高风险”;2) “高风险MGI ”和“低风险H3) “低风险MGI ”和“高风险H 风险”;以及4) “低风险MGI”和“低风险H I ”可以认为与单独的“低风险MGI ”类似的“低风险”。MGI和H: I的组合由此确定了 3种不同的亚型,对其观察到不同的肿瘤生物学并
I”可以认为与癌症复发的“中间风险”类似; I ”可以认为与单独的“低风险MGI ”类似的“低且与不同的患者结果相关。例如,中间风险可以用于在预测患者会从中受益的基础上对具有此类肿瘤的患者采取内分泌疗法(如作为非限制性实例的它莫西芬)。相反的,具有“高风险MGI”和“高风险H I”的患者不大可能从激素单一治疗中受益。因此,该评估不代表简单的风险连续体。由于该评估确定了对治疗选择有帮助的潜在的生物学特征,能够对熟练的临床医生产生帮助。为了作出治疗选择,临床医生可以确定,在患者是高风险的情况下 (即高/高)于是认识到该患者不大可能从激素单一治疗中获益一条至关重要的信息。这使得临床医生考虑并/或选择或采用更具侵略性的化疗或建议该患者参加靶向于对激素单一治疗有抗性的肿瘤的试验。图5的C和D栏显示了这3个风险组在不同患者队列中的应用。另外,这些MGI和H I结果的可能组合以与上述单独使用MGI相同的方式用作指标。图10中A和B栏也显示了尽管使用了它莫西芬治疗,MGI指示复发风险的能力, 其中“高风险”MGI用作复发的指标,尽管采用它莫西芬作为单一治疗剂治疗。当然,MGI和 H I结果的组合也可以用于相同目的。本发明进一步包括了使用单独MGI、单独H I、 或MGI和H I的组合以预测对靶向于这里所述的内分泌抗性(endocrine resistant)癌的抑制剂的反应性。对内分泌疗法的无反应性和对所公开的抑制剂的反应性的可能指示可以与本发明的另一个方面组合,其中所述的另一个方面是一种在由所公开的方法确定的预测性和预后性指示的基础上选择疗法的方法。因此对于以上所述的“高风险”MGI、“高风险”H I、或MGI和H I结果的组合,本发明的实施方式还包括进一步包含选择、并选择性地用抑制剂治疗对象以提高对它莫西芬或其他形式内分泌疗法的反应性的方法。在一些情况下,所述方法还包括用它莫西芬或其他形式内分泌疗法的治疗。以上关于对靶向于内分泌抗性癌症的抑制剂的反应性的描述也可以用于如这里所述的单独检测H I比率的情况。本发明进一步包括检测“高风险”MGI、可选地与H I结果组合,作为对其他形式内分泌疗法(如用SERM、SERD或AI治疗)无反应性的指标。当然,本发明也可以包括测定 “低风险,^GI、可选地与H I结果组合,作为对它莫西芬和及其他SERM及SERD或AI反应性的指标。这些对于内分泌疗法可能的预测也可以在这里所公开的选择疗法的方法中使用。 例如,一种方法可以包括在预测缺乏反应的情况下不选择内分泌疗法,选用诸如化疗和/ 或放疗的其他疗法。相反地,在预测反应性的情况下,该方法可以包括选择内分泌疗法。在其他实施方式中,对“高风险”MGI、“高风险”H I、或MGI和H I值组合的检测可以用作内分泌疗法中相对反应性的指标,如用AI治疗反应性优于SERM。作为一种非限制性实例,“高风险”MGI值可以用作AI (如来曲唑)相对于它莫西芬的反应性的指标。当然,本发明还包括在这样的预测基础上选择用AI治疗的方法。除了内分泌疗法,单独的MGI、单独的H I、或MGI和H I结果的组合也可以用于指示对化疗的无反应性。作为一个非限制性实例,如图11中所示,“高风险”MGI是对用紫杉醇、5氟尿嘧啶、阿霉素和环磷酰胺的化疗抗性的预测指标。当然,本发明还包括不选择化疗作为单一疗法而采用其它治疗方式(如作为非限制性实例的放疗)的方法。除了内分泌疗法和化疗之外,本发明包括测定单独MGI、单独H I、或MGI和H I 结果的组合,作为癌症对放疗反应性(敏感性)的预测指标。“高风险”MGI可以用于预测例如手术介入后癌症患者对放疗的反应性。所述方法可以进一步包括在手术介入后将对象鉴定为很可能或不大可能对放疗产生反应。当然,本发明还包括在预测其反应性的去基础上选择放疗的方法。本发明进一步包括测定单独MGI、单独H I、或MGI和H I结果的组合,作为更年期前妇女和更年期后妇女中预后因素或临床反应性预测指标的方法。图12显示了“高风险”MGI在生存结果基础上对这两组妇女分类的能力。更年期后妇女可以定义为年龄大于等于50岁的,而更年期前妇女可以定义为年龄小于50岁的。在这两组中,“高风险”MGI相对于“低风险”MGI是随时间癌症复发可能性提高的指标。当然,本发明还包括在测定来自所述妇女样本的MGI值、H I值或这两个值的组合的基础上,为更年期前和更年期后妇女选择适当疗法的方法。更常见的,为癌症患者确定疗法的方法可以开始于如这里所述的MGI检测。测定的值可以用于将癌分类为相应的等级I或等级III肿瘤,或将对象鉴定为具有可能癌症复发的预后,或如这里所述的对治疗具有反应性或无反应性。所述方法随后可以包括对具有这样的肿瘤或这样的预后或这样的反应性或无反应性的患者选择疗法。在一些情况下,因为指示的预后较差且/或对其他疗法无反应性,所选的疗法可以包括手术和化疗和/或放疗。本发明的其他实施方式包括在诊断为良性癌症的对象中确定肿瘤等级或癌症风险的方法。所述方法可以包括检测所述对象乳房细胞样本的BublB、CENPA、NEK2、RACGAP1 和RRM2的表达水平,其中所述表达水平与等级I或等级III肿瘤或癌症的“高风险”或“低风险”相关。这一方法的实施方式包括在所述表达水平基础上确定MGI值,并可选地将其用于选择所述对象的治疗方式。在其他实施方式中,本发明包括在诊断为DCIS的对象中确定肿瘤等级或局部癌症复发风险的方法。所述方法可以包括检测所述对象乳房细胞样本的BublB、CENPA、NEK2、 RACGAP1和RRM2的表达水平,其中所述表达水平与等级I或等级III肿瘤或局部癌症复发的“高风险”或“低风险”相关。虽然以上一些实施方式描述了组合使用MGI的所有5个基因,本发明尤其包括在实施所公开方法过程中使用少于5个(包括这5个基因中的单独基因)基因。此外,前文中也明确公开了其他基因与MGI的一个或多个基因或H I比率组合的情况。类似地,也明确公开了对于MGI基因使用H I作为其他指标的部分或全部替代。因此,MGI的5个基因可以以显著精确度单独使用或组合使用以提高与肿瘤等级和/或癌症结果的分子表达表型精确相关的能力。如这里所公开的,这一相关性是在分子水平上为确定癌症复发和/或生存结果提供信息的方法。所述相关性基因也可以用于细胞和组织分类;确定诊断和/或预后;以及确定和/或改变治疗方式。区分能力来自于对各个相关基因表达的鉴定,而不是来自于用于确定实际表达水平的检测法。一种检测法可以使用这里所公开的各个已经鉴定的基因的任何识别特征,只要该检测法定性或定量地反映该基因在“转录组”(基因组中基因的转录部分)或“蛋白质组”(基因组中所表达基因的翻译部分)中表达。识别特征包括但不限于用于编码(DNA)或表达(RNA)所述基因的唯一核酸序列,或所述基因编码的蛋白质的特异性表位或活性。全部所需的是区分癌症结果和在表达检测法中使用的含有样本的适当细胞所必要的所述基因的特征。类似地,所述含样本的细胞的性质是无限制的,在公开的方法中可以使用如新鲜组织、新鲜冷冻组织以及诸如福尔马林固定的石蜡包埋(FFPE)组织的固定组织。在一种实施方式中,本发明通过对单个细胞或同质细胞群进行全面或接近全面的基因表达分析提供了对基因表达谱的鉴定,其中所述同质细胞群是已经与通过简单的生物活检可能混杂的污染细胞剖离开或以其它方式从中分离或纯化的。由于不同患者的细胞间以及相同患者样本的细胞间大量基因表达的波动,可以根据一个或多个“对照”或“标准化” 基因(其表达在一名患者的细胞中或患者之间相对恒定)确定基因表达水平。另一方面,本发明包括用于对通过个体表达图谱产生的模型鉴定的基因的表达进行检测的物理学和方法学方法。这些方法可以针对基因表达的潜在DNA模板、作为中间体以表达基因的RNA、或基因所表达的蛋白质产物的一个或多个方面的检测。本发明所提供的一个优点是不存在可能影响所鉴定基因或随后的基因表达分析以确定患者的癌症复发和/或生存结果的污染、非癌细胞(如浸润性淋巴细胞或其他免疫系统细胞)。这样的污染存在于含有许多细胞类型的活组织切片用于检测基因表达谱的情况。虽然本发明主要针对人的癌症(如乳癌)进行描述,它可以在任何动物的癌症中进行实施。应用本发明的优选动物是哺乳动物,尤其是对农业应用重要的哺乳动物(诸如但不限于牛、羊、马及其他“农场动物”)、癌症动物模型、以及宠物(诸如但不限于狗和猫)。本发明提供的方法也可以完全或部分自动化。试剂盒本发明的方法中使用的材料理想地适合于按照熟知的程序所生产的试剂盒的制备。因此,本发明提供了包含用于肿瘤评级或确定癌症结果的所公开基因表达检测试剂的试剂盒。这样的试剂盒可选地包含具有与其在本发明所述方法中使用相关的特征描述或标签或说明书的试剂。这样的试剂盒可以包括容器,其中每个容器含有在所述发明中使用的各种试剂(通常为浓缩形式)中的一种或多种,所述试剂包括例如预制的微阵列、缓冲液、 适当的核苷三磷酸(例如dATP、dCTP、dGTP和dTTP ;或rATP、rCTP、rGTP和UTP)、逆转录酶、 DNA聚合酶、RNA聚合酶、以及本发明的一种或多种引物合成物(例如与RNA聚合酶具有反应性的适当长度的聚胸腺嘧啶或与启动子相连的随机引物)。通常也会包含一组说明书。已经概述性地提供了本发明,通过以下实施例会更易于理解本发明,除非另有说明,提供所述实施例是出于举例说明的目的,而不是对本发明的限制。
实施例实施例I:概述患者和肿瘤样本从 Gene Expression Omnibus (GEO, http://ncbi.nih.gov/geo)下载了两个公共并先前公开的微阵列数据组(登录号GSE3494、GSE1456)。GSE3494(Uppsala队列)由来自1987至1989年间在瑞典Uppsala县治疗的以人群为基础的队列的251名患者组成,并且他们在所接受的辅助全身性治疗方面(未治疗或激素和/或化疗治疗)是不同的。参见 Miller LD,Smeds J, George J 等,Proc Natl Acad Sci USA 102 13550-5,2005。可以获得236名具有10年中值回访期的患者的临床结果数据(乳癌特异性死亡)。GSE1456(斯德哥尔摩队列)由类似的一系列在1994至1996年间在瑞典斯德哥尔摩Karolinska医院治疗的159名乳癌患者组成。GSEIM94和GSE1456都包含在Affymetrix U133A和U13!3B阵列(Affymetrix,Santa Clara, CA)上分析的冷冻肿瘤样品的基因表达数据。由239名患者组成的第二个队列使用了回顾性病例-队列设计(Pawitan Y, Bjohle J,Amler L 等,Breast Cancer Res 7 :R953_64,2005)并来自于 1991 至 1999 年间在麻省总院治疗的683位具有雌激素受体阳性乳癌的I阶段至III阶段患者。从肿瘤记录和医院记录获得临床回访数据。病例是回访期内发展出远端转移的所有患者;对照是从最后一次回访保持无疾病的患者中随机选择的,对照与病例的比率达到2 1。此外,根据辅助治疗和诊断时间将对照与病例进行频率匹配。对于约80%的病例和对照,成功找回了临床结果数据和福尔马林固定的石蜡包埋(FFPE)肿瘤块。最后的队列包含79个病例和160个对照,并将其患者和肿瘤特征在表1中加以总结。这一研究得到了地方伦理审查委员会的许可。这一最后队列包括先前所述Oxford序列中的 84例(Loi S,Haibe-Kains B,Desmedt C等Definition of clinically distinct molecular subtypes in estrogen receptor-positive breast carcinomas through genomic grade (通过基因组等级定义雌激素受体阳性乳癌中临床上可区分的分子亚型).J Clin Oncol 25 1239-46,2007)。所有患者具有雌激素受体阳性乳癌并且是淋巴结阴性的并用它莫西芬辅助单一治疗的。这一研究使用了来自先前分离的冷冻肿瘤样本的总RNA的一部分。表1.患者与肿瘤特征特征病例(n=79)对照(n=160) 复发时间(年)
中值4.69.1
范围0.6-12.9 0.1-14.8
匹配的变量 治疗
化疗11(14%)9(6%)
化疗+激素32 (41%)58 (36%)
激素28 (35%)67 (42%)
无8 (10%)26 (16%)
诊断年份
1991-199540 (51%)74 (46%)
1996-200039 (49%)86 (54%)
不匹配变量
诊断时年齢(岁)
<3511 (14%)5(3%)
35-4414(18%)22 (14%)
45-4911 (14%)18(11%)
50-5912 (15%)55 (34%)
>=6031 (39%)60 (38%)
肿瘤大小(厘米)
<=17 (9%)34 (21%)
1.1-232 (41%)65 (41%)
2.1-433 (42%)46 (29%)
>47(9%)15(9%) 肿瘤等级
14(5%)32 (20%)
241 (52%)109 (68%)
334 (43%)19(12%) 淋巴结状态
阴性37 (47%)97 (61%)
阳性39 (49%)52 (32%)
未知3(4%)11(7%) 孕酮受体
阴性19(24%)20 (12%)
阳性60 (76%)140 (88%)用于H/I和MGI的实时RT-PCR如之前的描述使用用于H0XB13和IL17BR以及对照基因ESRl、PGR、CHDH、ACTB, HMBS、SDHA 和 UBC 的引物和探针序列(MaXJ,Hilsenbeck SG, Wang W 等 J Clin Oncol 24 4611-9,2006)。使用 Primer Express(ABI)制备针对 5 个分子等级基因(BUBIB、CENPA、 NEK2, RACGAP1和RRM2)和ERBB2 (HER2)的引物和探针序列。对于每个FFPE样本,将两个7-iim组织切片用于RNA抽提。使用总宏观 解剖(Gross macro-dissection)以富集肿瘤含量。RNA抽提、逆转录以及使用ABI7900HT (Applied Biosystem, Inc)的 TaqMan RT-PCR 如先前所述(Ma 等,见前文)进行。根据4个对照基因(ACTB、HMBS、SDHA和UBC)的平均CT对循环阀值数(CT)进行标准化。这些基因的使用得到先前关于这些基因的报道的支持,并且这些基因中每个基因的代表性序列对于精通本领域的人员来说是已知的。标准化的CT用来表示相对基因表达水平。
H/1、MGI 和 GGI 的计算通常对于MGI,优选地将所公开的基因的表达水平组合形成单一指标,作为临床结果的预后因素和预测指标。该指标是所使用的基因的表达水平的总和,并且使用通过主成分分析确定的系数将一个以上所公开基因的病例组合成单一指标。所述系数通过诸如贯穿代表性数据组的每个基因表达水平的标准偏差的因子和每个样本中每个基因的表达值加以确定。代表性数据组是在这里所公开的对照基因平均表达值的基础上进行质量控制的。 例如,1。另外对于MGI,来自微阵列或RT-PCR的5个基因标准化的表达水平在每个数据组中所有样本上对平均值0和标准偏差1进行标准化,并随后通过使用第一个主成分的主成分分析(PCA)将其组合为每个样本的单一指标。每个数据组内的初级表达数据的标准化对于说明不同的平台(微阵列和RT-PCR)和样本类型(冷冻的和FFPE)是必需的。作为结果, 并遵循比例参数,产生了用于定义所述指标的表达值总和的公式。随后可以在整个数据表中基因表达水平的平均值、标准误差和标准偏差(含可靠区间)的基础上测试比例参数的精确性。因此,用于所述指标的公式的产生依赖于数据组、参照基因和MGI基因。HOXB13 JL17BR比率如先前所述(Ma等,见前文)按照H0XB13和IL17BR之间标准化的表达水平差异进行计算。用于表1队列标准化的H0XB13和IL17BR的平均值和标准偏差源自雌激素受体阳性淋巴结阴性乳癌患者的独立以人群为基础的队列的190个FFPE组织切片。对于MGI,在对一式两份的每个基因和每个样本计算平均值之前,去除明显反常的原始Ct值。随后将每个基因的平均原始Ct值通过4个参照基因(ACTB、HMBS、SDHA和UBC) 的平均Ct值进行标准化。5个基因标准化的表达水平(ACt)组合为每个样本的单一指标, 它可以与预先确定的分界值(如0)比较,其中高MGI大于分界值,低MGI小于分界值。使用代表97个基因的128AffymetriX探针组通过微阵列计算基因组等级指标 (GGI),并如先前所述(Sotiriou等,见前文)在每个数据组中按比例缩放为对于等级1肿瘤具有平均值-1,对于等级3肿瘤具有平均值+1。分界点和统计学分析H/I分界点在本发明中直接使用先前为将它莫西芬治疗的患者分为复发低风险和高风险而定义的H0XB13 JL17BR比率的分界点0. 06。MGI分界点对MGI的计算和分界点没有使用任何临床结果数据进行定义,而是自然的分界点。Uppsala队列中MGI的最初分析显示,使用平均值(0)作为分界点良好地区分了等级1和等级3肿瘤,并且基于模型的MGI聚类也显示了具有约为0的自然分界点的双峰分布。这一分界点进一步得到了接受者操作特性(ROC)分析的支持。基因组等级指标(GGI)如先前所述(Sotiriou等,前文),GGI在分界点0处对分。统计学分析执行含对数秩检验的Kaplan-Meier分析和Cox成比例风险回归(Cox proportional hazards regression)以评价基因表达指标与临床结果的关联性。执行多变量Cox回归模型以评价针对已知预后因素调节后基因表达指标的预后能力。通过按比例的khoenfeld残差校验成比例风险(PH)假设;在通过分层的模型中对违反PH假设的变量进行调节。为了说明表1队列的病例-队列设计,使用了权重 Kaplan-Meier分析和包含修正的Cox回归模型以操作病例-队列设计(参见19,20,如在 R(www. r-project. org)中的调查包中所实行的)。为了检验Cox回归模型中对分的MGI和 H I比率之间的相互作用,在表1队列中使用了 Wald统计并在最后的队列中使用了可能性比率检验。使用非参数双样本Wilc0x0n校验或针对具有两个以上水平的因素的 Kruskal-Wallis校验,检查具有类别因素的连续变量的相关性。所有统计学分析在R统计学环境中执行。所有显著性校验是两方面的,并且ρ <0. 05被认为具有显著性。实施例II 乳癌患者中MGI的预后表现使用公众可以得到的微阵列数据组检查乳癌患者中MGI预测临床结果的能力。 MGI首先在两个独立数据组中与先前所述的97基因基因组等级指标(GGI)比较。ROC分析显示,MGI和GGI在区分等级1和等级3肿瘤方面相当(图2)。在Kaplan-Meier分析中, 在所有两个数据组中MGI在分界点O处对分,将患者分成两个具有显著不同的乳癌死亡风险的亚组,并且其生存曲线和风险率(HR)与由GGI产生的相当(图2)。因此,这些结果表明,5基因指标可以复制复杂得多的97基因标签的预后表现。需要指出的是,虽然MGI是完全不依赖于GGI开发的,5个基因中的4个基因(BUB1B、CENPA, RACGAP1和RRM2)属于97 基因标签,并且第5个基因NEK2就比包含在GGI中的112等级3相关探针组低2个位置。随后,在为验证Rotterdam 76 基因预后标签(Desmedt C, Piette F, Loi S 等 Strong time dependence of the 76-gene prognostic signature for node-negative breast cancer patients in the TRANSBIG multicenter independent validation series. (TRANSBIG多中心独立验证系列中结节阴性乳癌患者76-基因预后特征的强时间依赖性)Clin Cancer Res 13 :3207-14,2007)而进行的 TRANSBIG研究中检查了 MGI。这允许以没有偏见的方式将MGI与另一种待验证预后标签比较。对于整个队列,使用分界点O的 MGI将患者分成具有不同远端转移风险的两组(HR = 2. 3,95% CI 1. 2-4. 2,ρ = 0. 0064), 而76基因标签的风险分类仅具有边缘显著性(ρ = 0. 046)。见图3。此外,在ER+等级1或2子集中(n = 97),对其风险分级是更具挑战性的,MGI鉴定了具有显著更高复发风险的患者亚组(HR= 3. 3,95% CI 1.3-8.4,ρ = 0. 0085),而76 基因标签没有实现(HR = 1. 4,ρ = 0. 57)。综上所述,在总计608名患者的三个大的微阵列数据组中,MGI始终表现为与复杂得多的标签相当或更优的强有力的预后因素。实施例III 针对MGI的RT-PCR检测法的开发和验证用于5个MGI基因的引物和探针针对TaqMan实时PCR(RT-PCR)检测形式设计(表 2)。表2.用于分子等级指标基因的引物和探针序列
权利要求
1.一种包含以下步骤的方法检测患有癌症对象的癌细胞样本的BublB表达水平其中所述表达水平将癌症分为相应的等级I或等级III肿瘤,或将所述对象鉴定为具有很可能癌症复发的预后,或预测所述对象对内分泌疗法、化疗或放疗的反应性。
2.如权利要求1所述的方法,其特征在于,所述检测进一步包括确定CENPA、NEK2、 RACGAP1和RRM2的表达水平,其中所述所有5个基因的表达水平将癌症分为相应的等级I或等级III肿瘤,或将所述对象鉴定为具有很可能癌症复发的预后,或预测所述对象对内分泌疗法、化疗或放疗的反应性。
3.如权利要求1或2所述的方法,其特征在于,所述检测包括从所述样本制备RNA。
4.如权利要求3所述的方法,其特征在于,所述RNA用于PCR(聚合酶链式反应)。
5.如权利要求1或2所述的方法,其特征在于,所述检测包括使用一种阵列。
6.如权利要求1-5中任一所述的方法,其特征在于,所述样本是从取自所述对象的组织上剖离的。
7.如权利要求4所述的方法,其特征在于,所述PCR是RT-PCR(逆转录PCR),可选实时 RT-PCR。
8.如权利要求1-7中任一所述的方法,其特征在于,所述癌症是乳癌并且所述样本是一种福尔马林固定的石蜡包埋(FFPE)样本。
9.如权利要求1-8中任一所述的方法,其特征在于,所述对象的反应性包括该对象对以下药物治疗的反应性它莫西芬,一种选择性雌激素受体调节剂(SERM),一种选择性雌激素受体下调剂 (SERD),或一种芳香酶抑制剂(Al);或一种芳香酶抑制剂,相对于它莫西芬;或一种针对内分泌抗性乳癌的抑制剂;或紫杉醇及5氟尿嘧啶、阿霉素和环磷酰胺。
10.如权利要求2-9中任一所述的方法,其特征在于,所述方法进一步包括检测所述样本中的H I比率。
11.如权利要求2-9中任一所述的方法,其特征在于,所述癌症是导管原位癌(DCIS)并且所述癌症复发包括局部复发。
12.一种确定癌症患者治疗方式的方法,所述方法包括检测所述患者癌细胞样本的BublB表达水平,其中所述表达水平将癌症分为相应的等级I或等级III肿瘤,或将所述对象鉴定为具有很可能癌症复发的预后;以及为具有这样的肿瘤或这样的预后的患者选择治疗方式。
13.如权利要求12所述的方法,其特征在于,所述检测进一步包括确定CENPA、NEK2、 RACGAP1和RRM2的表达水平,其中所述所有5个基因的表达水平将癌症分为相应的等级I或等级III肿瘤,或将所述对象鉴定为具有很可能癌症复发的预后。
14.如权利要求12或13所述的方法,其特征在于,所述癌症对应于等级III肿瘤并且所述治疗方式包括外科手术和化疗和/或放疗。
15.如权利要求12或13所述的方法,其特征在于,所述治疗方式包括放疗。
16.如权利要求12、13、14或15所述的方法,其特征在于,所述方法进一步包括检测所述样本中的H I比率,其中所述检测的结果将所述对象划分为癌症复发低风险、中等风险或高风险。
17.一种在诊断为良性癌症的对象中确定肿瘤等级的方法,所述方法包括检测所述对象乳房细胞样品中BublB、CENPA、NEK2、RACGAPl和RRM2的表达水平,其中所述表达水平与等级I或等级III肿瘤相关。
18.—种在诊断为DCIS的对象中确定肿瘤等级的方法,所述方法包括检测所述对象乳癌细胞样品中BublB、CENPA、NEK2、RACGAPl和RRM2的表达水平,其中所述表达水平与等级 I或等级III肿瘤相关。
19.一种包括检测患有癌症对象的癌细胞样本中BublB、CENPA、NEK2、RACGAPl和RRM2 的表达水平的方法,其中所述所有5个基因的表达水平预测所述对象对芳香酶抑制剂治疗相对于它莫西芬或另一种SERM治疗的反应性。
全文摘要
本发明涉及名为基因BubB1、CENPA、NEK2、RAC-GAP1和RRM2的基因表达图谱的鉴定和应用,用于分级,癌症复发预后,用内分泌疗法、化学疗法或放射疗法治疗对象的反应性预测。本发明还包括确定雌激素受体阴性乳腺癌患者的治疗手段的方法、确定所述癌症患者肿瘤等级的方法,所述方法采用上述基因的表达图谱。
文档编号C12Q1/68GK102395682SQ200880114588
公开日2012年3月28日 申请日期2008年9月6日 优先权日2007年9月6日
发明者D·斯格罗, M·G·厄兰德, 马小骏 申请人:生物治疗诊断股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1