用于内分泌治疗下的乳腺癌复发预测的方法

文档序号:406801阅读:663来源:国知局
专利名称:用于内分泌治疗下的乳腺癌复发预测的方法
技术领域
本发明涉及用于乳腺癌疾病结果的预后的方法、试剂盒和系统。更具体而言,本发明涉及基于乳腺癌患者的肿瘤样品中标记基因表达水平的测定对乳腺癌的预后。
背景技术
在西方国家,乳腺癌是妇女癌症死亡的主要原因之一。更具体来说,仅在美国,乳腺癌每年夺走约40000名妇女的生命,并且每年约有200,000名妇女被诊断出患有乳腺癌。在过去几十年中,辅助性全身疗法已经大幅提升了早期乳腺癌的存活率。这种临床经验使得大家一致推荐给绝大多数的乳腺癌患者(EBCAG)提供辅助性全身治疗。在乳腺癌的治疗中,除了常规进行肿瘤的手术切除和随后的肿瘤床放疗外,还有多种治疗选择可以应用。三种主要的、概念上不同的策略是内分泌治疗、化学治疗和使用靶向治疗剂的治疗。采用内分泌药物的治疗的先决条件是肿瘤组织中激素受体的表达,即雌激素受体、孕激素受体或者两者的表达。当在大量患者群组(cohort)中测试时具有不同的作用模式和疾病结果差异·的几种内分泌药物是可用的。他莫昔芬是过去三十年中内分泌治疗的主要药物。大量的临床试验表明,他莫昔芬显著地降低了肿瘤复发的风险。另一种治疗选择基于属于新的一类内分泌药物的芳香酶抑制剂。不同于作为雌激素结合的竞争性抑制剂的他莫昔芬,芳香酶抑制剂阻断了雌激素本身的产生,从而降低了对雌激素受体阳性肿瘤细胞的生长刺激。然而,有些患者尽管接受了内分泌治疗但会经历复发,尤其是这些患者可能受益于其他治疗药物。在雌激素受体阳性以及雌激素受体阴性的患者中,已经证明使用蒽环类抗生素、紫杉烷类和其他药物的化学治疗可以有效减少疾病的复发。NSABP-20研究在淋巴结阴性雌激素受体阳性患者中比较了单独的他莫昔芬和他莫昔芬加上化学治疗,表明联合治疗要比单独的他莫昔芬更有效。然而,比较了单独的他莫昔芬和他莫昔芬加上化学治疗的IBCSG IX研究却未能表明添加细胞毒性药物有任何显著的益处。最近,已经表明全身施用的抗肿瘤细胞表面上HER2/neu抗原的抗体可以使过表达Her2neu的肿瘤患者的复发风险降低数倍。然而,大部分(即使不是所有的)不同药物治疗都有许多潜在的副作用,可能会严重影响患者的生活质量(Shapiro和Recht, 2001 ;Ganz等人,2002)。这使得必须在对个体患者进行认真的风险评估的基础上选择治疗策略以避免过度治疗以及不足的治疗。由于化学治疗的益处在以缺乏HER2/neu和雌激素受体表达为特征的HER2/neu阳性肿瘤(基底型)中比在HER2/neu阴性和雌激素受体阳性肿瘤(管腔型)中相对较大,最具有挑战性的治疗决定涉及管腔型肿瘤,针对管腔型肿瘤的典型临床因素,比如分级、肿瘤大小或淋巴结累及,不能对是否采用化学治疗这一问题给出明确的答案。已经开发了较新的分子工具,如21基因分析、基因组等级指数分析和其他工具,来解决这个医疗需求。治疗指南通常由本领域知名的专家开发。在欧洲,圣加仑指南(St Gallenguidelines)从2009年开始向HER2阳性乳腺癌患者以及HER2阴性和ER阴性疾病患者推荐化学治疗。在HER2阴性和ER阳性疾病患者中存在关于化学治疗有效性的不确定性。为了对个体做出平衡的治疗决定,用癌症复发的可能性作为最有用的标准。诸如淋巴结状态、肿瘤分级、肿瘤大小等临床标准是有帮助的,因为它们提供关于复发风险的信息。最近,已经表明多基因分析比标准临床风险因素提供更好的或额外的信息。普遍认为,增殖标记似乎提供主要的预后信息。这些预测器(predictor)的突出的例子是来自Agendia的Mammaprint检测、来自Veridex的复发评分和Jules Bordet研究所开发并授权给Ipsogen的基因组等级指数。所有这些分析都是基于对至少70个基因的表达水平的测定,并且所有这些都已经针对未被福尔马林固定和石蜡包埋严重降解、但从新鲜组织中分离的RNA(在RNALaterTM中运输)进行了开发。另一种突出的多基因分析是Genomic Health Inc的复发评分检测。该检测在从福尔马林固定的、石蜡包埋的组织样品中提取RNA后测定16个癌症相关基因和5个参考基因的表达水平。然而,在最重要的临床风险组中,即那些基于标准临床参数具有中等复发风险的乳腺癌患者中,现有的工具苦于缺乏临床有效性和实用性。因此,需要更好的工具来根据患者的预后优化治疗决定。针对避免化学治疗的临床应用,需要具有高灵敏度和高阴性预测值的检测,以便不会发生对患者的治疗不足从而导致最终发生术后远端转移。关于在对辅助性治疗作出临床决定中有用的材料和方法的持续需求,本发明满足了对基于容易获得的 临床和实验数据进行乳腺癌预后的先进方法的需求。定义除非另有定义,本文所用的技术和科学术语具有与本发明所属领域中的普通技术人员所通常理解的相同的含义。术语“癌症”不限于任何阶段、等级、组织形态学特征、攻击性或累及组织的恶性肿瘤或细胞聚集。本文中所用的术语疾病的“预测结果”意在包括对经历了给定治疗的患者的结果的预测和未经治疗的患者的预后。术语“预测结果”尤其可涉及患者发生转移、局部复发或者死亡的风险。本文所用的术语“预测”涉及在用给定疗法对肿瘤进行治疗的情况下,对肿瘤恶性程度的个别评估,或者患者的预期生存率(0AS,总生存率,或DFS,无病生存率)。与之相反,术语“预后”涉及在未对肿瘤进行治疗的情况下,对肿瘤恶性程度的个别评估,或者患者的预期生存率(0AS,总生存率,或DFS,无病生存率)。在本发明的含义中,“结果”是在疾病过程中所达到的定义的状况。这种疾病结果可以是,例如临床状况,如“疾病复发”、“转移发展”、“淋巴结转移发展”、“远端转移发展”、“存活”、“死亡”、“肿瘤缓解率”、疾病分期或等级等。“风险”可以理解为与受试者或患者发展或达到某一疾病结果的概率有关的数值。在本发明的上下文中,术语“风险”并不带有任何关于患者健康的积极或消极的暗示,而仅指给定状况的发生或发展的概率或可能性。术语“临床数据”涉及关于患者的健康状态的全部可得到的数据和信息,包括但不限于年龄、性别、体重、绝经/激素状态、疾病发生学数据、既往病史数据、通过体外诊断方法如组织病理学、血液或尿液检验获得的数据、通过成像方法如X-射线、计算机断层扫描、MRI、PET、spect、超声波获得的数据、电生理学数据、遗传分析、基因表达分析、活组织检查评估、术中发现。术语“淋巴结阳性”、“诊断为淋巴结阳性”、“结累及”或“淋巴结累及”是指患者以前被诊断为淋巴结转移。它应包括两种引流淋巴结近淋巴结和远端淋巴结转移。这种以前的诊断本身并不构成本发明方法的一部分。相反,它是选择其样品可以用于本发明的一个实施方案的患者的先决条件。这种以前的诊断可能已经通过本领域中已知的任何合适的方法实现,所述方法包括但不限于淋巴结切除和病理学分析、活检分析、指示转移的生物标记的体外分析、成像方法(例如,计算机断层扫描、X-射线、磁共振成像、超声波)和术中发现。在本发明的上下文中,“生物样品”是来自于生物有机体或与之有过接触的样品。生物样品的例子有细胞、组织、体液、洗出液、涂片样品、活检标本、血液、尿液、唾液、痰、血浆、血清、细胞培养上清液等等。“肿瘤样品”是含有肿瘤细胞的生物样品,不论是完整的还是降解的。样品可以是任何生物组织或流体的样品。这样的样品包括但不限于,痰、血液、血清、血浆、血细胞(如白细胞)、组织、中心或细针活检样品、含细胞的体液、尿液、腹膜液和胸膜液、脑脊液、泪液,或从它们中分离的细胞。这也可包括组织切片,例如为了组织学目的而制作的冷冻或固定切片,或显微切割的细胞或其细胞外部分。待分析的肿瘤样品可以是通过抽吸或穿刺、切除 或通过任何其他获得活检或切除的细胞物质的手术方法从肿瘤病变处采集的组织材料。这些包括从患者获得的肿瘤细胞或肿瘤细胞片段。可在例如通过乳头抽吸、导管灌洗、细针活检或从刺激的或自发的乳头溢液中收集的细胞“涂片”中发现细胞。在另一实施方案中,样品是体液。这样的体液包括,例如,血液、血清、血浆、淋巴液、腹水液、妇科流体或尿液,但不限于这些体液。“基因”是含有产生功能性RNA产物所必需的信息的一组核酸区段。“基因产物”是通过基因的转录或表达产生的生物分子,例如,mRNA、cDNA或翻译的蛋白质。“mRNA”是基因的转录产物,且具有本领域技术人员所理解的通常含义。“由mRNA衍生的分子”是通过化学或酶方法从mRNA模板得到的分子,如cDNA。术语“表达水平”是指确定的基因表达的水平。这可以是作为绝对值,或与参考基因(例如持家基因)相比,与两个或更多的参考基因的平均值相比,或与计算的平均表达值相比(例如,在DNA芯片分析中),或在不使用参考样品的情况下与另一个信息基因相比而确定的基因表达水平。基因的表达水平可以直接测量,例如通过获得信号,其中该信号强度与该基因的mRNA转录物的量相关,或者它可以在蛋白质水平上间接获得,例如通过免疫组织化学、CISH、ELISA或RIA方法。也可以通过与参考样品的竞争性反应获得表达水平。通过在分析中测量一些物理参数例如荧光发射而确定的表达值可以被赋予一个数值,该数值可用于进一步的信息处理。在本发明的含义中,“表达水平的参考模式”应该被理解为可以用于同另一个表达水平模式进行比较的任何表达水平模式。在本发明的一个优选实施方案中,表达水平的参考模式是,例如,在健康个体组、患病个体组或已经接受特定类型治疗的患病个体组(作为参考组)或具有好或坏的结果的个体组中观察到的表达水平的平均模式。在本发明的含义内,术语“数学地组合表达水平”应被理解为从确定的基因表达水平推导出数值,以及对一个或多个这样的数值应用算法,以获得组合数值或组合得分。“算法”是进行某些操作顺序以产生信息的过程。“得分”是通过应用算法来数学地组合表达水平而推导出的数值。它也可以从表达水平和其他信息例如临床数据推导。得分可与患者的疾病结果相关。“判别函数”是用于将对象或事件进行分类的一组变量的函数。因此,判别函数允许根据可从患者、样品或事件获得的数据或参数将所述患者、样品或事件分类到一个类别或多个类别中。这种分类是本领域技术人员所公知的标准统计分析工具。例如,根据从患者、样品或事件所获得的数据,可将所述患者分类为“高风险”或“低风险”、“高转移概率”或“低转移概率”、“需要治疗”或“不需要治疗”。分类不限于“高与低”,而是可以分类到多种类别、等级等。在更广泛的意义上,分类也应被理解为判别得分,其中,例如较高的得分代表了较高的远端转移可能性,例如,远端转移的(总)风险。允许分类的判别函数的例子包括但不限于,由支持向量机(SVM)、K-最近邻法(kNN)、(朴素)贝叶斯模型、线性回归模型定义的函数,或分段定义函数,例如,在亚组发现中,在决策树中,在数据的逻辑分析(LAD)中,等等。在更广泛的意义上,诸如相关系数、投影、支持向量机得分、其他基于相似性的方 法、它们的组合等数学方法或算法的连续得分值是用于说明目的的例子。术语“治疗方式”、“治疗模式”、“方案”以及“治疗方案”是指用于癌症治疗的抗肿瘤、和/或抗血管、和/或免疫刺激、和/或血细胞增殖剂、和/或放射疗法、和/或高温疗法、和/或低温疗法的及时序贯或同时施用。这些的施用可以通过辅助和/或新辅助模式进行。这样的“方案”的组合在定义的治疗窗口内在单个治疗剂的剂量、应用的时限和施用频率方面可能会有所不同。目前,各种药物和/或物理方法的各种组合以及各种计划表正在研究中。术语“细胞毒性化学治疗”是指影响细胞的增殖和/或存活的各种治疗方式。治疗可包括烷化剂、抗代谢物、蒽环类、植物生物碱类、拓扑异构酶抑制剂和包括单克隆抗体和激酶抑制剂在内的其他抗肿瘤剂的给药。特别地,细胞毒性治疗可涉及紫杉烷治疗。紫杉烷类是植物生物碱类,它们通过防止微管功能来阻止细胞分裂。紫杉烷的原型是天然产物紫杉醇,最初被称为紫杉酚(Taxol),最初来源于太平洋紫杉树的树皮。多西紫杉醇是紫杉醇的一种半合成类似物。紫杉烷类增强微管的稳定性,防止在细胞分裂后期染色体的分离。术语“内分泌治疗”或“激素治疗”(有时也被称为“抗激素治疗”)表示以激素信号传导为靶标的治疗,例如激素抑制、激素受体抑制、激素受体激动剂或拮抗剂的使用、清除剂或孤儿受体的使用、激素衍生物的使用和干扰激素产生。具体的例子是调节雌激素受体信号传导的他莫昔芬治疗或干扰类固醇激素产生的芳香酶治疗。他莫昔芬是口服活性的选择性雌激素受体调节剂(SERM),用于治疗乳腺癌,是目前世界上用于这一目的的销量最大的药物。他莫昔芬以Nolvadex、Istubal和Valodex的商品名销售。然而,甚至在其专利到期之前,该药物仍然广泛地用它的通用名“他莫昔芬”来提及。他莫昔芬和他莫昔芬衍生物竞争性地结合肿瘤和其他组织靶标上的雌激素受体,产生减少RNA合成和抑制雌激素效应的核复合物。类固醇受体是执行类固醇激素的信号转导的细胞内受体(通常是细胞质的)。例子包括1型受体,尤其是性激素受体,例如,雄激素受体、雌激素受体、孕激素受体;糖皮质激素受体、盐皮质激素受体;和II型受体,例如,维生素A受体、维生素D受体、类视黄醇受体、甲状腺激素受体。本文所用的术语“基于杂交的方法”是指提供将互补的单链核酸或核苷酸类似物组合成一个双链分子的过程的方法。核苷酸或核苷酸类似物在正常条件下将与它们的互补物结合,所以两个完全互补的链很容易相互结合。在生物分析中,经常使用标记的单链探针以便找到互补的靶序列。如果这样的序列存在于样品中,探针将与所述序列杂交,然后由于标记而能够被检测到。其他的基于杂交的方法包括微阵列和/或生物芯片方法。其中,探针被固定在固相上,然后将其暴露于样品。如果互补的核酸存在于样品中,它们将与探针杂交,并因此能够被检测到。这些方法也被称为“基于阵列的方法”。另一基于杂交的方法是PCR,将在下文中描述。当涉及到表达水平的测定时,例如,基于杂交的方法可以用来确定给定基因的mRNA的量。能够特异性结合基因或其片段的序列的寡核苷酸涉及与基因或基因产物如基因的mRNA或cDNA或其片段特异性杂交的寡核苷酸。为了特异性检测基因或基因产物,不一定要检测整个基因序列。约20-150个碱基的片段将含有足够的序列特异性信息,以允许特异性杂父。本文所用的术语“基于PCR的方法”是指包括聚合酶链反应(PCR)的方法。这是一种通过体外的酶复制来指数扩增核酸例如DNA的方法。由于PCR是一种体外技术,它可以·在不限制DNA的形式的情况下进行,并且可以被广泛地修改以执行多种遗传操作。当涉及到表达水平的测定时,基于PCR的方法例如可以用来通过以下步骤检测给定mRNA的存在(I)在逆转录酶的帮助下将完整的mRNA池(即所谓的转录组)逆转录成cDNA,和(2)在各自的引物的帮助下检测给定cDNA的存在。这种方法通常被称为逆转录PCR(rtPCR)。此外,基于PCR的方法包括,例如,实时PCR,以及尤其适合表达水平分析的动力学或定量 PCR(qPCR)。术语“定量PCR(qPCR) ”是指允许对样品中的模板进行量化的任何类型的PCR方法。定量实时PCR包括不同的表现和产物检测技术,例如TaqMan技术或LightCycler技术。例如,TaqMan技术使用双标记的荧光探针。TaqMan实时PCR在PCR指数阶段经由荧光团检测产物的积累,而不是像在常规PCR中那样在终点检测。产物的指数性增加用于确定循环阈值,CT,即检测到荧光的显著指数性增加时的PCR循环数,并且与存在于反应中的DNA模板的拷贝数直接相关。该反应的设置与常规PCR非常相似,只是在允许测量PCR管中的荧光分子的实时热循环仪中进行。不同于常规PCR,在TaqMan实时PCR中向反应中添加探针,即与DNA模板内20-60个核苷酸的区段互补且位于两个引物之间的单链寡核苷酸。突光报告分子或荧光团(例如,6-羧基荧光素,缩写FAM,或四氯荧光素,缩写TET)和猝灭剂(例如,四甲基罗丹明,缩写TAMRA,或二氢环吡咯并吲哚三肽“黑洞猝灭剂”,缩写BHQ)分别共价连接到探针的5’和3’末端[2]。荧光团与连接到探针上的猝灭剂之间的紧密接近抑制了荧光团发出的荧光。在PCR过程中,当DNA合成开始时,Taq聚合酶的5’到3’外切核酸酶活性降低了已经与模板退火的探针的比例。探针的降解从中释放出荧光团,并且打破了与猝灭剂的紧密接近,从而减轻了猝灭效果,并允许荧光团发荧光。因此,在实时PCR热循环仪中检测到的荧光与释放的荧光团和PCR中存在的DNA模板的量成正比。“阵列”或“矩阵”是指装置上可寻址的位置或“地址”的布置。位置可以以二维阵列、三维阵列或其他矩阵格式排布。位置的数目可以从几个到至少几十万个。最重要的是,每个位置代表一个完全独立的反应位点。阵列包括但不限于核酸阵列、蛋白质阵列和抗体阵列。“核酸阵列”是指含有核酸探针如寡核苷酸、核苷酸类似物、多核苷酸、核苷酸类似物的聚合物、吗啉代或基因的更大部分的阵列。阵列上的核酸和/或类似物优选为单链的。其中探针是寡核苷酸的阵列被称为“寡核苷酸阵列”或“寡核苷酸芯片”。“微阵列”在本文中也指“生物芯片”或“生物学芯片”,是具有至少约100/cm2、优选至少约1000/cm2的离散区域密度的区域阵列。在本发明的含义内,“引物对”和“探针”具有分子生物学领域技术人员所公知的该术语的普通含义。在本发明的一个优选实施方案中,“引物对”和“探针”应被理解为具有与待检测或定量的靶多核苷酸区域相同、互补、同源的或与该区域的互补物同源的序列的多核苷酸分子。在另一实施方案中,也包含核苷酸类似物以用作引物和/或探针。用于动力学或实时PCR应用的探针技术可以是,例如,可从Applied Biosystems获得的BiqMim*系统,延伸探针如Scorpio丨丨彳 Primers,双杂交探针(Dual Hybridisation Probes),可从 Chemicon International Inc 获得的 ΛπφΗ υοΓ 或小沟结合剂(Minor GrooveBinders)。在本发明的含义内,“个别标记的探针”应理解为有助于探针的检测或定量的、含 有多核苷酸、寡核苷酸或核苷酸类似物和标记物的分子探针。优选的标记物是荧光分子、发光分子、放射性分子、酶分子和/或粹灭分子。在本发明的含义内,“阵列化探针”应理解为固定的探针的集合,优选为有序排列。在本发明的优选实施方案中,个别的“阵列化探针”可根据它们各自在固体载体例如“芯片”上的位置来鉴别。当用于单链核酸序列时,术语“基本上同源的”是指在如上所述的低严格性条件下能够与该单链核酸序列杂交(即,与之互补)的任何探针。

发明内容
总体而言,本发明提供了评估淋巴结阴性或阳性、雌激素受体阳性和HER2/NEU阴性乳腺癌患者,特别是接受内分泌治疗的患者(例如用他莫昔芬治疗时)的复发风险的方法。雌激素受体状态一般用免疫组织化学来确定,HER2/NEU (ERBB2)状态一般用免疫组织化学和荧光原位杂交来确定。然而,为了本发明的目的,雌激素受体状态和HER2/NEU (ERBB2)状态可用诸如免疫组织化学、荧光原位杂交(FISH)或RNA表达分析等任何合适的方法来确定。本发明涉及用于预测乳腺癌患者的雌激素受体阳性和HER2阴性肿瘤的乳腺癌结果的方法,所述方法包括(a)确定来自所述患者的肿瘤样品中以下9个基因中至少2个的RNA表达水平UBE2C、BIRC5、RACGAPI、DHCR7、STC2、AZGP1、RBBP8、IL6ST 和 MGP ;(b)数学地组合在所述肿瘤样品中确定的所述组基因的表达水平值,从而得出组合得分,其中所述组合得分指示所述患者的预后。在一个实施方案中,至少选择3、4、5或6个基因。在本发明的进一步的实施方案中,该方法包括(a)确定来自所述患者的肿瘤样品中以下8个基因的RNA表达水平UBE2C、RACGAPI、DHCR7、STC2、AZGP1、RBBP8、IL6ST 和 MGP ;(b)数学地组合在所述肿瘤样品中确定的所述组基因的表达水平值,从而得出组合得分,其中所述组合得分指示所述患者的预后。在进一步的实施方案中,本发明的方法包括(a)确定来自所述患者的肿瘤样品中以下8个基因的RNA表达水平UBE2C、BIRC5、DHCR7、STC2、AZGP1、RBBP8、IL6ST 和 MGP ;(b)数学地组合在所述肿瘤样品中确定的所述组基因的表达水平值,从而得出组合得分,其中所述组合得分指示所述患者的预后。在本发明的又一实施方案中,BIRC5 可以替换为 UBE2C 或 T0P2A 或 RACGAPI 或 AURKA 或 NEK2 或 E2F8 或 PCNA 或 CYBRDl 或 DCN 或 ADRA2A 或 SQLE 或 CXCL12 或 EPHX2 或 ASPH 或 PRSS16 或 EGFR 或 CCNDl 或TRIM29或DHCR7或PIP或TFAP2B或WNT5A或APOD或PTPRT,条件是替换后选择8个不同的基因;且 UBE2C 可以替换为 BIRC5 或 RACGAP1 或 T0P2A 或 AURKA 或 NEK2 或 E2F8 或 PCNA 或CYBRDl 或 ADRA2A 或 DCN 或 SQLE 或 CCNDl 或 ASPH 或 CXCL12 或 PIP 或 PRSS16 或 EGFR 或DHCR7或EPHX2或TRM29,条件是替换后选择8个不同的基因;且DHCR7可以替换为AURKA、BIRC5、UBE2C或任何其他可以代替BIRC5或UBE2C的基因,条件是替换后选择8个不同的基因;且STC2 可以替换为 INPP4B 或 IL6ST 或 SEC14L2 或 MAPT 或 CHPTl 或 ABAT 或 SCUBE2或ESRl或RBBP8或PGR或PTPRT或HSPA2或PTGER3,条件是替换后选择8个不同的基因;且AZGPl可以替换为PIP或EPHX2或PLAT或SEC14L2或SCUBE2或PGR,条件是替换后选择8个不同的基因;且RBBP8可以替换为CELSR2或PGR或STC2或ABAT或IL6ST,条件是替换后选择8个不同的基因;且IL6ST 可以替换为 INPP4B 或 STC2 或 MAPT 或 SCUBE2 或 ABAT 或 PGR 或 SEC14L2 或ESRl或GJAl或MGP或EPHX2或RBBP8或PTPRT或PLAT,条件是替换后选择8个不同的基因;且MGP可以替换为APOD或IL6ST或EGFR,条件是替换后选择8个不同的基因。根据本发明的一个方面,提供了如上所述的方法,其中所述组合得分表明从细胞毒性化学治疗中受益。在患者接受内分泌治疗之前使用本发明的方法允许预测内分泌治疗的疗效。下面的表2中示出了在接受内分泌治疗的患者中,每个上述标记基因的过表达是指示好结果还是指示坏结果。因此,技术人员可以考虑给定基因的效果来构建数学组合,即算法。例如,其过表达指示好结果的基因的求和或加权求和导致一种其中高风险得分指示好结果的算法。通过用临床记录分析患者的肿瘤样品,可以检查该算法的有效性,其中,例如,可以分别确定和比较好结果患者和坏结果患者的得分。技术人员、生物统计学家将知道运用进一步的数学方法如判别函数来得到优化的算法。例如可以针对灵敏度或特异性对算法进行优化。算法可通过调整而适应于用来测量标记基因的基因表达的特定分析平台,如定量PCR。根据本发明的一个方面,提供了如上所述的方法,其中所述内分泌治疗包括他莫昔芬或芳香酶抑制剂。根据本发明的一个方面,提供了如上所述的方法,其中预测发生复发的风险。根据本发明的一个方面,提供了如上所述的方法,其中所述表达水平作为非蛋白质表达水平进行确定。根据本发明的一个方面,提供了如上所述的方法,其中所述表达水平作为RNA表达水平进行确定。根据本发明的一个方面,提供了如上所述的方法,其中所述表达水平通过以下方法中的至少一种来确定基于PCR的方法,
基于微阵列方法,和
基于杂交的方法。根据本发明的一个方面,提供了如上所述的方法,其中所述表达水平的测定是在福尔马林固定的、石蜡包埋的肿瘤样品中或在新鲜冷冻的肿瘤样品中进行的。根据本发明的一个方面,提供了如上所述的方法,其中,所述至少一个标记基因的表达水平作为相对于至少一个参考基因或相对于计算的平均表达值的表达模式进行确定。根据本发明的一个方面,提供了如上所述的方法,其中,所述数学组合步骤包括对代表给定基因的表达水平的值应用算法的步骤。根据本发明的一个方面,提供了如上所述的方法,其中所述算法是所述代表给定基因表达水平的值的线性组合。根据本发明的一个方面,提供了如上所述的方法,其中代表给定基因的表达水平的值乘以一个系数。根据本发明的一个方面,提供了如上所述的方法,其中,为所述组合得分确定一个、两个或两个以上的阈值,并且通过对所述组合得分应用该阈值,该阈值判别为高和低风险,高、中和低风险,或更多的风险组。根据本发明的一个方面,提供了如上所述的方法,其中高组合得分表明从更具侵略性的治疗如细胞毒性化学治疗中受益。本领域技术人员理解,在这一点上,“高得分”涉及参考值或截止值。本领域技术人员进一步理解,取决于所用来得到组合得分的特定算法,低于截止值或参考值的“低”得分也可以表明受益于更具侵略性的治疗,如细胞毒性化学治疗。当与闻转移风险具有正相关的基因代入具有正系数的算法,使得闻总得分指不与闻风险具有正相关的基因的高表达时,情况就是这样。根据本发明的一个方面,提供了如上所述的方法,其中,在数学地组合基因表达水平值以得出组合得分的步骤中处理关于患者的淋巴结状态的信息。根据本发明的一个方面,提供了如上所述的方法,其中,如果所述淋巴结状态为阴性,则所述关于淋巴结状态的信息为彡O的数值,而如果所述淋巴结状态为阳性或未知,则所述信息为>0的数值。在本发明的示例性实施方案中,阴性淋巴结状态被赋予数值0,未知淋巴结状态被赋予数值O. 5,而阳性淋巴结状态被赋予数值I。也可选择其他值,以反映淋巴结状态在算法中的不同的权重。本发明还涉及用于执行如上所述的方法的试剂盒,所述试剂盒包含一组能够特异性结合基因组合中基因的序列或基因片段的序列的寡核苷酸,其中
(i)所述组合包括至少以下 8 个基因UBE2C、BIRC5、DHCR7、STC2、AZGPl、RBBP8、IL6ST 和 MGP ;或(ii)所述组合包括至少以下 10 个基因BIRC5、AURKA、PVALB, NMU, STC2、RBBP8、PTGER3、CXCLl2, CDHl 和 PIP ;或(iii)所述组合包括至少以下 9 个基因BIRC5、DHCR7、RACGAPK PVALB, STC2、IL6ST、PTGER3、CXCL12和 ABAT ;或(iv)所述组合包括至少以下 9 个基因DHCR7、RACGAP1、NMU、AZGPl、RBBP8、IL6ST和 MGP。本发明还涉及用于执行权利要求I至17中任一项的方法的试剂盒的应用,所述试剂盒包含一组能够特异性结合基因组合中基因的序列或基因片段的序列的寡核苷酸,其中
(i)所述组合包括至少以下 8 个基因UBE2C、BIRC5、DHCR7、STC2、AZGPl、RBBP8、IL6ST 和 MGP ;或(ii)所述组合包括至少以下 10 个基因BIRC5、AURKA、PVALB, NMU、STC2、RBBP8、PTGER3、CXCLl2, CDHl 和 PIP ;或(iii)所述组合包括至少以下 9 个基因BIRC5、DHCR7、RACGAPK PVALB, STC2、IL6ST、PTGER3、CXCL12和 ABAT ;或(iv)所述组合包括至少以下 9 个基因DHCR7、RACGAP1、NMU、AZGPl、RBBP8、IL6ST和MGP ;19. 一种计算机程序产品,该产品通过数学地组合代表基因AKR1C3、MAP4和SPPl的表达水平的值以得出组合得分,能够处理所述值,其中,所述组合得分表明所述患者从细胞毒性化学治疗中受益。本发明还涉及一种计算机程序产品,该产品根据上述方法通过数学地组合代表基因组合的表达水平的值以得出组合得分,能够处理所述值,其中,所述组合得分指示所述患者从内分泌治疗获得的疗效或益处。所述计算机程序产品可存储在数据载体上,或在能够输出代表给定基因的表达水平的值的诊断系统如实时PCR系统上执行。如果计算机程序产品存储在数据载体上,或在计算机上运行,操作个人可以输入对于各自基因的表达水平获得的表达值。该计算机程序产品然后可以应用算法,以产生表明给定患者从细胞毒性化学治疗中受益的组合得分。本发明的方法具有以下优点在仅仅使用少数基因的基础上,提供了对疾病结果的可靠的预测。现已发现,本发明的方法特别适合于分析携带被分类为ESRl阳性和ERBB2阴性的肿瘤的患者对内分泌治疗例如他莫昔芬治疗的响应。
具体实施例方式结合示例性实施方案和附图
对本发明进行了说明图I显示在ABCSG06和08研究的组合群以及个体治疗组中,使用远端转移作为终点,T5得分的具有95%置信区间的校正危险单位比的Forrest图。图2显示根据T5得分值分成高或低风险的、来自ABCSG06和08组合群的ER+、HER-> N0-3 患者的 Kaplan Meier 分析。本文公开了独特的标记基因组合,它们可以组合为用于本文提出的新预测检验的算法。从技术上讲,可以使用两种技术来实施本发明的方法1)从新鲜或固定的肿瘤组织中分离总RNA,和2)分离的核酸的动力学RT-PCR。备选地,也考虑使用替代技术,例如通过微阵列或通过在蛋白质水平上测量,来测量表达水平。本发明的方法基于从肿瘤中分离的RNA种类的定量测定以得到表达值,和随后对所述确定的表达值的生物信息学分析。RNA种类可分离自任何类型的肿瘤样品,例如活检样品、涂片样品、切除的肿瘤物质、新鲜冷冻的肿瘤组织或石蜡包埋的、福尔马林固定的肿瘤组织。首先,如上所述确定编码基因UBE2C、BIRC5、DHCR7、RACGAPI、AURKA、PVALB, NMU、STC2、AZGP1、RBBP8、IL6ST、MGP、PTGER3、CXCL12、ABAT、CDH1 和 PIP 的特定组合的基因或其特定组合的RNA水平。基于这些表达值,通过数学组合,例如根据公式T5、T1、T4或T5b (见下文),计算出预后得分。高得分值表示发展远端转移的高风险,低得分值表示远端转移的低风险。因此,高得分也表明患者是高风险患者,将受益于更具侵略性的治疗,如细胞毒性化学治疗。本文的实例基于使用同样地在辅助设置下用他莫昔芬进行治疗的患者的肿瘤对预后基因的鉴定。此外,相关基因的鉴定也已限制在根据RNA表达水平被分类为ESRl阳性·和ERBB2阴性的肿瘤。另外,算法的开发也考虑允许分离中等风险例如2级肿瘤的基因。最后,进行从Affymetrix HG_U133a阵列到定量实时PCR的平台转移,以及从新鲜冷冻组织到FFPE组织的样品类型转移,以确保独立于平台和组织类型的、稳定的算法表现。其结果是,如上所述对来自原发肿瘤的RNA种类的表达水平的确定和随后的复变和多变量分析提供了一种出色的方法,该方法用于预测被诊断为淋巴结阴性或阳性的早期乳腺癌患者在辅助设置下仅用他莫昔芬治疗时疾病复发的可能性。因此,该检验依赖于比竞争剂检验更少的基因,但可以提供出色的关于高灵敏度和阴性预测值的信息,尤其是用于基于标准临床因素被认为表现出中等复发风险的肿瘤。使用西门子的基于二氧化硅珠子的全自动化RNA分离方法,在Hamilton MICR0LABSTARLET液体处理自动装置(17)上,从一个10 μ m的全FFPE组织切片中提取总RNA。自动装置、缓冲液和化学品是西门子VI rsaNT kPCR分子系统(Siemens HealthcareDiagnostics, Tarrytown, NY ;在美国无法商购)的部分。简言之,将150微升FFPE缓冲液(缓冲液FFPE,研究用试剂,Siemens Healthcare Diagnostics)加至每个切片,并在振摇下80°C孵育30分钟,以熔化石蜡。冷却下来后,加入蛋白酶K,在65°C孵育30分钟。裂解后,通过在65°C与40 μ I 二氧化硅包被的氧化铁珠子孵育15分钟的步骤,从裂解液中移除剩余的组织碎片。用磁体分离具有表面结合的组织碎片的珠子,将裂解物转移到一个标准的2ml深孔板(96孔)中。在孔中,总RNA和DNA结合到40 μ I未使用的珠子上,并在室温孵育。通过加入600 μ I裂解缓冲液产生离液序列高的条件。然后,对珠子进行磁分离,并弃去上清液。之后,洗涤表面结合的核酸三次,然后磁化、抽吸并弃去上清液。之后,通过将珠子与100 μ I洗脱缓冲液在70°C、振摇下孵育10分钟来洗脱核酸。最后,分离珠子,上清液与12 μ I DNase I混合物(2 μ L DNase I (不含RNase) ;10 μ IIOx DNase I 缓冲液;Ambion/Applied Biosystems, Darmstadt,德国)孵育,以除去污染的DNA。在37°C孵育30分钟后,将不含DNA的总RNA溶液分为小份并储存在_80°C下或直接通过逆转录动力学PCR(RTkPCR)用于mRNA表达分析。所有样品都在ABI PRISVI 7900HT(Applied Biosystems, Darmstadt,德国)中通过一步 RT-kPCR 分析了多达 3 个参考基因(RPL37A、CALM2、OAZI)和多达16个靶基因的基因表达。使用ROX (6-羧基-X-罗丹明)的SuperScript III Platinum 一步定量 RT-PCR 系统(Invitrogen,Karlsruhe,德国)根据制造商的说明使用。相应的探针和引物在表I中示出。PCR条件如下在50°C下30分钟,在95°C下2分钟,随后在95°C下15秒和在60°C下30秒40个循环。所有PCR试验都平行进行三次。作为RNA收率的替代标记,如其他地方所述(17),使用持家基因RPL37A的循环阈值(Ct)。通过delta-Ct法使用下面的公式计算靶基因的相对基因表达水平20- (Ct (靶标)-平均值(Ct (参考基因)))。从AfTymetrix HG_U133a阵列(新鲜冷冻组织)到定量实时PCR (FFPE组织)的平台转移如下计算。用这两个平台测定来自于158名患者的材料以产生配对样品。从PCR数据计算Delta-Ct值。通过应用下界(将所有低于下界的值都设置为下界),然后计算以2为底的对数,从AfTymetrix数据计算log2_表达。下界的应用降低了增大的相对测量噪音对低表达的基因/样品的影响;使用下界20,在O. I和200之间的下界也表现很好。通过最大化delta-Ct值(来自PCR)与log2_表达(来自Affymetrix)之间的Pearson相关系数,为每 个PCR测定的基因选择HG_U133a探针组。其他相关性量度也有很好的表现,例如Spearman相关系数。在大多数情况下,最相关的探针组属于预期的基因,对于其余的情况,移除PCR基因以便进一步处理。也移除在平台间表现出不佳相关性的那些基因,其中对Pearson相关系数使用阈值O. 7 (在O. 5和O. 8之间的值),也表现很好。通过以下步骤完成平台变换计算两个平台的无监督Z-变换并组合它们;然后通过以下步骤将单PCR-delta-Ct值转化为Affymetrix等级(i)应用仿射线性变换,其中通过PCR数据的z_变换确定系数,(ii)应用逆仿射线性变换,其中通过Affymetrix数据的Z-变换确定系数,(iii)对log2进行逆运算,即计算关于底数2的指数。两倍Z-变换的替代方案为线性或更高阶的回归、稳健回归或基于主成分的方法,它们也表现很好。权利要求
1.用于预测乳腺癌患者的雌激素受体阳性和HER2阴性肿瘤的乳腺癌结果的方法,所述方法包括 (a)确定来自所述患者的肿瘤样品中以下9个基因中的至少2个的RNA表达水平UBE2C、BIRC5、RACGAPI、DHCR7、STC2、AZGP1、RBBP8、IL6ST 和 MGP ; (b)数学地组合在所述肿瘤样品中确定的所述组基因的表达水平值,从而得出组合得分,其中所述组合得分指示所述患者的预后。
2.如权利要求I所述的方法,包括 确定来自所述患者的肿瘤样品中以下9个基因中的至少3、4、5或6个的RNA表达水平UBE2C、BIRC5、RACGAPI、DHCR7、STC2、AZGP1、RBBP8、IL6ST 和 MGP。
3.如权利要求I或2所述的方法,包括 (a)确定来自所述患者的肿瘤样品中以下8个基因的RNA表达水平UBE2C、RACGAPKDHCR7、STC2、AZGP1、RBBP8、IL6ST 和 MGP ; (b)数学地组合在所述肿瘤样品中确定的所述组基因的表达水平值,从而得出组合得分,其中所述组合得分指示所述患者的预后。
4.如权利要求I或2所述的方法,包括 (a)确定来自所述患者的肿瘤样品中以下8个基因的RNA表达水平UBE2C、BIRC5、DHCR7、STC2、AZGP1、RBBP8、IL6ST 和 MGP ; (b)数学地组合在所述肿瘤样品中确定的所述组基因的表达水平值,从而得出组合得分,其中所述组合得分指示所述患者的预后。
5.根据权利要求4所述的方法,其中BIRC5 可以替换为 UBE2C 或 T0P2A 或 RACGAPI 或 AURKA 或 NEK2 或 E2F8 或 PCNA 或 CYBRDl或 DCN 或 ADRA2A 或 SQLE 或 CXCL12 或 EPHX2 或 ASPH 或 PRSS16 或 EGFR 或 CCNDl 或 TRM29或DHCR7或PIP或TFAP2B或WNT5A或APOD或PTPRT,条件是替换后选择8个不同的基因;且UBE2C 可以替换为 BIRC5 或 RACGAPI 或 T0P2A 或 AURKA 或 NEK2 或 E2F8 或 PCNA 或 CYBRDl或 ADRA2A 或 DCN 或 SQLE 或 CCNDl 或 ASPH 或 CXCL12 或 PIP 或 PRSS16 或 EGFR 或 DHCR7 或EPHX2或TRM29,条件是替换后选择8个不同的基因;且 DHCR7可以替换为AURKA、BIRC5、UBE2C或任何其他可以代替BIRC5或UBE2C的基因,条件是替换后选择8个不同的基因;且而 STC2 可以替换为 INPP4B 或 IL6ST 或 SEC14L2 或 MAPT 或 CHPTl 或 ABAT 或 SCUBE2或ESRl或RBBP8或PGR或PTPRT或HSPA2或PTGER3,条件是替换后选择8个不同的基因;且 AZGPl可以替换为PIP或EPHX2或PLAT或SEC14L2或SCUBE2或PGR,条件是替换后选择8个不同的基因;且 RBBP8可以替换为CELSR2或PGR或STC2或ABAT或IL6ST,条件是替换后选择8个不同的基因;且IL6ST 可以替换为 INPP4B 或 STC2 或 MAPT 或 SCUBE2 或 ABAT 或 PGR 或 SEC14L2 或 ESRl或GJAl或MGP或EPHX2或RBBP8或PTPRT或PLAT,条件是替换后选择8个不同的基因;且 MGP可以替换为APOD或IL6ST或EGFR,条件是替换后选择8个不同的基因。
6.根据权利要求I至5所述的方法,其中,所述患者已经接受内分泌治疗或计划接受内分泌治疗。
7.如权利要求6所述的方法,其中所述内分泌治疗包含他莫昔芬或芳香酶抑制剂。
8.根据权利要求I至7中任一项的方法,其中,预测发生乳腺癌复发或癌症相关死亡的风险。
9.根据权利要求I至8中任一项的方法,其中,所述表达水平作为信使RNA表达水平进行确定。
10.根据权利要求8所述的方法,其中,所述表达水平通过以下方法中的至少一种来确定 基于PCR的方法, 基于微阵列的方法,和 基于杂交的方法。
11.前述权利要求中任一项的方法,其中,所述表达水平的确定是在福尔马林固定的、石蜡包埋的肿瘤样品中,或在新鲜冷冻的肿瘤样品中进行的。
12.上述权利要求中任一项的方法,其中,至少一个标记基因的表达水平作为相对于至少一个参考基因或相对于计算的平均表达值的表达模式进行确定。
13.前述权利要求中任一项的方法,其中,所述数学组合步骤包括对代表给定基因表达水平的值应用算法的步骤。
14.如权利要求13所述的方法,其中所述算法是所述代表给定基因表达水平的值的线性组合。
15.如权利要求14所述的方法,其中代表给定基因表达水平的值乘以一个系数。
16.前述权利要求中任一项的方法,其中,为所述组合得分确定一个、两个或两个以上的阈值,通过对所述组合得分应用该阈值,其判别为高和低风险,高、中和低风险,或更多个风险组。
17.根据权利要求I至16中任一项的方法,其中,高组合得分表明从细胞毒性化学治疗中受益。
18.前述权利要求中任一项的方法,其中,在所述数学地组合基因表达水平值以得出组合得分的步骤中处理关于所述患者的淋巴结状态的信息。
19.如权利要求17和18所述的方法,其中,如果所述淋巴结状态是阴性的,则所述关于淋巴结状态的信息是一个数值;如果所述淋巴结状态是阳性的,则所述信息是一个不同的数值;如果所述淋巴结状态未知,则所述信息是一个不同或相同的数值。
20.一种用于执行权利要求I至19中任一项的方法的试剂盒,所述试剂盒包括一组能够特异性结合基因组合中基因的序列或基因片段的序列的寡核苷酸,其中,所述组合包括以下 9 个基因中的至少 2 个UBE2C、BIRC5、RACGAPI、DHCR7、STC2、AZGP1、RBBP8、IL6ST 和MGP。
21.一种计算机程序产品,该产品能够根据权利要求I至17中任一项的方法处理代表一组基因的表达水平的值,数学地组合所述值以得出组合得分,其中所述组合得分指示所述患者的内分泌治疗的疗效。
全文摘要
本发明涉及用于乳腺癌疾病结果的预后的方法、试剂盒和系统,所述方法包括(a)确定来自所述患者的肿瘤样品中以下9个基因中的至少2个的RNA表达水平UBE2C、BIRC5、RACGAP1、DHCR7、STC2、AZGP1、RBBP8、IL6ST和MGP;(b)数学地组合在该肿瘤样品中确定的所述组基因的表达水平值,从而得出组合得分,其中所述组合得分指示所述患者的预后;以及实施所述方法的试剂盒和系统。
文档编号C12Q1/68GK102971435SQ201180016811
公开日2013年3月13日 申请日期2011年3月29日 优先权日2010年3月31日
发明者马瑞克·达特曼, 因克·赛宾·费德, 马蒂亚斯·格尔曼, 圭多·亨宁, 卡斯滕·韦伯, 克里斯蒂安·冯托尔讷, 拉尔夫·克罗嫩维特, 克里斯托夫·佩特里 申请人:斯维丹诊断有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1