Egfr抑制剂治疗的预测性标记物的制作方法

文档序号:570639阅读:225来源:国知局

专利名称::Egfr抑制剂治疗的预测性标记物的制作方法EGFR抑制剂治疗的预测性标记物本发明提供一种生物标记物,其预测对癌症患者中使用EGFR抑制剂的治疗的反应。许多人恶性肿瘤与表皮生长因子受体(EGFR)的异常或过表达有关。EGF,转化生长因子Qt(TGF-a),和许多其他配体结合EGFR,从而剌激该受体胞内酪氨酸激酶结构域的自身磷酸化。随后激活多种胞内途径,且这些下游事件导致肿瘤细胞体外增殖。已经假定通过EGFR剌激肿瘤细胞可能对体内肿瘤生长和肿瘤存活非常重要。关于Tarceva,即EGFR酪氨酸激酶的抑制剂的早期临床数据显示该化合物是安全的且通常在提供靶有效浓度的剂量时良好耐受(如通过临床前数据确定地)。患有晚期疾病的患者中的临床I和II期试验证明TarcevaTM在一定范围的上皮肿瘤中具有有前景的临床活性。事实上,已经显示出Tarceva能够在先前受治疗的患有头颈癌和NSCLC(非小细胞肺癌)的患者中诱导与确定的第二线化学疗法相似级别的持久部分好转,但是具有比化学疗法更好的安全特性和改进的方便性(片剂代替静脉内[i.v.]施用)的额外益处。近期完成的随机双盲安慰剂对照试验(BR.21)显示单试剂TarcevaTM显著延长和改善NSCLC患者的存活,对于所述NSCLC患者,标准的晚期疾病疗法未能成功。Tarceva(厄洛替尼(erlotinib))是小化学分子;其是EGFR酪氨酸激酶(EGFR-TKI)的口服活性有效选择性抑制剂。肺癌是北美和欧洲中癌症相关死亡的主要原因。在美国,由肺癌继发的死亡数量超过由第二(结肠癌)、第三(乳腺癌)、和第四(前列腺癌)主要癌症死亡原因组合的总死亡。全部肺癌的约75%-80%是非小细胞肺癌(NSCLC),其约40%的患者表现出局部晚期和/或不可切除的疾病。该组典型地包括患有大量IIIA和IIIB期疾病的那些,不包括恶性胸膜渗漏。肺癌在欧洲联盟中的粗略发生率是52.5,死亡率是48.7病例/100000/年。分别地,在男性中,所述比率是79.3和78.3,在女性中,是21.6和20.5。NSCLC占所有肺癌病例的80%。男性中约90%的肺癌死亡率和女性中的80%可归因于吸烟。在美国,根据美国癌症协会,在2004年,存在约173,800件新肺癌病例(男性中93,100和女性中80,700)并占全部新癌症的约13%。大多数患者在诊断两年内由于他们的疾病后果而死亡。对于许多NSCLC患者,成功的治疗仍然难以捉摸。晚期肿瘤经常不能通过手术处理并且还可能对可的耐受剂量放射疗法和化学疗法具有抗性。在随机试验中,当前最具活性的组合化学疗法获得约30%_40%的反应率,和35%-40%的1年存活率。这确实是超过单独使用支持性医护所观察到的10%的1年存活率的进步。直到最近,患者复发后的治疗选择仅限于最佳支持性医护或减轻。近期比较多西他赛(Taxotere③)和最佳支持性医护的试验显示患有nsclc的患者在基于顺铂的第一线方案失败后,可以受益于第二线化学疗法。所有年龄和具有0,l,或2EC0G性能状态的患者证明了使用多西他赛的提高的存活,先前用基于铂的治疗难治的患者也如此。不受益于疗法的患者包括体重减轻>10%、高乳酸脱氢酶水平、多器官累及、或肝累及的那些。另外,多西他赛单一疗法的益处不扩展超过第二线设置。接受多西他赛作为第三线治疗或以上的患者没显示出存活的延长。单试剂多西他赛成为NSCLC的标准第二线疗法。近期,第二线NSCLC疗法中的另一个随机III期试验比较了培美曲塞(八1^111&@)和多西他赛。使用培美曲塞的治疗导致临床等价功效但与多西他赛相比具有显著更小的副作用。长期以来公认存在开发个性化癌症治疗的方法的需要。伴随着靶向癌治疗的发展,存在可以提供肿瘤靶标分子特征的方法学的特别目的,(即预测临床益处的那些)。关于癌症中基因表达模式原则的证据已经利用肿瘤类型分子分类建立了,所述肿瘤类型基于目前的形态学和免疫组织化学测试是不明显的。因此,本发明的目的是提供预测癌症患者中对EGFR抑制剂治疗的反应的表达生物标记物。在第一个目标中,本发明提供预测癌症患者对EGFR抑制剂治疗的反应的体外方法,其包括以下步骤确定患者肿瘤样品中RAPGEF5基因的表达水平和对该RAPGEF5基因表达水平和代表不反应患者群的肿瘤中RAPGEF5基因表达水平的值进行比较,其中患者的肿瘤样品中至少一种基因的更高表达水平指示将对该治疗有反应的患者。縮写RAPGEF5意指R即鸟嘌呤核苷酸交换因子(GEF)5。人RAPGEF5基因及其转录变体1,6和11的核苷酸序列在Seq.Id.Nos.1_4中给出。RAPGEF5基因及其变体的基因文库登记号和相应的序列识别号(Seq.Id.No.)列在表4中。术语"代表不反应患者群的肿瘤中RAPGEF5基因表达水平的值"指对使用EGFR抑制剂的治疗不反应的患者群的肿瘤中标记物基因平均表达水平的估值。在优选的实施方案中,标记物基因RAPGEF5典型地在反应的患者的肿瘤样品中表现出与代表不反应患者群的肿瘤中RAPGEF5基因表达水平的值相比,1.5-2.7或更多倍的更高表达。在优选的实施方案中,RAPGEF5基因的表达水平通过微阵列技术或其他评估RNA表达水平的技术如定量RT-PCR或通过任何着眼于各自蛋白表达水平的方法,例如免疫组织化学法(IHC)来确定。基因芯片的构建和用途是本领域中众所周知的。参见,美国专利号5,202,231;5,445,934;5,525,464;5,695,940;5,744,305;5,795,716和15,800,992。还参见,Johnston,M.Curr.Biol.(当前生物学)8:R171_174(1998);IyerVR等,Science(科学)283:83-87(1999)。当然,基因表达水平可以通过本领域中技术人员已知的其他方法,诸如例如RNA印迹、RT-PCR、实时定量PCR、引物延伸、RNA酶保护、RNA表达模式来确定。本发明的基因可以与其他预测性生物标记物组合为生物标记物组。生物标记物组可以由预测性生物标记物的任何组合构成,从而预测EGFR抑制剂治疗在癌症患者中的作用。本文中所述的多种生物标记物和生物标记物组可以用于,例如,预测患有癌症的患者将如何对使用EGFR抑制剂的治疗干预进行反应。术语"基因"用于本文中时,包括基因的变体。术语"变体"涉及与GenBank登记号提供的核酸序列基本相似的核酸序列。术语"基本相似"被本领域中技术人员充分理解。具体地,基因变体可以是这样的等位基因,所述等位基因与人群中最普遍的等位基因的核酸序列相比表现出核苷酸交换。优选地,这样的基本相似的核酸序列与最普遍的等位基因具有至少80%,优选至少85%,更优选至少90%,最优选至少95%的序列相似性。术语"变体"还意指涉及剪接变体。EGFR抑制剂可以选自由吉非替尼(gefitinib),厄洛替尼,PKI_166,EKB-569,GW2016,CI-1033和抗erbB抗体,诸如曲妥珠单抗和西妥昔单抗组成的组。在另一个实施方案中,EGFR抑制剂是厄洛替尼。在再一个实施方案中,癌症是NSCLC。用于检测本发明所述基因的基因表达的技术包括,但不仅限于,RNA印迹、RT-PCR、实时定量PCR、引物延伸、RNA酶保护、RNA表达模式和相关技术。这些技术是本领域中技术人员公知的。参见例如,SambrookJ等,MolecularCloning:ALaboratoryManual(分子克隆实验室手册),第三版(ColdSpringHarborPress(冷泉港出版社),ColdSpringHarbor(冷泉港),2000)。用于检测本发明所述各种基因的蛋白表达的技术包括,但不限于,免疫组织化学法(IHC)。根据本发明,可以评估来自患者组织样品,例如肿瘤或癌活组织检查的细胞,以确定一种或多种生物标记物的表达模式。癌症治疗的成功或失败可以基于来自测试组织(测试细胞),例如肿瘤或癌活组织检查的细胞的生物标记物的表达模式来确定,如与一种或多种生物标记物的对照组的表达模式相对相似或不同。在本发明的上下文中,发现表3中列出的基因受到上调,即与在不对EGFR抑制剂治疗反应的患者的肿瘤相比,在对EGFR抑制剂治疗反应的患者的肿瘤中表现出更高的表达水平。因此,如果测试细胞表现出对应于对癌症治疗有反应的患者的生物标记物表达模式,则该个体的癌症或肿瘤应该有利地对使用EGFR抑制剂的治疗有反应,这是高度可能的或被预测的。相反,如果测试细胞表现出对应于不对癌症治疗有反应的患者的生物标记物表达模式,则该个体的癌症或肿瘤不应该对使用EGFR抑制剂的治疗有反应,这是高度可能的或被预测的。本发明的标记物基因可以与其他生物标记物组合以形成生物标记物组。生物标记物组可以由预测性生物标记物的任何组合构成,从而预测EGFR抑制剂治疗在癌症患者中的作用。本文中所述的生物标记物和生物标记物组可以用于,例如,预测患有癌症的患者将如何对使用EGFR抑制剂的治疗干预反应。在另一个目标中,本发明提供治疗通过本发明的体外方法鉴定的癌症患者的治疗法。所述治疗法包括将EGFR抑制剂施用于患者,所述患者已经基于表3中列出的RAPGEF5基因的预测性表达模式被选择进行处理。优选的EGFR抑制剂是厄洛替尼且优选的待治疗癌症是NSCLC。附图简述图1显示研究设计;图2显示样品处理方案;图3a显示RAPGEF5表达水平对比06加(^@模式的临床结果;图3b显示RAPGEF5表达水平对比qRT-PCR的临床结果;禾口图3c显示关于RAPGEF5的Genechip⑧禾PqRT-PCR测量之间的相关性。实验部分关于研究和研究设计的基本原理近期,描述了NSCLC患者子集的肿瘤组织中EGFR基因内的突变和这些突变与针对厄洛替尼和吉非替尼的灵敏性的联系(PaoW,等2004;Lynch等2004;Paez等2004)。对于由两项研究组合的患者,在14名对吉非替尼有反应的患者中的13名中观察到突变的EGFR和在11名吉非替尼_治疗的不反应患者中没有观察到突变的EGFR。这些突变的报告的普遍性在未选择的NSCLC患者中是8X(25名中2名)。发现这些突变在腺癌中(21%),在来自雌性的肿瘤中(20%),和在来自日本患者的肿瘤中(26%)更频繁。这些突变导致增加的EGFR体外活性和增加的针对吉非替尼的灵敏性。没有预期评估突变与延长的稳定疾病或存活期限的关系。基于来自BR.21研究的探究性分析,观察到的存活益处似乎未必仅归因于EGFR突变,因为即使在将具有目标反应的患者排除在分析之外时,显著的存活益处保持(数据存档)。其他的分子机制必定也对该效果作出功效。基于这样的假设,即存在预测对Tarceva治疗反应/益处的基因表达水平变化,使用微阵列分析检测这些变化。这需要明确定义的在第一线疗法失败后使用TarcevaTM单一疗法治疗的研究群体。基于来自81.21研究的经验,将获益群体定义为具有目标反应,或>12周的疾病稳定性。按照预定义的统计学设计,分析临床和微阵列数据组。该技术的应用需要新鲜冷冻的组织(FFT)。因此,在开始治疗前,必须进行强制性活组织检查。将收集的材料冷冻在液氮(N2)中。同时收集第二肿瘤样品并保存在石蜡(福尔马林固定的石蜡包埋的,FFPE)中。分析该样品,以获得EGFR信号传导途径中的改变。通过支气管镜检进行肿瘤活组织检查的能力是该研究的先决条件。支气管镜检是验证肺癌诊断的标准程序。尽管通常安全,但是保留并发症,例如出血的风险。该研究是对于患有难治NSCLC的患者的个性化疗法的第一步。该个性化疗法应该容许治疗医师针对该指示从现存药物中选择最合适的药剂。—旦可利用个性化疗法,在本研究中,对每名未来患者的益处将胜过患者不得不接受的风险反应率/获益患者数量将增加,归因于无效治疗的有害副作用的风险将降低。关于剂量选择的基本原理Tarceva以150mg剂量每日口服给药一次,直到疾病发展,无法耐受的毒性或死亡。该剂量的选择基于药物动力学参数,以及在重度预处理的晚期癌症患者的I,II和III期试验中观察到的该剂量的安全性和耐受能力模式。在接受150mg/日剂量的癌症患者血浆中观察到的药物水平一致地高于临床功效作为目标的平均血浆浓度500ng/ml。BR.21显示使用该剂量的存活益处。研究的目标第一个目标是鉴定预测TarcevaTM治疗益处(CR,PR或SD>12周)的差异表达基因。鉴定预测对TarcevaTM治疗"反应"(CR,PR)的差异表达基因是一个重要的额外目标。第二个目标是评估EGFR信号传导途径关于来自治疗的益处的变化。研究设计研究设计和给药方案综述这是一个开放-标记、预测性标记物鉴定II期研究。该研究在约12个国家中的约26个地点进行。264名经历过至少一次以前化学疗法方案失败的晚期NSCLC患者在126个月的期间内登记。连续口服TarcevaTM以150mg/日的剂量给药。基于对药物疗法的耐受能力允许剂量的减少。评估临床和实验室参数,以评价疾病控制和毒性。治疗持续直到疾病发展,不能接受的毒性或死亡。研究设计描述在图l中。获得肿瘤组织和血液样品进行分子分析,从而评价Tarceva的作用和鉴定受益于疗法的患者子群。预测性标记物评估肿瘤的活组织检查在开始治疗前2周内进行。收集2种不同的样品第一样品通常立即冷冻在液^中第二样品在福尔马林中固定并包埋在石蜡中快速冷冻的组织在该研究中具有最高的优先级。图2显示样品处理方案。微阵列分析快速冷冻的样品用于肿瘤细胞的激光捕获显微解剖(LCM),从而提取肿瘤RNA和来自肿瘤周围组织的RNA。将RNA在Affymetrix微阵列芯片(HG-U133A)上分析,以构建患者肿瘤基因表达模式。使用Affymetrix芯片的质量控制选择具有足够质量以进行统计学比较的那些样品。关于福尔马林固定的石蜡包埋的组织的单生物标记物分析将第二肿瘤活组织检查,FFPE样品,用于进行DNA突变,IHC和ISH分析,如下所述。类似的分析对在最初诊断时收集的组织进行。编码EGFR和参与EGFR信号传导途径的其他分子的基因的DNA突变状态通过DNA测序分析。EGFR和相关基因的基因扩增通过FISH来研究。蛋白表达分析包括EGFR或EGFR信号传导途径中的其他蛋白的免疫组织化学[IHC]分析。反应评估使用RECIST(—维肿瘤测量)标准来评价反应。可以在以下链接中发现这些标准http://www,eortc.be/recist/。注意为了对CR或PR状态赋值,肿瘤测量的改变必须通过在治疗期间内任意时刻时彼此相隔至少4周的重复评估来验证。在SD的情形中,后继测量必须在研究以6周的最小间隔进入后,达到了SD标准至少一次。在维持的SD的情形中,后继测量必须在研究以至少12周的维持期间进入后,达到了SD标准至少一次。存活评估每3个月的定时状态检查通过患者就诊(visittotheclinic)或通过电话进行。记录所有的死亡。在研究结束时,需要对每名患者进行存活的明确确认。对厄洛替尼治疗的反应总共264名来自12个国家和26个中心的患者在该研究中登记。26X患有IIIB期且24%患有IV期NSCLC。13.6%(n=36)的患者获得目标反应,而31.4%(n=83)具有临床益处(定义为具有目标反应或稳定的疾病12周或更长)。中值总存活是7.6(CI7-9)7个月且中值无进展存活是11.3(CI8-12)周。关于临床数据的全部详细信息显示在表l中。新鲜冷冻的支气管镜检活组织切片由所述受试者中收集,但是不是全部样品在显微解剖(LCM)前都具有足够的肿瘤含量,或LCM后不具有足够的RNA产量以进行微阵列分析,因此肿瘤材料仅可用于125名患者;这些中的122名具有可评估的RNA。另一组20份样品没有通过我们的微阵列数据质量控制评估。在适合于统计学分析的102个微阵列数据组中,临床特征显示在表1中。当总研究中的36名患者获得目标反应时,其中仅6名具有微阵列数据;与获得临床益处的那些相类似,当与全数据组中的83名相比时,具有微阵列数据的受试者数目仅为21名。6名被判断为部分反应者(PR),31名具有SD且49名具有PD;在具有PR的6名患者中,5名具有腺癌且1名具有鳞状细胞癌。数据组中没有患者获得CR。方法RNA样品制备和RNA样品的质量控制所有的活组织检查样品处理通过病理学参考实验室来操作;新鲜冷冻的组织样品由研究者地点运到RocheBasel(巴塞尔罗氏)中的临床样品操作机构(ClinicalSampleOperationsfacility),并由那里运到病理学实验室以进行进一步的处理。使用激光捕获显微解剖来从周围组织中选择肿瘤细胞。LCM后,由富集的肿瘤材料中纯化RNA。病理学实验室然后进行许多步骤,以评价RNA的浓度和质量。RNA酶是RNA降解酶且到处存在,并且因此所述所有使用RNA的程序必须严格受控,以最小化RNA降解。大部分mRNA种类自身具有相当短的半衰期并且因此被认为非常不稳定。因此,在任何测定前进行RNA完整性检查和量化非常重要。RNA浓度和质量模式可以使用来自Agilent(AgilentTechnologies,Inc.(Agilent技术公司),PaloAlto,CA)的仪器,称为2100Bioanalyzer⑧评估。该仪器软件产生RNA完整性数字(RIN),一种量化评价(Schroeder,A.,等,TheRIN:anRNAintegritynumberforassigningintegrityvaluestoRNAmeasurements(RIN:用于对RNA领lj量赋予完整性数值的RNA完整性数字).BMCMolBiol(BMC分子生物学),2006.7:第3页),并计算总RNA样品的核糖体比率。RIN由RNA样品的全部电泳痕迹确定,并且因此包括降解产物的存在或缺乏。RNA质量通过2100Bioanalyzer⑧分析。只选择具有至少一个高于加入的聚I噪音的rRNA峰和充足RNA的样品来进一步在Affymetrix平台上进行分析。将纯化的RNA运送到RocheCentreforMedicalGenomics(罗氏医学基因组中心)(RCMG;巴塞尔,瑞士),以通过微阵列进行分析。从病理学实验室收到122份RNA样品以进一步处理。耙标记组织RNA样品耙标记根据来自Affymetrix(Affymetrix,SantaClara,加利福尼亚)的两循环靶标记扩增流程进行,按照制造商的说明。该方法基于标准Eberwine线性扩增程序,但是使用2个循环的该程序,以产生足够的标记的cRNA,从而与微阵列杂交。该标记反应中使用的总RNA输入,对于可获得多于10ngRNA的那些样品是10ng;如果可获得小于该量或如果不存在可用的数量数据(由于非常低的RNA浓度),则将总样品的一半用于该反应。来自标记反应的产量在20-180iigcRNA的范围内。在杂交水平上引入标准化步骤,其中关于每份样品使用15iigcRNA。人参考RNA(Stratagene,Carlsbad,CA,美国)用作每批样品工作流程的对照样品。将10ng的该RNA作为输入用在测试样品的旁边,以检验标记和杂交试剂如预期地工作。微阵列杂交AffymetrixHG-U133A微阵列含有超过22,000个探针组,其耙向约18,400个转录物和变体,其代表约14,500个充分表征的基因。对于所有样品的杂交根据Affymetrix说明书(AffymetrixInc.(Affymetrix公司),ExpressionAnalysisTechnicalManual(表达分析技术手册),2004)进行。简言之,对于每份样品,将15yg生物素标记的cRNA在存在二价阳离子和加热的条件下断裂,并与AffymetrixHG-U133A全基因组寡核苷酸阵列杂交过夜。第二天,按照制造商的说明,用链霉抗生物素-藻红蛋白(MolecularProbes(分子探针);Eugene,OR)染色阵列。然后用GeneChipScanner(基因芯片扫描仪)3000(Affymetrix)扫描阵列,并通过GeneChipOperatingSoftware(基因芯片操作软件)(GCOS)版本1.4(Affymetrix)自动计算信号强度。统计学分析Affymetrix数据分析由四个主要步骤组成。步骤1是质量控制。目的是从分析阵列数据中识别和排除不合标准的质量模式。步骤2是预处理和标准化。目的是形成标准化的和成比例的"分析数据组",其可用于芯片间比较。其包括背景噪音评估和扣除,探针总计和定比例。步骤3是探究和描述。目的是识别潜在偏差和可变性来源。其由应用多变量和单变量描述性分析技术来识别影响相关变量(covariates)组成。步骤4是建模和测试。目的是基于"反应者"(具有"部分反应"或"完全反应"作为最佳反应的患者)和"不反应者"("进行性疾病"作为最佳反应的患者)之间平均表达水平差异的统计学评估来鉴定一系列候选标记物。其由使合适的统计学模型拟合每个探针组和获得统计学显著性测量组成。全部分析均利用R软件包进行。步骤1:质量控制数据质量的评估基于检查若干参数。这些包括标准AffymetrixGeneChipTM质量参数,具体地比例因子、PresentCall百分比和平均背景。该步骤还包括视觉化检查虚拟芯片图像(virtualchipimage)以检测局部化杂交问题,和比较每个芯片和虚拟中值芯片(virtualmedianchip)以检测由中值行为的任何不寻常偏离。还进行芯片间相关性分析,以检测异常值样品。另外,考虑获自使用AgilentBioanalyzer2100的RNA样品分析的RNA质量的辅助测量。基于这些参数,从分析中排除来自20个阵列的数据。因此该分析中包括来自代表102名患者的总共102个阵列的数据。这102名患者组的临床说明报告在表1中。表1:该分析中包括的患者的临床特征说明9变量值n=102n(%)最佳反应N/A16(15.7%)PD49(48.0%)SD31(30.4%)PR6(5.9%)临床益处否81(79.4%)是21(20.6%)性别女性25(24.5%)男性77(74.5%)种族白种人65(63.7%)东方人37(36.3%)组织学腺癌35(34.3%)鳞状53(52.0%)其他14(13.7%)曾经-吸烟否20(19.6%)是82(80.4%)步骤2:数据预处理和标准化使用rma运算法贝U(Irizarry,R.A.,等,SummariesofAffymetrixGeneChipprobeleveldata(Affymetrix基因芯片探针水平数据总结).Nucl.AcidsRes.(核酸研究),2003.31(4):第el5页)进行预处理和标准化。使用mas5运算法则(AFFYMETRIX,(7e"eC7w]p⑧Expression:DataAnalysisFundamentals('GeweCTl^.表达数据分析基础).2004,AFFYMETRIX)检测关于各个探针组的调用(call)。在所有样品中称为"缺乏的"或"最低限度的"探针组由进一步分析去除;由基于该标准的分析去除5930个探针组。分析数据组因此由具有在102名患者中测量的16353个(在22283个范围内)探针组矩阵组成。步骤3:数据描述和探究10进行描述性探究分析,以确定潜在的偏差和主要可变性来源。筛选了一组对基因表达模式具有潜在影响的相关变量。其包括技术和临床变量。技术相关变量包括RNA处理日期(以后称为批次),RIN(作为RNA质量/完整性的测量),操作者和样品收集中心。临床相关变量包括组织学类型,吸烟状态,肿瘤等级,表现评分(0ken,M.M.,等,ToxicityandresponsecriteriaoftheEasternCooperativeOncologyGroup(东方合作月中瘤学小组的毒性和反应标准).AmJClinOncol(美国临床肿瘤学杂志),1982.5(6):第649-55页),人口统计数据,反应者状态和临床受益状态。分析工具包括单变量ANOVA和主要成分分析。对于这些相关变量中的每个,将单变量AN0VA独立应用于每个探针组。确定批次变量的显著作用。在实践上,批次变量捕获样品处理和Affymetrix芯片组日期之间的差异。在检查批次变量几乎与目的变量无关后,批次影响利用Johnson,W.E.,C丄i,禾口A.Rabinovic,AdjustingbatcheffectsinmicroarrayexpressiondatausingempiricalBayesmethods(利用经验贝叶斯法调节微阵列表达数据中的批次影响)Biostat(生物统计学),加0L8(1):第118_127页中所述的方法校正。批次影响校正后,标准化数据组在随后的分析中起分析数据组的作用。组织学和RIN是通过描述性分析突出的2种另外的重要变量。步骤4:数据建模和测试将线性模型对每个探针组进行独立拟合。该模型中包括的变量报告在表2中。通过最大似然技术评估模型参数。使用对应于"反应"变量(XI)的参数评估"反应"和"不反应"患者组之间的表达水平的差异。表2:线性模型中包括的变量的描述。将由这些变量定义的线性模型,包括正态分布的误差术语,对每个探针组进行拟合。<table>tableseeoriginaldocumentpage11</column></row><table>在该模型中,将反应变量定义如下反应=是具有部分反应作为其最佳反应患者的患者(n=6)*反应=否具有进行性疾病(PD)作为其最佳反应或无肿瘤评估的患者(n=65)排除具有稳定疾病状态的患者(n=31)。基本原理是通过集中在对疗法具有更显著反应的患者,不反应者组将变得更均一。对于每个探针组i,统计学测试的目的是为了否定这样的假说,即对治疗有反应的患者和对治疗不反应的患者中平均表达水平相等,其中考虑了表2中列出的其他调节相关变量。在形式上,等同性的虚假设针对两面性选择对象来测试。在该虚假设下,关于该测试的Wald-统计学分布遵从具有64自由度的(p'-平方分布。相应的p值报告在表3中。线性模型的选择由两个原因促成。第一,线性建模是通用的、充分表征和有力的方法,其容许在评价目的变量影响时调节混同的变量。第二,假定样品尺寸71,和数据组的标准化和定比例,正态分布假设是合理的和正当的。多重测试的问题通过使用用于确定差异表达基因列表的假发现率(FalseDiscoveryRate(FDR))标准来处理(Benjamini等,JournaloftheRoyalStatisticalSocietySeriesB-Methodological(皇室统计学协会杂志系列B_方法学),1995.57(1):第289-300页)。宣称具有低于0.3阈值的FDR的探针组为显著的。将0.3截取值选为对严格控制假阳性风险和错过真正区别性标记物风险的条件下多重测试严格校正之间的合理折衷。确定的标记物基因报告在表3中。表3:基于比较"反应者"和"进展者(Progressors)"的标记物。反应者定义为具有与"部分反应"(PR)相等的最佳反应的患者。"进展者"定义为具有与"进行性疾病"(PD)或无可获得的评估相等的最佳反应的患者。无肿瘤评估的患者包括在"进展者"组中,因为在大多数情形中,由于早期退出而错过评估,这归因于疾病进展或死亡。栏1是探针组的Affymetrix识别物。栏2是相应基因序列的GenBank登记号。栏3是相应的正式基因名称。栏4是"反应者"和"进展者"之间表达水平的相应调节的平均倍数变化,如使用线性模型评估地。栏5是在偏离线性模型时,"反应者"和"进展者"之间表达水平差别测试的P值。栏6是调节的表达水平平均倍数变化的95%可靠区间。<table>tableseeoriginaldocumentpage12</column></row><table>对于每个探针组,方差的同质性假定利用基于模型剩余(modelresiduals)的Fligner-Killeen检验来评价。该分析由以下三步组成测试所有分类变量以获得它们水平之间的剩余方差的等同性注意具有最小p值的变量V如果最小p值小于0.001,则重拟合该模型,以容许不同水平的变量V具有不同的方差。讲一歩统计学分析对于选择的候选标记物RAPGEF5,由独立的统计人员,在生效环境中进行以下另外的分析关于来自初步Affymetrix分析的PFS(无进展存活)的单变量Cox回归,关于来自初步Affymetrix分析的反应的单变量逻辑回归,禾口关于来自初步Affymetrix分析的存活的单变量Cox回归。将这些分析的结果显示在下文中。它们与初步分析的结果相一致并确认所选标记物的选择。结果关于来自初步Affymetrix分析的PFS(无进展存活)的单变量Cox回归基因患者数目风险比风险比的p-值95%CIPSPH1020.440.28;0.690.0003结果关于来自初步Affymetrix分析的反应的单变量Cox回归基因患者数目比值比比值比的p-值95%CIPSPH10295.775.84;>10000.0014结果关于来自初步Affymetrix分析的存活的单变量Cox回归基因患者数目风险比风险比的p-值95%CIPSPH1020.470.28;0.780.0040qRT-PCR利用用于qRT-PCR的Superscript111第一链合成高效混合物(SuperMix)(Invitrogen,CA,美国),按照制造商的说明书但在不包含RNA酶H消化的条件下,合成cDNA。定量PCR利用TaqMan^基因表达法测定,在ABIPRISM790冊T序列检测系统上,按照制造商的建议(A卯liedBiosystems(应用生物系统),CA,美国)进行。所有测定一式三份地进行。基因表达测定法使用Hs00920287_ml[RAPGEF5])并选择使引物和探针跨过外显子边界或在AffymetrixGenechip目的探针序列内。包括2个持家基因作为内源对照13-2-微球蛋白(B2M;测定Hs99999907_ml)和次黄嘌呤磷酸核糖转移酶(HPRT;测定Hs99999909_ml)。所有运行包括校正样品(MVPTM,来自人成年肺的总RNA;Stratagene,CA,美国)和标准曲线。使用通用人参照总RNA(Stratagene,CA,美国)作为EGFR和PSffl标准曲线的模板。RAPGEF5mRNA以无法接受的低水平存在于通用人参照总RNA中,并且因此使用来自人成年肺的MVPTM总RNA来构建关于该基因的标准曲线。将全部样品一式三份地测量。利用-ACt法进行相对量化。结果如以前报告地,对本研究中包括的102名患者确定AffymetrixGenechip^基因表达模式。在这些患者中,对75名获得qRT-PCR结果(表4)。具有qRT-PCR结果的患者的人口统计和临床特征类似于整个群体(n=264)和具有可获得的Genechip^基因表达模式的患者的那些。表4:基线特征具有qRT-PCR分析的患者(n=75)<table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table>在75名具有qRT-PCR结果的患者中,4(5%)具有部分反应(PR),23(31%)具有SD,39(52%)具有PD,且9(12X)不可评估。这些结果非常类似于在整个研究群体(n=264)中观察到的那些。AffymetrixGenechip吸数据、。RT-PCR数据和临床结果之间的相关性图3显示个体患者中RAPGEF5的相对mRNA水平,如通过AffymetrixGenechip模式和qRT-PCR评估地。图3a显示表达水平对比06116(:1^@模式的临床结果,且图3b显示表达水平对比qRT-PCR的临床结果。图3c显示关于RAPGEF5的Genechip②和qRT-PCR测量之间的相关性。在关于RAPGEF5的Genechip⑧和qRT-PCR测量之间存在相关性。临床结果与由qRT-PCR评估的厄洛替尼和RAPGEF5mRNA水平之间的联系比使用Genechip⑧模式观察到的略弱(图3b)。鉴定与对厄洛替尼的反应有关的基因将反应者定义为其最佳反应是部分反应的患者,而"进展者"定义为具有进行性疾病或对其不进行评估的患者(在大部分情形中是由于疾病进展或死亡引起的早期退出的结果)。因此,在该模型中,6名"反应者"与65名"进展者"进行比较。在除去来自HG-U133A微阵列上的总共22283个的任何样品中不存在的那些探针组后,使线性模型对该分析中使用的16353个剩余的探针组中的每一个独立拟合。计算关于每个探针组的反应和不反应之间表达差异的P值。将0.3的假发现率(FDR)应用于校正多重测试。由该分析鉴定的标记物显示在表3中。讨论靶向表皮生长因子受体(EGFR)作为癌症治疗方法基于其在若干上皮癌中普遍存在的异常表达来提议(Davies&Chamberlin1996,Mendelsohn,2002)。作为激活酪氨酸激酶结构域中的突变和/或其扩增的结果,EGFR涉及许多肿瘤包括40-80%的NSCLC肿瘤的发病机理和进展(Baselga&Albanell,2002;Normanno等,2006)。当激活时,受体经历二聚化作用,由此导致在细胞增殖、转移、凋亡抑制和新血管发生(neoangiogenesis)中具有作用的下游靶标的磷酸化(Mendelsohn&Baselga,2003)。已经开发了两种主要的EGFR抑制剂类型,即靶向受体胞外结构域的单克隆抗体,和靶向受体催化结构域的小分子酪氨酸激酶抑制剂。后者包括与ATP竞争胞内结合位点的厄洛替尼。近年来发现若干因子在对厄洛替尼的灵敏性中起作用,包括女性性别、非吸烟者状态、亚洲血统和腺癌组织学;假定提高的反应率在这样的临床患者子集中明显,正在进行大量努力以说明关于患者成层现象的预测性分子标记物。EGFR中的突变,EGFR基因座的扩增和EGFR在蛋白水平的过表达,都与不同程度的反应相关,尽管这些不是反应的唯一分子决定因素。通过使用高密度寡核苷酸微阵列技术分析组织样品,和对数据应用统计学建模,我们已经能够鉴定其表达水平预测针对厄洛替尼的反应的基因(PR对比PD的比较)(表3)。该基因是RAPGEF5,其位于7p15.3,其也在反应者中过表达(2.0倍上调;p=0.000021)。仅在我们的分析中与PD相比时,发现RAPGEF5在PR中约2倍上调(p=0.000021)。RAPGEF5是R即l的鸟嘌呤核苷酸交换因子(GEF),R即l是起信号转导功能的GTP酶的RAS亚家族的成员。GEFs通过失活GDP-和活性GTP-结合状态之间的循环,提供细胞表面受体和GTP酶活化之间的关键连接。R即l与Ras紧密相关,且参与多种细胞过程的调节包括控制血小板活化、T细胞无反应性、B-细胞活化、神经元分化并参与控制细胞粘附和调节整联蛋白活化。这些过程中的一些也可能与NSCLC的进展相关。RAPGEF5可以通过其控制R即l在血管发生中具有间接作用,R即l近期被显示为是血管内皮细胞趋化性的关键调节剂。促进新血管发生是致瘤性生长的突出特性;贝伐单抗,即特异性靶向血管发生中关键作用物之一,即血管内皮生长因子(VEGF)的试剂近期被显示在非鳞状NSCLC中与化学疗法结合来延长存活。RAPGEF5在癌发生中的精确作用保持待定,但是其可以在MAPK途径中提供另外的连接,已知EGFR通过所述MAPK途径信号传导。表5:RAPGEF5变体及其相应序列识别号列表<table>tableseeoriginaldocumentpage16</column></row><table><table>tableseeoriginaldocumentpage17</column></row><table>权利要求预测癌症患者对使用EGFR抑制剂的治疗的反应的体外方法,其包括确定患者肿瘤样品中RAPGEF5基因的表达水平和对所述RAPGEF5基因表达水平和代表不反应患者群的肿瘤中RAPGEF5基因表达水平的值进行比较,其中所述患者的肿瘤样品中RAPGEF5基因的更高表达水平指示将对所述治疗有反应的患者。2.权利要求l的方法,其中所述表达水平通过微阵列技术或测量RNA或蛋白表达的任何技术确定。3.权利要求1或2的方法,其中所述EGFR抑制剂是厄洛替尼。4.权利要求1-3的方法,其中所述癌症是NSCLC。5.权利要求1-4的方法,其中与代表不反应患者群的肿瘤中RAPGEF5基因表达水平的值相比,所述RAPGEF5基因在反应患者的肿瘤样品中表现出1.5-2.7或更多倍的更高表达。6.RAPGEF5基因用于预测癌症患者对EGFR抑制剂治疗的反应的用途。7.权利要求6的用途,其中所述癌症是NSCLC。8.权利要求6或7的用途,其中所述EGFR抑制剂是厄洛替尼。9.治疗通过权利要求1-5的方法鉴定的癌症患者的方法,其包括将EGFR抑制剂施用于所述患者。10.权利要求9的方法,其中所述EGFR抑制剂是厄洛替尼。11.权利要求9或10的方法,其中所述癌症是NSCLC。全文摘要本发明提供一种生物标记物(RAPGEF5),其预测癌症患者中针对使用EGFR抑制剂的治疗的反应。文档编号C12Q1/68GK101778951SQ200880102428公开日2010年7月14日申请日期2008年8月7日优先权日2007年8月14日发明者保罗·德尔马,巴巴拉·克卢格哈默,帕特里夏·麦克洛克林,韦雷娜·卢策申请人:霍夫曼-拉罗奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1