Egfr抑制剂治疗的预测性标记物的制作方法

文档序号:570638阅读:154来源:国知局

专利名称::Egfr抑制剂治疗的预测性标记物的制作方法EGFR抑制剂治疗的预测性标记物本发明提供一种生物标记物,其预测癌症患者中EGFR抑制剂治疗的临床益处。许多人恶性肿瘤与表皮生长因子受体(EGFR)的异常或过表达有关。EGF,转化生长因子gt(TGF-ot),和许多其他配体结合EGFR,从而剌激该受体胞内酪氨酸激酶结构域的自身磷酸化。随后激活多种胞内途径,且这些下游事件导致肿瘤细胞体外增殖。已经假定通过EGFR剌激肿瘤细胞可能对体内肿瘤生长和肿瘤存活非常重要。关于Tarceva,即EGFR酪氨酸激酶的抑制剂的早期临床数据显示该化合物是安全的且通常在提供靶有效浓度的剂量时良好耐受(如通过临床前数据确定地)。患有晚期疾病的患者中的临床I和II期试验证明TarcevaTM在一定范围的上皮肿瘤中具有有前景的临床活性。事实上,已经显示出Tarceva能够在先前受治疗的患有头颈癌和NSCLC(非小细胞肺癌)的患者中诱导与确定的第二线化学疗法相似级别的持久部分好转,但是具有比化学疗法更好的安全特性和改进的方便性(片剂代替静脉内[i.v.]施用)的额外益处。近期完成的随机双盲安慰剂对照试验(BR.21)显示单试剂TarcevaTM显著延长和改善NSCLC患者的存活,对于所述NSCLC患者,标准的晚期疾病疗法未能成功。Tarceva(厄洛替尼(erlotinib))是小化学分子;其是EGFR酪氨酸激酶(EGFR-TKI)的口服活性有效选择性抑制剂。肺癌是北美和欧洲中癌症相关死亡的主要原因。在美国,由肺癌继发的死亡数量超过由第二(结肠癌)、第三(乳腺癌)、和第四(前列腺癌)主要癌症死亡原因组合的总死亡。全部肺癌的约75%_80%是^(^(:,其约40%的患者表现出局部晚期和/或不可切除的疾病。该组典型地包括患有大量IIIA和IIIB期疾病的那些,不包括恶性胸膜渗漏。肺癌在欧洲联盟中的粗略发生率是52.5,死亡率是48.7病例/100000/年。分别地,在男性中,所述比率是79.3和78.3,在女性中,是21.6和20.5。NSCLC占所有肺癌病例的80%。男性中约90%的肺癌死亡率和女性中的80%可归因于吸烟。在美国,根据美国癌症协会,在2004年,存在约173,800件新肺癌病例(男性中93,100和女性中80,700)并占全部新癌症的约13%。大多数患者在诊断两年内由于他们的疾病后果而死亡。对于许多NSCLC患者,成功的治疗仍然难以捉摸。晚期肿瘤经常不能通过手术处理并且还可能对可耐受剂量的放射疗法和化学疗法具有抗性。在随机试验中,当前最具活性的组合化学疗法获得约30%_40%的反应率,和35%-40%的1年存活率。这确实是超过单独使用支持性医护所观察到的10%的1年存活率的进步。直到最近,复发患者复发后的治疗选择仅限于最佳支持性医护或减轻。近期比较多西他赛(泰索帝(Taxotere))和最佳支持性医护的试验显示患有NSCLC的患者在基于顺铂的第一线方案失败后,可以受益于第二线化学疗法。所有年龄和具有0,l,或2EC0G性能状态的患者证明了使用多西他赛的提高的存活,先前用基于铂的治疗难治的患者也如此。不受益于疗法的患者包括体重减轻10%、高乳酸脱氢酶水平、多器官累及、或肝累及的那些。另外,多西他赛单一疗法的益处不扩展超过第二线设置。接受多西他赛作为第三线治疗或以上的患者没显示出存活的延长。单试剂多西他赛成为NSCLC的标准第二线疗法。近期,第二线NSCLC疗法中的另一个随机III期试验比较了培美曲塞(Alimta)和多西他赛。使用培美曲塞的治疗导致临床等价功效但与多西他赛相比具有显著更小的副作用。长期以来公认存在开发个性化癌症治疗的方法的需要。伴随着靶向癌治疗的发展,存在可以提供肿瘤靶标分子特征的方法学的特别目的,(即预测临床益处的那些)。关于癌症中基因表达模式原则的证据已经利用肿瘤类型分子分类建立了,所述肿瘤类型基于目前的形态学和免疫组织化学测试是不明显的。两种单独的疾病个体用来自使用基因表达模式的扩散大B细胞淋巴瘤的单一目前分类的不同预后来区分。因此,本发明的目的是提供预测癌症患者中EGFR抑制剂治疗的临床益处的表达生物标记物。在第一个目标中,本发明提供预测对EGFR抑制剂治疗反应的癌症患者的临床益处的体外方法,其包括以下步骤确定患者肿瘤样品中SFRS7基因的表达水平和对该SFRS7基因表达水平和代表未由该治疗获得临床益处的患者群的肿瘤中SFRS7基因表达水平的值进行比较,其中患者的肿瘤样品中SFRS7基因的更高表达水平指示将由该治疗获得临床益处的患者。縮写SFRS7意指剪接因子,精氨酸/丝氨酸_富含性7。Seq.Id.No.1表示人SFRS7的核苷酸序列。术语"代表未由该治疗获得临床益处的患者群的肿瘤中SFRS7基因表达水平的值"指未由该治疗获得临床益处的患者群的肿瘤中标记物基因平均表达水平的估值。临床益处定义为具有目标反应或疾病稳定^12周。在另一个优选的实施方案中,SFRS7基因在所述患者的肿瘤样品中表现出与代表未由该治疗获得临床益处的患者群的肿瘤中SFRS7基因表达水平的值相比,1.2-1.7或更多倍的更高表达水平。在优选的实施方案中,标记物基因的表达水平通过微阵列技术或其他评估RNA表达水平的技术如定量RT-PCR或通过任何着眼于各自蛋白表达水平的方法,例如免疫组织化学法(IHC)来确定。基因芯片的构建和用途是本领域中众所周知的。参见,美国专利号5,202,231;5,445,934;5,525,464;5,695,940;5,744,305;5,795,716和15,800,992。还参见,Johnston,M.Curr.Biol.(当前生物学)8:R171_174(1998);IyerVR等,Science(科学)283:83-87(1999)。当然,基因表达水平可以通过本领域中技术人员已知的其他方法,诸如例如RNA印迹、RT-PCR、实时定量PCR、引物延伸、RNA酶保护、RNA表达模式来确定。本发明的标记物基因可以与其他生物标记物组合为生物标记物组。生物标记物组可以由预测性生物标记物的任何组合构成,从而预测EGFR抑制剂治疗在癌症患者中的作用。本文中所述的生物标记物和生物标记物组可以用于,例如,预测患有癌症的患者将如何对使用EGFR抑制剂的治疗干预进行反应。术语"基因"用于本文中时,包括基因的变体。术语"变体"涉及与GenBank登记号提供的核酸序列基本相似的核酸序列。术语"基本相似"被本领域中技术人员充分理解。具体地,基因变体可以是这样的等位基因,所述等位基因与人群中最普遍的等位基因的核酸序列相比表现出核苷酸交换。优选地,这样的基本相似的核酸序列与最普遍的等位基因具有至少80%,优选至少85%,更优选至少90%,最优选至少95%的序列相似性。术语"变体"还意指涉及剪接变体。EGFR抑制剂可以选自由吉非替尼(gefitinib),厄洛替尼,PKI_166,EKB-569,GW2016,CI-1033和抗erbB抗体,诸如曲妥珠单抗和西妥昔单抗组成的组。在另一个实施方案中,EGFR抑制剂是厄洛替尼。在再一个实施方案中,癌症是NSCLC。用于检测和量化本发明所述基因的基因表达的技术包括,但不仅限于,RNA印迹、RT-PCR、实时定量PCR、引物延伸、RNA酶保护、RNA表达模式和相关技术。这些技术是本领域中技术人员公知的。参见例如,SambrookJ等,MolecularCloning:ALaboratoryManual(分子克隆实验室手册),第三版(ColdSpringHarborPress(冷泉港出版社),ColdSpringHarbor(冷泉港),2000)。用于检测本发明所述各种基因的蛋白表达的技术包括,但不限于,免疫组织化学法(IHC)。根据本发明,可以测定来自患者组织样品,例如肿瘤或癌活组织检查的细胞,以确定一种或多种生物标记物的表达模式。癌症治疗的成功或失败可以基于来自测试组织(测试细胞),例如肿瘤或癌活组织检查的细胞的生物标记物的表达模式来确定,如与一种或多种生物标记物的对照组的表达模式相对相似或不同。在本发明的上下文中,发现表3的基因受到上调,即与未由使用EGFR抑制剂的治疗获得临床益处的患者的肿瘤相比,在由EGFR抑制剂治疗获得临床益处的患者的肿瘤中表现出更高的表达水平。因此,如果测试细胞表现出对应于对癌症治疗有反应的患者的生物标记物表达模式,则该个体的癌症或肿瘤应该有利地对使用EGFR抑制剂的治疗有反应,这是高度可能的或被预测的。相反,如果测试细胞表现出对应于不对癌症治疗有反应的患者的生物标记物表达模式,则该个体的癌症或肿瘤不应该对使用EGFR抑制剂的治疗有反应,这是高度可能的或被预测的。本发明的生物标记物,即表3中列出的基因,是对于患有癌症的患者,特别是患有难治NSCLC的患者的个性化疗法的第一步。该个性化疗法应该容许治疗医师从用于癌症疗法,特别是NSCLC的现存药物中选择最合适的药剂。个性化疗法对于每名将来的患者的益处是反应率/获益患者数量将增加且归因于无效治疗的有害副作用的风险将降低。在另一个目标中,本发明提供治疗通过本发明的体外方法鉴定的癌症患者的治疗法。所述治疗法包括将EGFR抑制剂施用于患者,所述患者已经基于表3中列出的预测性表达模式被选择进行处理。优选的EGFR抑制剂是厄洛替尼且优选的待治疗癌症是NSCLC。附图简述图1显示研究设计;禾口图2显示样品处理方案。实验部分关于研究和研究设计的基本原理近期,描述了NSCLC患者子集的肿瘤组织中EGFR基因内的突变和这些突变与针对厄洛替尼和吉非替尼的灵敏性的联系(PaoW,等2004;Lynch等2004;Paez等2004)。对于由两项研究组合的患者,在14名对吉非替尼有反应的患者中的13名中观察到突变的EGFR和在11名吉非替尼_治疗的不反应患者中没有观察到突变的EGFR。这些突变的报告的普遍性在未选择的NSCLC患者中是8X(25名中2名)。发现这些突变在腺癌中(21%),在来自雌性的肿瘤中(20%),和在来自日本患者的肿瘤中(26%)更频繁。这些突变导致增加的EGFR体外活性和增加的针对吉非替尼的灵敏性。没有预期评估突变与延长的稳定疾5病或存活期限的关系。基于来自BR.21研究的探究性分析,观察到的存活益处似乎未必仅归因于EGFR突变,因为即使在将具有目标反应的患者排除在分析之外时,显著的存活益处仍保持(数据存档)。其他的分子机制必定也对该效果有作用。基于这样的假设,即存在预测对Tarceva治疗反应/益处的基因表达水平变化,使用微阵列分析检测这些变化。这需要明确定义的在第一线疗法失败后使用TarcevaTM单一疗法治疗的研究群体。基于来自BR.21研究的经验,将获益群体定义为具有目标反应,或12周的疾病稳定性。按照预定义的统计学设计,分析临床和微阵列数据组。该技术的应用需要新鲜冷冻的组织(FFT)。因此,在开始治疗前,必须进行强制性活组织检查。将收集的材料冷冻在液氮(N2)中。同时收集第二肿瘤样品并保存在石蜡(福尔马林固定的石蜡包埋的,FFPE)中。分析该样品,以获得EGFR信号传导途径中的改变。通过支气管镜检进行肿瘤活组织检查的能力是该研究的先决条件。支气管镜检是验证肺癌诊断的标准程序。尽管通常安全,但是保留并发症,例如出血的风险。该研究是对于患有难治NSCLC的患者的个性化疗法的第一步。该个性化疗法应该容许治疗医师针对该指示从现存药物中选择最合适的药剂。—旦可利用个性化疗法,在本研究中,对每名未来患者的益处将胜过患者不得不接受的风险反应率/获益患者数量将增加,归因于无效治疗的有害副作用的风险将降低。关于剂量选择的基本原理Tarceva以150mg剂量每日口服给药一次,直到疾病发展,无法耐受的毒性或死亡。该剂量的选择基于药物动力学参数,以及在重度预处理的晚期癌症患者的I,II和III期试验中观察到的该剂量的安全性和耐受能力模式。在接受150mg/日剂量的癌症患者血浆中观察到的药物水平一致地高于临床功效作为目标的平均血浆浓度500ng/ml。BR.21显示使用该剂量的存活益处。研究的目标第一个目标是鉴定预测TarcevaTM治疗益处(CR,PR或SD>12周)的差异表达基因。鉴定预测对TarcevaTM治疗"反应"(CR,PR)的差异表达基因是一个重要的额外目标。第二个目标是评估EGFR信号传导途径关于来自治疗的益处的变化。研究设计研究设计和给药方案综述这是一个开放_标记、预测性标记物鉴定II期研究。该研究在约12个国家中的约26个地点进行。264名经历过至少一次以前化学疗法方案失败的晚期NSCLC患者在12个月的期间内参与。连续口服TarcevaTM以150mg/日的剂量给药。基于对药物疗法的耐受能力允许剂量的减少。评估临床和实验室参数,以评价疾病控制和毒性。治疗持续直到疾病发展,不能接受的毒性或死亡。研究设计描述在图l中。获得肿瘤组织和血液样品进行分子分析,从而评价Tarceva的作用和鉴定受益于疗法的患者子群。预测性标记物评估肿瘤的活组织检查在开始治疗前2周内进行。收集2种不同的样品第一样品通常立即冷冻在液^中第二样品在福尔马林中固定并包埋在石蜡中快速冷冻的组织在该研究中具有最高的优先级。图2显示样品处理方案。微阵列分析快速冷冻的样品用于肿瘤细胞的激光捕获显微解剖(LCM),从而提取肿瘤RNA和来自肿瘤周围组织的RNA。将RNA在Affymetrix微阵列芯片(HG-U133A)上分析,以构建患者肿瘤基因表达模式。使用Affymetrix芯片的质量控制选择具有足够质量以进行统计学比较的那些样品。关于福尔马林固定的石蜡包埋的组织的单生物标记物分析将第二肿瘤活组织检查,FFPE样品,用于进行DNA突变,IHC和ISH分析,如下所述。类似的分析对在最初诊断时收集的组织进行。编码EGFR和参与EGFR信号传导途径的其他分子的基因的DNA突变状态通过DNA测序分析。EGFR和相关基因的基因扩增通过FISH来研究。蛋白表达分析包括EGFR和EGFR信号传导途径中的其他蛋白的免疫组织化学[IHC]分析。反应评估使用RECIST(—维肿瘤测量)标准来评价反应。可以在以下链接中发现这些标准http://www,eortc.be/recist/。注意为了对CR或PR状态赋值,肿瘤测量的改变必须通过在治疗期间内任意时刻时彼此相隔至少4周的重复评估来验证。在SD的情形中,后继测量必须在研究以6周的最小间隔进入后,达到了SD标准至少一次。在维持SD的情形中,后继测量必须在研究以至少12周的维持期间进入后,达到了SD标准至少一次。存活评估每3个月的定时状态检查通过患者就诊(visittotheclinic)或通过电话进行。记录所有的死亡。在研究结束时,需要对每名患者进行存活的明确确认。方法RNA样品制备和RNA样品的质量控制所有的活组织检查样品处理通过病理学参考实验室来操作;新鲜冷冻的组织样品由研究者地点运到RocheBasel(巴塞尔罗氏)中的临床样品操作机构(ClinicalSampleOperationsfacility),并由那里运到病理学实验室以进行进一步的处理。使用激光捕获显微解剖来从周围组织中选择肿瘤细胞。LCM后,由富集的肿瘤材料中纯化RNA。病理学实验室然后进行许多步骤,以估计RNA的浓度和质量。RNA酶是RNA降解酶且到处存在,并且因此所述所有使用RNA的程序必须严格受7控,以最小化RNA降解。大部分mRNA种类自身具有相当短的半衰期并且因此被认为非常不稳定。因此,在任何测定前进行RNA完整性检查和量化非常重要。RNA浓度和质量模式可以使用来自Agilent(AgilentTechnologies,Inc.(Agilent技术公司),PaloAlto,CA)的仪器,称为2100Bioanalyzer⑧评估。该仪器软件产生RNA完整性数字(RIN),一种量化评价(Schroeder,A.,等,TheRIN:anRNAintegritynumberforassigningintegrityvaluestoRNAmeasurements(RIN:用于对RNA领lj量赋予完整性数值的RNA完整性数字).BMCMolBiol(BMC分子生物学),2006.7:第3页),并计算总RNA样品的核糖体比率。RIN由RNA样品的全部电泳痕迹确定,并且因此包括降解产物的存在或缺乏。RNA质量通过2100Bioanalyzer分析。只选择具有至少一个高于加入的聚I噪音的rRNA峰和充足RNA的样品来进一步在Affymetrix平台上进行分析。将纯化的RNA运送到RocheCentreforMedicalGenomics(罗氏医学基因组中心)(RCMG;巴塞尔,瑞士),以通过微阵列进行分析。从病理学实验室收到122份RNA样品以进一步处理。耙标记组织RNA样品耙标记根据来自Affymetrix(Affymetrix,SantaClara,加利福尼亚)的两循环靶标记扩增流程进行,按照制造商的说明。该方法基于标准Eberwine线性扩增程序,但是使用2个循环的该程序,以产生足够的标记的cRNA,从而与微阵列杂交。该标记反应中使用的总RNA输入,对于可获得多于10ngRNA的那些样品是10ng;如果可获得小于该量或如果不存在可用的数量数据(由于非常低的RNA浓度),则将总样品的一半用于该反应。来自标记反应的产量在20-180iigcRNA的范围内。在杂交水平上引入标准化步骤,其中关于每份样品使用15iigcRNA。将人参考RNA(Stratagene,卡尔斯巴德,CA,美国)用作每批样品工作流程的对照样品。将10ng的该RNA作为输入用在测试样品的旁边,以检验标记和杂交试剂如预期地工作。微阵列杂交AffymetrixHG-U133A微阵列含有超过22,000个探针组,其耙向约18,400个转录物和变体,其代表约14,500个充分表征的基因。对于所有样品的杂交根据Affymetrix说明书(AffymetrixInc.(Affymetrix公司),ExpressionAnalysisTechnicalManual(表达分析技术手册),2004)进行。简言之,对于每份样品,将15yg生物素标记的cRNA在存在二价阳离子和加热的条件下断裂,并与AffymetrixHG-U133A全基因组寡核苷酸阵列杂交过夜。第二天,按照制造商的说明,用链霉抗生物素-藻红蛋白(MolecularProbes(分子探针);Eugene,OR)染色阵列。然后用GeneChipScanner(基因芯片扫描仪)3000(Affymetrix)扫描阵列,并通过GeneChipOperatingSoftware(基因芯片操作软件)(GCOS)版本1.4(Affymetrix)自动计算信号强度。统计学分析Affymetrix数据分析由五个主要步骤组成。步骤1是质量控制。目的是从分析阵列数据中识别和排除不合标准的质量模式。步骤2是预处理和标准化。目的是形成标准化的和成比例的"分析数据组",其可用于芯片间比较。其包括背景噪音评估和扣除,探针总计和定比例。步骤3是探究和描述。目的是识别潜在偏差和可变性来源。其由应用多变量和单变量描述性分析技术来识别影响相关变量(covariates)组成。步骤4是建模和测试。目的是基于"临床益处"和"无临床益处"患者之间平均表达水平差异的统计学评估来鉴定一系列候选标记物。其由使合适的统计学模型拟合每个探针组和获得统计学显著性测量组成。步骤5是有效性分析。目的是产生不严重依赖预处理方法和统计学假设的一系列合格的候选标记物。其由使用不同的方法学方法重复分析和交叉系列候选物组成。全部分析均利用R软件包进行。步骤1:质量控制数据质量的评估基于检查若干参数。这些包括标准AffymetrixGeneChipTM质量参数,具体地比例因子、PresentCall百分比和平均背景。该步骤还包括视觉化检查虚拟芯片图像(virtualchipimage)以检测局部化杂交问题,和比较每个芯片和虚拟中值芯片(virtualmedianchip)以检测由中值行为的任何不寻常偏离。还进行芯片间相关性分析,以检测异常值样品。另外,考虑获自使用AgilentBioanalyzer2100的RNA样品分析的RNA质量的辅助测量。基于这些参数,从分析中排除来自20个阵列的数据。因此该分析中包括来自代表102名患者的总共102个阵列的数据。这102份样品组的临床说明报告在表1中。表1:该分析中包括的患者的临床特征说明9<table>tableseeoriginaldocumentpage10</column></row><table>步骤2:数据预处理和标准化使用rma运算法贝U(Irizarry,R.A.,等,SummariesofAffymetrixGeneChipprobeleveldata(Affymetrix基因芯片探针水平数据总结).Nucl.AcidsRes.(核酸研究),2003.31(4):第el5页)进行预处理和标准化。使用mas5运算法则(AFFYMETRIX,GeneChipExpression:DataAnalysisFundamentals(GeneChip⑧表达数据分析基础).2004,AFFYMETRIX)检测关于各个探针组的调用(call)。在所有样品中称为"缺乏的"或"最低限度的"探针组由进一步分析去除;由基于该标准的分析去除5930个探针组。分析数据组因此由具有在102名患者中测量的16353个(在22283个范围内)探针组矩阵组成。步骤3:数据描述和探究进行描述性探究分析,以确定潜在的偏差和主要可变性来源。筛选了一组对基因表达模式具有潜在影响的相关变量。其包括技术和临床变量。技术相关变量包括RNA处理日期(以后称为批次),RIN(作为RNA质量/完整性的测量),操作者和样品收集中心。临床相关变量包括组织学类型,吸烟状态,肿瘤等级,表现评分(0ken,M.M.,等,ToxicityandresponsecriteriaoftheEasternCooperativeOncologyGroup(东方合作月中瘤学小组的毒性和反应标准)AmJClinOncol(美国临床肿瘤学杂志),1982.5(6):第649-55页),人口统计数据,反应者状态和临床受益状态。分析工具包括单变量ANOVA和主要成分分析。对于这些相关变量中的每个,将单变量ANOVA独立应用于每个探针组。确定批次变量的显著作用。在实践上,批次变量捕获样品处理和Affymetrix芯片组日期之间的差异。在检查批次变量几乎与目的变量无关后,批次影响利用Johnson,W.E.,C丄i,禾口A.Rabinovic,AdjustingbatcheffectsinmicroarrayexpressiondatausingempiricalBayesmethods(利用经验贝叶斯法调节微阵列表达数据中的批次影响)Biostat(生物统计学),加0L8(1):第118_127页中所述的方法校正。批次影响校正后,标准化数据组在随后的分析中起分析数据组的作用。组织学和RIN是通过描述性分析突出的2种另外的重要变量。步骤4:数据建模和测试将线性模型对每个探针组进行独立拟合。该模型中包括的变量报告在表2中。通过最大似然技术评估模型参数。使用对应于"临床益处"变量(XI)的参数评估具有临床益处的患者组和无临床益处的患者组之间的表达水平的差异。表2:线性模型中包括的变量的描述。<table>tableseeoriginaldocumentpage11</column></row><table>对于每个探针组i,统计学测试的目的是为了否定这样的假说,即具有临床益处的患者和无临床益处的患者中平均表达水平相等,其中考虑了表2中列出的其他调节相关变量。在形式上,等同性的虚假设针对两面性选择对象来测试。将相应的P值报告在表3中。线性模型的选择由两个原因促成。第一,线性建模是通用的、充分表征和有力的方法,其容许在评价目的变量作用时调节混同的变量。第二,假定样品尺寸102,和数据组的标准化和定比例,正态分布假设是合理的和正当的。对于每个探针组,方差的同质性假定利用基于模型剩余(modelresiduals)的Fligner-Killeen检验来评价。该分析由以下三步组成1.测试每个分类变量以获得剩余方差的同质性2.注意具有最小p值的变量V3.如果最小p值小于0.001,则重拟合该模型,以容许不同水平的变量V具有不同的方差。步骤5:有效性有效性分析的目的是降低分析的结果可能是人为的和解释统计学分析的预处理步骤或假设的结果的风险。考虑了以下三方面a)在质量控制步骤中包含或排除少量额外的芯片;b)预处理和标准化运算法则;C)统计学假设和测试方法。将这一系列候选标记物定义为使用不同分析设置始终显示出显著性的基因子集。不同的应用分析选择如下a)基于更严格的质量控制标准识别另外8个芯片的子集。通过排除这8个芯片定义"减少的数据组"。b)将MAS5确定为用于预处理和标准化的rma的备选方案。MAS5使用不同的方法进行背景评价、探针总计和标准化。c)使用2种另外的统计学检验。a.关于临床和无临床益处之间的区别的wilcoxon检验和b.对逻辑回归模型进行测试的似然比值测定(LRT),在所述模型中临床益处被认为是反应变量和基因表达被认为是共同变量。这两种另外的检验依赖于解释统计学假设的不同组。对于每个探针组,LRT遵从具有一个自由度的卡方。总之,考虑了两组样品("全"数据组和"减少的"数据组)和2种预处理运算法则(mas5和rma);这导致四个不同的分析数据组。对于这四个数据组中的每一个,应用三种不同的统计学检验。因此,对于每个探针组,计算三个P值。在每个分析数据组中,应用组合标准确定差异调节的基因系列。该组合标准定义为最大P值小于0.05且最小p值小于O.001。利用用于确定标记物基因的标准1的有效性分析产生作为关于EGFR抑制剂治疗的预测性标记物的SFRS7。表3:在应用组合标准后基于有效性分析的临床益处基因标记物。栏1是探针组的Affymetrix识别物。栏2是相应基因序列的GenBank登记号。栏3是相应的正式基因名称。栏4是临床和无临床益处患者之间表达水平的相应调节的平均倍数变化,如由线性模型评估地。栏5是用于检验如源自线性模型的临床益处和无临床益处患者之间表达水平差异的P值。栏6是关于受调节的表达水平平均倍数变化的95%可靠区间。<table>tableseeoriginaldocumentpage13</column></row><table>讲一歩统计学分析对于选择的候选标记物SFRS7,由独立的统计人员,在生效环境中进行以下另外的分析关于来自初步Affymetrix分析的PFS(无进展存活)的单变量Cox回归,关于来自初步Affymetrix分析的临床益处的单变量逻辑回归,禾口关于来自初步Affymetrix分析的存活的单变量Cox回归。将这些分析的结果显示在下文中。它们与初步分析的结果相一致并确认所选标记物的选择。结果关于来自初步Affymetrix分析的PFS(无进展存活)的单变量Cox回归基因患者数目风险比风险比的p-值95%CISFRS71020.580.41;0.820.0022结果关于来自初步Affymetrix分析的临床益处的单变量Cox回归基因患者数目比值比比值比的p-值95%CISFRS71024.881.91;12.470.0009结果关于来自初步Affymetrix分析的存活的单变量Cox回归基因患者数目风险比风险比的p-值95%CISFRS71020.580.38;0.880.0111讨论通过利用高密度寡核苷酸微阵列技术分析组织样品,和对数据应用统计学模型,我们已经能够确定其表达水平可以预测由使用厄洛替尼的治疗获得临床益处的患者的基因。应用组合标准(定义如上)。其得到SFRS7作为关于EGFR抑制剂治疗的预测性标记物。SFRS7,即剪接因子,精氨酸/丝氨酸_富含性7,是35kDa蛋白。在后生动物中,多RNA结合蛋白,包括穿梭丝氨酸/精氨酸-富含性(SR)-剪接因子,通过与输出受体TAP/细胞核输出因子l(NXFl)相互作用起mRNA细胞核输出的连接物。然而,尚不清楚连接物和TAP之间的相互作用如何受到调节。SR蛋白SFRS7和ASF/SF2在亚磷酸化(hypophosphoryated)时对于TAP/NXF1表现出更高的亲和性。SFRS7被募集为采用超磷酸化(hyperphosphorylate)形式的前mRNA,但在体内和体外剪接过程中变为亚磷酸化。与前mRNA-蛋白复合物相比,TAP优先结合剪接的mRNA-蛋白复合物。因此,SR蛋白连接物的磷酸化状态可以解释TAP介导的剪接mRNA输出的选择性。在该研究中,发现SFRS7在由使用厄洛替尼的治疗获得临床益处的患者中相对上调。权利要求预测癌症患者对使用EGFR抑制剂的治疗的反应的体外方法,其包括确定患者肿瘤样品中SFRS7基因的表达水平和对所述SFRS7基因表达水平和代表未由所述治疗获得临床益处的患者群的肿瘤中SFRS7基因表达水平的值进行比较,其中所述患者的肿瘤样品中SFRS7基因的更高表达水平指示将由所述治疗获得临床益处的患者。2.权利要求l的方法,其中所述表达水平通过微阵列技术确定。3.权利要求1或2的方法,其中与代表未由所述治疗获得临床益处的患者群的肿瘤中SFRS7基因表达水平的值相比,所述SFRS7基因在患者的肿瘤样品中表现出1.2_1.7或更多倍的更高表达水平。4.权利要求1-3的方法,其中所述EGFR抑制剂是厄洛替尼。5.权利要求1-4的方法,其中所述癌症是NSCLC。6.SFRS7基因用于预测癌症患者对EGFR抑制剂治疗的反应的用途。7.权利要求6的用途,其中所述癌症是NSCLC。8.权利要求6或7的用途,其中所述EGFR抑制剂是厄洛替尼。9.治疗通过权利要求1-5的方法鉴定的癌症患者的方法,其包括将EGFR抑制剂施用于所述患者。10.权利要求9的方法,其中所述EGFR抑制剂是厄洛替尼。11.权利要求9或10的方法,其中所述癌症是NSCLC。全文摘要本发明提供一种生物标记物SFRS7,其预测癌症患者中EGFR抑制剂治疗的临床益处。文档编号C12Q1/68GK101778950SQ200880102411公开日2010年7月14日申请日期2008年8月7日优先权日2007年8月14日发明者保罗·德尔马,巴巴拉·克卢格哈默,帕特里夏·麦克洛克林,韦雷娜·卢策申请人:霍夫曼-拉罗奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1