预测杜克氏b结肠癌复发的分子检测的制作方法

文档序号:438435阅读:268来源:国知局

专利名称::预测杜克氏b结肠癌复发的分子检测的制作方法预测杜克氏B结肠癌复发的分子检测
背景技术
:本发明涉及基于生物样品基因表达概况(expressionprofiles)对结直肠癌的预后。结直肠癌是一种具有复杂起源的异质性疾病。接受结直肠癌治疗的患者,其复发的可能性与肿瘤穿透通过肠壁的程度以及是否累及淋巴结(nodalinvolvement)相关。这些特性是目前通过杜克氏分类所确定的疾病分期系统的基础。杜克氏A疾病限于结肠或直肠的粘膜下层。杜克氏B肿瘤侵入穿过固有肌层并能穿透结肠或直肠壁。杜克氏C疾病包括具有局部淋巴结转移的任何程度的肠壁侵入。外科切除术对于结直肠癌早期非常有效,在杜克氏A患者中提供了95%的治愈率以及在杜克氏B患者中提供了75%的治愈率。杜克氏C疾病中出现阳性淋巴结,则预测在5年内有60%的复发可能性。杜克氏C患者术后化疗疗程治疗降低复发率至40%-50%,现今成为杜克氏C患者的监护标准。由于相对低的复发率,在杜克氏B中术后化疗的益处愈发难以检测,因此留存争议。然而,杜克氏B分类并不完善,约20-30%的患者行为表现更^(象杜克氏C,并且在5年时间范围内复发。显然需要鉴定出比淋巴受累更好的预后因子,用于指导将哪些杜克氏B划入可能复发的,哪些划入将生存的。Rosenwald等.(2002);Compton等.(2000);Ratto等.(1998);Watanabe等.(2001);Noura等.(2002);Hailing等.(1999);Martinez-Lopez,等.(1998);Zhou等.(2002);Ogunbiyi等.(1998);Shibata等.(1996);Sun等.(1999);和McLeod等.(1999)。通过鉴定更可能需要且可能受益于辅助疗法的患者,利用这些信息制定更好的规划。Johnston(2005);Saltz等.(1997);Wolmark等.(1999);InternationalmulticenterpooledanalysisofB2coloncancertrials(IMPACTB2)investigators:EfficacyofadjuvantfluorouracilandfolinicacidinB2coloncancer(InternationalmulticenterpooledanalysisofB2coloncancertrials(IMPACTB2)investigators:EfficacyofadjuvantfluorouracilandfolinicacidinB2coloncancer)(1999);和Mamounas等.(1999)。由于发现及初步验证研究已完成,基因组学在诊断和治疗癌症中的临床应用就获得了动力。Allen等.(2005a);Allen等.(2005b);Van,tVeer等.(2002);VandeVijver等.(2002);Wang等(2005);Beer等.(2002);和Shipp等.(2002)。随着更多研究的公开,人们也逐渐增加了对于在一般临床实践上推行这些标记所面临的挑战。最近,Ransohoff(2005)和Simon等.(2003)描述了有关分子标志评价消除偏倚以及关4建方面的规则。已明确的关于分子特征(molecularsignature)能在更广的范围被接受的必要条件在于对真实独立的患者群体的检测性能的确认。另外的限制是基于DNA微阵列的检测需要新鲜冷冻的组织样品。结果,这些检测不容易在诸如冷冻的石蜡包埋(FPE)组织样品之类的标准的临床材料中应用。在已公开的美国专利申请20050048526、20050048494、20040191782、20030186303和20030186302以及Wang等.(2005)中公开了用于结肠癌的基因表达概况预后。本说明书提供了用于测定基因表达概况的材料和方法。发明概述本发明提供了用于评价患者结直肠癌复发可能性的材料和方法,所述患者被诊断为结直肠癌或已接受针对结直肠癌的治疗。该方法包括分析基因表达概况。在本发明的一个方面中,基因表达概况包括用于^r测至少7种特定基因表达的引物和探针。用于实施方法的产品也是本发明的一个方面。这样的产品包括记载在机器可读介质,如计算机可读介质中的基因表达概况或它们的表示(representation)。用于鉴定基因表达概况的产品还可包括用来捕获和/或指示基因表达的存在、不存在或程度基质或表面,如微阵列。在本发明的又一个方面中,试剂盒包括用于实施结直肠癌复发的基因表达分析预后的试剂。附图简述图1是用于7种基因组合分析的标准的卡普兰-迈耶曲线(Kaplan-MeierPlot),所述的曲线是如实施例所述,才艮据27位患者(14位生存,13位复发)的独立数据组构建的。通过芯片数据预测的,指示出两类患者。纵轴显示在每一类患者当中无病生存的概率。图2是用于15种基因组合分析的标准的卡普兰-迈耶曲线,所述的曲线如实施例所述,根据9位患者(6位生存,3位复发)的独立的数据组构建的。通过芯片数据所预测的指示了两类患者。纵轴显示在每一类患者当中无病生存的概率。图3是如实施例中所描述的,使用包括钙粘蛋白17(SEQIDNO:6)在内的22种基因概况,构建自患者数据的标准的卡普兰-迈耶曲线。检测了36份样品(20份生存,16份复发)。如通过23种基因组合(panel)的芯片数据的预测,指示出两类患者。纵轴显示在每一类患者当中无病生存的和无率。图4是针对123位独立的患者的预后特征的ROC和卡普兰-迈耶生存分析。A.基因标记的ROC曲线。B.123份冷冻肿瘤样品的卡普兰-迈耶曲线以及对数等级试验(logranktest)。基于基因标记评价每一位患者的复发风险并通过训练集(trainingset)确定阈值。高风险和低风险组差异显著(P二0.04).图5是针对110位独立的患者的预后特征的ROC和卡普兰-迈耶生存分析。A.基因特征的ROC曲线。B.110份FPE肿瘤样品的卡普兰-迈耶曲线以及对数等级试验。基于基因特征评价每一位患者的复发风险并通过训练集确定阈值。高风险组和低风险组差异显著(PO細l)。图6是电泳图。发明详述生物标志是所示标志基因(Markergene)的表达水平的任何一种指示物。该指示物可以是直接的或间接的,并可测定给定生理学参数的基因的过表达或表达不足,以及与内对照、正常组织或另一种癌相比较。生物标志包括但不限于核酸(过表达及表达不足的,以及直接的和间接的)。利用核酸作为生物标志可包括本领域已知的任何方法,包括^旦不限于测定DNA扩增、RNA、孩i小RNA、杂合子丟失(LOH)、单核苷酸多态性(SNPs,Brookes(1999))、微卫星DNA、DNA低或超甲基化。利用蛋白作为生物标志包括本领域已知的任何方法,包括但不限于测定数量、活性、修饰如糖基化、磷酸化、ADP-核糖基化、遍在蛋白化等,或免疫组织化学(IHC)。其他生物标志包括成像、细胞计凄t和细月包凋亡标志。本文中所涉及的基因是那些与特定肿瘤或组织类型相关的基因。标志基因可与多种癌症类型相关,但条件是该基因的表达与使用本文所述以及本领域已知用于预测杜克氏B结肠癌复发的方法待鉴定的一种肿瘤或组织类型充分相关。本发明提供了优选的标志基因和更优选的标志基因组合。在本文中详细描述了这些组合。当标志基因含有SEQIDNO所指定的序列时,其相应于该序列。当基因区段或片段含有足以与所述基因序列相区分的参照基因的一部分或其互补物时,所述的基因区段或片段相应于这样的基因的序列。在下述情况下一种基因的表达产物相应于某序列,即当所述基因的RNA、mRNA或cDNA与具有上述某序列(如探针)的组合物杂交,或当所述某序列为肽或蛋白时,该肽或蛋白为上述mRNA所编码。当基因表达产物的区段或片段含有参照基因表达产物的一部分或其互补物,使得足以将其鉴别为某基因或基因表达产物的序列时,其相应于上述某基因或基因表达产物的序列。在本说明书中所描述且要求保护的本发明的方法、组合物、产品和试剂盒包括一种或多种标志基因。"标志"或"标志基因"在整篇说明书中用于指基因和基因表达产物,其相应于任何其过表达或表达不足与肺瘤或组织类型相关的基因。优选的标志基因是那些与SEQIDNOs:7-28相关的基因。本发明的多核苷酸引物和探针如SEQIDNOs:29-79和94-97所示。本发明的扩增子如SEQIDNOs:5-6、80-93所示。扩增子序列seqIDnogaattcgcccttgagaaaacgacgcatccactactgcgattaccctggttgcacaaaagtttacaccaagtcttctcatttaaaagctcacctgaggactaagggcgaattc5aaacgacgcatccactactgcgattaccctggttgcacaaaagtttacaccaagtcttct6aaacgacgcatccactactgcgattaccctggttgcacaaaagtttat80accaagtcttctcatttaaaagctcacctgaggact81catttaaaagct;cacctgaggact82gaattcgcccttgggctctgtggcaagatctatatctggaaggggcgaaaoagcgaatgagaaggagcggcaacjggcgaattcgtttaaacctgcaggactciagt83gggctctgtggcaagatctatatctggaaggggcgaaaagcgaatgagaaggagcggca.84gggctctgtggcaagatctatatctggaaggggcgaaaagcgaatgagaaggagcggca85gaattcgcccttccctggcatccgagacagtgccttctccatggagtccattgatgattacgtgaacgttccgaagggcgaattcgtttaaacctgcaggactagt86ccctggcatccgagacagtgccttctccatggagtccattgatgattacgtgaacgttcc87ccctggcatccgagacagtgccttctccatggagtccattgatgattacgtgaacgttcc88gaattcgcccttccaatcaaaacctccaggtatcttcccagactaggtgtggagggcggccctgtgggtgggaggctggagcctccagagtgtcctgagaccatgagttccaagggcgaattc89ccaatcaaaacctccaggtatcttcccagactaggtgtggagggcggccctgtgggtggg90ccaatcaaaacctccaggtatcttcccagaccaggtgtggagggcggccctgtgggtggg91aggctggagcctccagagtgtcctgagaccatgagttccaagggc92aggctggagcctccagagtgtcctgagaccatgagttccaggggc93在一个实施方案中,标志基因为那些与SEQIDNOs:7-28的任意一种相关的基因。在另一个实施方案中,本发明的多核苷酸引物和探针为SEQIDNOs:29-79和94-97中至少之一。在另一个实施方案中,通过产生扩增子SEQIDNOs:5-6、80-93中的至少一种鉴定所述标志。本发明进一步提供了用于根据本文所提供的方法实施检测(assay)、并包含生物标志一企测试剂的试剂盒。芯片。本发明提供了获得额外的临床信息的方法,该方法包括获得针对癌的理想生物标志集;提供治疗指导并由此鉴定合适的治疗;以及提供预后。本发明进一步提供了发现生物标志的方法,其通过测定特定转移灶中标志基因的表达水平、测定标志基因的生物标志以确定其表达水平、根据本文所提供或本领域已知的任何一种方法分析标志基因的表达并确定标志基因是否有效地特异于预后。本发明进一步提供了包含如本文中所述基因组合的分离的核酸序列、其互补序列或其一部分的诊断/预后组合,在此该组合足以测定或表征相对于来自不同癌组织或正常组织的细胞具有转移性细胞的生物样品中的基因表达。本发明中所描述的任何一种方法都可进一步包括测定至少一种在样品中组成型表达的基因的表达。少有发现在组织样品中仅仅存在或不存在特定的核酸序列即具有诊断或预后价值。从另一方面来说,关于各种蛋白、肽或mRNA表达的信息越来越受到重视。具有能够表达蛋白、肽或mRNA的核酸序列(这样的序列称为"基因")存在于基因组中本身无法决定蛋白、肽或mRNA是否在给定的细胞中表达。能表达蛋白、肽或mRNA的给定基因是否在给定的细胞中表达,以及这样的表达发生的程度如何,从根本上来说,取决于多种复杂的因素。不考虑在理解和评价这些因素中所遇到的困难,测定基因表达可提供关于诸如肿瘤发生、转移、细胞凋亡和其他临床相关现象的重要事件发生的有用信息。基因有活性或无活性程度的相对指征可参考基因表达概况。本发明的基因表达概况用于提供患者诊断和治疗。样品制备需要收集患者样品。用于本发明方法中的患者样品是那些怀疑含有病变细胞,如取自组织细针吸取(FNA)结节的细胞的样品。获得自活组织检查的批量组织制备物或外科手术样品以及激光捕获显微切割也是适用的。激光捕获显微切割(LCM)技术是一种选择待研究细胞的方法,其可使细胞类型不均一性所导致的变异降到最低。因此,可容易地检测到在正常或良性细胞和癌性细胞之间标志基因表达的中等或小的改变。样品还可包含提取自外周血的循环上皮细胞。可根据多种方法获得这些样品,但最优选的方法是6136182中描述的磁分离技术。一旦获得包含目标细胞的样品,即可应用生物标志获得针对合适组合中的基因的基因表达概况。优选用于确定基因表达概况的方法包括确定编码蛋白或肽的基因产生的RNA的量。其通过逆转录PCR(RT-PCR)、竟争性RT-PCR、实时RT-PCR、差异显示RT-PCR、RNA印迹分析以及其他相关测试得以实现。虽然有可能使用单独的PCR反应实施这些技术,但最好扩增产生自mRNA的互补DNA(cDNA)或互补RNA(cRNA)并通过微阵列员所知并描述于例如5445934;5532128;5556752;5242974;5384261;5405783;5412087;5424186;5429807;5436327;5472672;5527681;5529756;5545531;5554501;5561071;5571639;5593839;5599695;5624711;5658734和5700637中。微阵列技术容许同时测定数千种基因的稳态mRNA水平,提供了用于鉴定不受控的细胞增殖,例如发生、停止或调制的结果的强有力工具。两种微阵列技术(cDNA和寡核苷酸阵列)目前得到普遍使用。尽管这些芯片的构建存在差异,但基本上所有的下游数据分析和输出都是相同的。这些分析的产物通常是从标记探针处得到的信号强度的测量值,所述探针用于检测与位于微阵列上已知位置处核酸序列杂交的、来自样品的cDNA序列。典型地,信号强度与cDNA的量成正比,并因此与样品细胞中表达的mRNA的量也成正比。诸多这样的技术是可获得且有用的。优选用于测定基因表达的方法可见于6271002;6218122;6218114和6004755中。通过比较这样的信号强度进行表达水平的分析。最好是通过将试样中基因的表达强度与对照样品中那些表达强度进行比较产生比例矩阵进行分析。例如,可将来自病变组织的基因表达强度与产生自相同类型的良性或正常组织的表达强度进行比较。这些表达强度的比率指示了试样和对照样品之间基因表达的倍数改变。选择可基于产生排序表的统计检验,所述排序表与在肿瘤预后相关因素之间每种基因差异表达的显著性证据有关。上述检验的实例包括ANOVA和Kruskal-Wallis。排序可用作模型中的权重,所述模型被设计来将高达截断值的这样的权重的总和解释为支持一类超过另一类的证据优势。如文献中所描述的在前证据也可用于调整所述权重。一个优选的实施方案是通过鉴定稳定的对照集并对所有样品将该对照集按比例缩放至零方差,以使每一测量值归一化。该对照集规定为检测中受系统误差影响,且未发生与该误差无关的改变的任何单个内源转录物或内源转录物集。通过对于对照集的任何描述'性统计,如平均值或中位值,或对于直接测量产生零方差的样品特异性因素调整所有标志。可选地,如果对照变化并非仅与系统误差有关,则当进行归一化时所得到的分类误差更小,因此对照集将仍按规定使用。非内源性掺加的对照也可能是有帮助的,但并不是优选的。基因表达概况可以多种方式展示。最常见的是将未处理的荧光强度或比值矩阵排列为图示的系统树状图(dendogram),其中列指示试样,行指示基因。如此排列数据使得具有类似表达概况的基因彼此相邻。将每种基因的表达比值作为一种颜色可视化。例如,小于l的比值(下调)出现在谱图的蓝色部分中,而大于1的比值(上调)则出现在谱图的红色部分中。可用来显示这样的数据的市售计算机软件程序包括"GeneSpring,,(SiliconGenetics,Inc.)和"Discovery"以及"Infer,,(Partek,Inc.)。由原发肺瘤或转移性肿瘤收集独一无二的RNA物种丰度的测量值。这些读数(readings)与包括但不限于患者的年龄、性别、原发肿瘤起源部位以及转移部位(如果可适用的话)的临床记录一起用于产生关联数据库(relationaldatabase)。该数据库用于选择可用作为标志变量来预测肿瘤复发风险的RNA转录物和临床因素。在测定蛋白水平以确定基因表达的情况下,任何本领域已知的方法都是合适的,前提是其要产生足够的特异性和灵敏度。例如,可通过与特异于该蛋白的抗体或抗体片段结合并测定抗体结合蛋白的量来测定蛋白水平。抗体可用放射性、荧光或其他可检测的试剂标记以利于检测。检测方法包括不限于酶联免疫吸附测定(ELISA)和免疫印迹技术。用于本发明方法中的调节基因描述于实施例中。相对于那些无杜克氏B结肠癌复发的患者,差异表达的基因在复发患者中上调或下调。上调和下调是相对性术语,指在相对于某些基线基因表达量的可检测的差异(超出了用于测量的系统噪声的影响)。在这种情况下,基于分类树确定基线。使用相同的测量方法,则相对于基线水平,病变细胞中的目标基因或是上调或是下调。在上下文中,病变指身体状态的改变,如细胞不受控制的增殖所发生的改变,其中断或干扰,或能够干扰躯体功能的适当表现。当某人的基因型或表型与疾病的存在相一致时,则诊断该人患病。然而,进行诊断或预后的行为可包括确定疾病/状况结果,如确定复发可能性、治疗以及治疗监护类型。在治疗监护中,通过经时地比较基因表达以确定该基因表达概况是否已改变,或正向着与正常组织更加一致的模式(pattern)改变,作出涉及所给治疗路线效果的临床判断。可降基因分组,使得组中基因集获得的信息可提供用于做出临床相关判断如诊断、预后或治疗选择的可靠基础。这些基因集构成本发明的组合。如同大多数诊断标志一样,通常期望使用最少数量的标志即足以做出正确医学判断。这避免了处理悬而未决的进一步分析所造成的延误以及时间和资源的徒劳使用。一种建立基因表达组合的方法是通过使用最优化算法如广泛应用于建立股票资产组合的均值方差算法。该方法详述于20030194734中。基本上,该方法需要建立一组输入值(财务应用中的股票,在此为强度测定的表达值),该组输入值会使对于使用其收到的收益(如所产生的信号)最优化,与此同时使该收益的变异性降至最小。许多商业化软件程序可以用于进行这样的运算。在说明书中的"Wagner相关均值-方差优化应用(WagnerAssociatesMean-VarianceOptimizationApplication)"称为"Wagner软件"是优选的。该软件使用了来自"Wagner相关均值-方差优化文库(WagnerAssociatesMean-VarianceOptimizationLibrary)"的函数以确定在Markowitz检测中优选的效率限界和最优组合。Markowitz(1952)。当该软件用于其预期的财务分析用途时,使用这种类型的软件需要转换微阵列数据使得其能在股票收益和风险度量被使用的方法中作为输入值处理。选择组合(protfolio)的方法还可包括应用启发式规则(heuristicrules)。优选地,这样的规则是在生物学以及用于产生临床结果的技术理解的基础上制定的。更优选地,它们应用于来自最优化法的输出值。例如,对于多种在患有癌症的受试者中差异表达的基因,组合选择的均值方差法可应用于微阵列数据。来自该方法的输出值应当是最优化的基因集,该基因集可包括在外周血以及病变组织中表达的某些基因。如果检测方法中所使用的样品获得自外周血以及在癌症情况下差异表达的某些基因也能在外周血中差异表达,则启发式规则可应用于选择自除在外周血中差异表达的那些之外的效率限界的组合中。当然,通过例如在数据预选期间运用该规则,该规则可在效率限界形成之前应用。其他启发式规则可以使用,无需与正讨论的生物学相关。例如,可以应用只有规定百分数的组合能代表特定基因或基因组的规则。市售软件如Wagner软件容易提供这些类型的启发式规则。例如当除准确性和精确度之外的因素(如预期的许可费用)对包括一种或多种基因的期望性具有影响时,其可能是有用的。本发明的基因表达概况还可与其他用于癌症诊断、预后或治疗监护的非基因诊断方法一起使用。例如,在某些情况下,将上述基于基因表达的方法的诊断能力与来自常用标志如血清蛋白标志(如癌抗原27.29("CA27.29,,))的数据相组合是有益的。这样的标志的存在范围包括例如CA27.29的分析物。在一种这样的方法中,/人经治疗的患者中周期性采血,然后对上述血清标志之一进行酶免疫测定。当标志浓度暗示返回肺瘤或治疗失败时,采用能经受基因表达分析的样品源。在存在可疑物质的情况下,采取细针吸取(FNA),然后如上所述分析取自该物质的细胞的基因表达概况。可选地,组织样品可取自邻近之前除去肿瘤的组织的区域。当其他检测产生含糊结果时,该方法可特别有用。根据本发明制造的试剂盒包括用于测定基因表达概况的格式化检测。其可包括进行该检测所需的全部或其中一些材料,例如试剂和_说明书以及对生物标志进行4企测的介质。本发明的产品包括具有治疗、诊断、预后及其他评价疾病用途的基因表达概况表示。这些概况表示(profilerepresentation)归納为能通过机器自动读出的介质,例如计算机可读介质(磁性的、光学的等)。产品还可包括用于评价在这样的介质中的基因表达概况的说明书。例如,产品可包含具有用于比较上述基因组合的基因表达概况的计算机指令的CDROM。产品还可具有用计数法记录于其中的基因表达概况,使得它们可以与来自患者样品的基因表达数据进行比较。可选地,概况可以不同的表达格式记录。图示记录是一种这样的格式。聚类算法如上述那些整合入来自Partek,Inc.的"DISCOVERY"和"INFER"软件的算法能最好地帮助这样的数据可视化。根据本发明制造的不同类型的产品是用于揭示基因表达概况的介质或格式化检测(formattedassays)。这些可包括例如,其中序列互补物或探针被固定在基质上的微阵列,表示目标基因的序列结合到该基质上产生可读的它们存在的决定因素。可选地,根据本发明的产品可被制成试剂盒用于进行指示用于检测癌症的目标基因表达水平的杂交、扩增和信号产生。提供以下实施例进行举例说明,但不限制所要求保护的发明。所有本文中引用的文献在此并入作为参考。本发明优选的概况是表2中所示的7种基因组合以及表3中所示的15种基因组合。由另一种独立验证的结肠直肠预后基因如4丐粘蛋白17以及表2和表3中基因组合构成的基因表达组合是最优选的(表4)。该最优选的组合将处于复发高风险的杜克氏B患者与无复发的那些患者最好地分离。一旦高风险患者被鉴定,就能用辅助疗法来治疗他们。其他独立验证的预后基因可用于代替钙粘蛋白17。在本发明中,用于分析患者基因表达模式以确定结肠癌预后的最优选的方法是通过使用Cox风险分析程序的方法。最优选地,使用S-Plus软件(市售自InsightfulCorporation)进行该分析。使用这样的方法,将基因表达概况与确信代表复发的概况(即对于概况中基因的组合,表达水平代表了复发)进行比较。具有确定阈值的Cox风险模型用于比较两种概况(已知的复发对患者)的相似性,并接着确定患者概况是否超出该阈值。如果这样的话,则患者被分类为会复发的患者中的一员并给予治疗如辅助疗法。如果患者概况没有超出阈值,则他们被分类为无复发患者。其他分析根据也可用于回答相同的问题,例如线性判别分析对数回归以及神经网络方法。可以获得多种其它众所周知的模式识别方法。下列参考文献提供了一些实例WeightedVoting:Golub等.(1999)。SupportVectorMachinesandK-nearestNeighbors:Su等.(2001);和Ramaswamy等.(2001)。CorrelationCoefficients:van'tVeer等.(2002)GeneexpressionprofilingpredictsclinicaloutcomeofbreastcancerNature415:530-536。本发明的基因表达概况还可与其他用于癌症诊断、预后或治疗监护的非基因诊断方法一起使用。例如,在某些情况下,将上述基于基因表达的方法的诊断能力与来自常用标志如血清蛋白标志(如癌胚抗原)的数据相组合是有益的。这样的标志的存在范围包括例如CEA的分析物。在一种这样的方法中,从经治疗的患者中周期性采血,然后对上述血清标志之一进行酶免疫测定。当标志浓度暗示返回肿瘤或治疗失败时,采用能经受基因表达分析的样品来源。在存在可疑物质的情况下,采取细针吸取(FNA),然后如上所述分析取自该物质的细胞的基因表达和X况。可选地,组织样品可取自邻近之前除去肿瘤的组织的区域。当其他检测产生含糊结果时,该方法可特别有用。本发明的产品包括具有治疗、诊断、预后及其他评价疾病用途的基因表达概况表示。这些概况表示归纳为能通过机器自动读出的介质,例如计算机可读介质(磁性的、光学的等)。产品还可包括用于评价在这样的介质中的基因表达概况的说明书。例如,产品可包含具有用于比较上述基因组合的基因表达概况的计算机指令的CDROM。产品还可具有用计数法记录于其中的基因表达概况,使得它们可以与来自患者样品的基因表达数据进行比较。可选地,概况可以不同的表达格式记录。图示记录是一种这样的格式。聚类算法如上述那些整合入来自Partek,Inc.的"DISCOVERY"和"INFER"软件的算法能最好地帮助这样的数据可视化。根据本发明制造的不同类型的产品是用于揭示基因表达概况的介质或格式化检测。这些可包括例如,其中序列互补物或探针被固定在基质上的微阵列,表示目标基因的序列结合到该基质上产生可读的它们存在的决定因素。可选地,根据本发明的产品可被制成试剂盒用于进行指示用于检测结直肠癌的目标基因表达水平的杂交、扩增和信号产生。根据本发明制造的试剂盒包括用于测定基因表达概况的格式化的检测。这些可包括进行该检测所需要的所有或一些材料例如试剂和说明书。在本发明中有用的引物和探针包括不限于一种或几种下列引物和探针痫蛋白(Laforin)正向引物,cattattcaaggccgagtacagatg)SEQIDNO.29痫蛋白反向引物,cacgtacacgatgtgtcccttct;SEQIDNO:30痫蛋白探针,caggcggtgtgcctgctgcat;SEQIDNO:31RCC1正向引物,tttgtggtgcctatttcaccttt;SEQIDNO:32RCC1反向引物,cggagttccaagctgatggta;SEQIDNO:33RCCl探针,ccacgtgtacggcttcggcctc.SEQIDNO:34YWHAH正向引物,ggcggagcgctacga;SEQIDNO:35YWHAH反向引物,ttcattcgagagaggttcattcag;SEQIDNO:36YWHAH探针,cctccgctatgaaggcggtg5SEQIDNO:37P-肌动蛋白正向引物,aagccaccccacttctctctaa;SEQIDNO:38P—肌动蛋白反向引物,aatgctatcacctcccctgtgt;SEQIDNO:39|3—肌动蛋白才果针,agaatggcccagtcctctcccaagtc.SEQ!DNO:40HMBS正向引物,cctgcccactgtgcttcct;SEQIDNO:41HMBS反向引物,ggttttcccgcttgcagat;SEQIDNO:42HMBS探针,ctggcttcaccatcg.SEQIDNO:43GUSB正向引物,tggttggagagctcatttgga;SEQIDNO:44GUSB反向引物,actctcgtcggtgactgttcag;SEQIDNO:45GUSB探针,ttttgccgatttcatg.SEQIDN<^:46RPL13A正向引物,cggaagaagaaacagctcatga;SEQIDNO:47RPL13A反向引物,cctctgtgtatttgtcaattttcttctc;SEQIDNO:48RPL13A探针,cggaaacaggccgagaa.SEQII>NO:49这些引物和探针可包括基于已知受试者基因序列5'和3'的约1-5个碱基。优选地,在PCR反应中引物和探针组一起用于测定受试者基因表达。本发明通过以下非限制性实施例进一步举例说明。所有在本文中引用的文献在此并入作为参考。实施例根据本发明分析的基因通常与编码用于蛋白或肽产生的全长核酸序列有关。本领域技术人员应当认识到从分析的观点上来看,鉴定全长序列不是必需的。也就是说,根椐对于相应基因探针可设计成能评价该基因表达的众所周知的原则,可以选择序列的一部分或ESTs。实施例l-样品处理和LCM.从进行结肠直肠肿瘤外科手术的患者中收集新鲜冷冻的组织样品。所使用的样品来自63位根据标准的临床诊断学和病理学分级为杜克氏B的患者。患者的临床结果是已知的。36位患者保持无病超过3年,而27位患者在3年内具有肿瘤复发。在收获的20-30分钟内,在液氮中迅速冷冻组织并其后贮存在-80C。下。为了激光捕获,对样品切片(6pm)并将一片切片置于载玻片上,将另一片安在膜(P.A丄.M.)上,该膜已固定在载玻(MicroSlidesColorfrost,VWRScientific,Media,PA)上。然后将固定在载玻片上的切片在冷丙酮中固定,并用Mayer,s苏木精(Sigma,St.Louis,MO)染色。病理学家分析样品用于诊断和分级。由所附的外科病理学和临床报告评估临床分期以验证杜克氏分类。然后将固定在膜上的切片在100%乙醇中固定5分钟,在曙红/100。/o乙醇(100ng曙红溶于100ml无水乙醇中)中复染1分钟,在100%乙醇中迅速浸泡一次以除去游离的染料,并风干10分钟。在于LCM中使用前,对膜(LPC-MEMBRANEPENFOIL1.35(imNo8100,P.A丄.M.GmbHMikrolaserTechnologie,Bernried,Germany)和载玻片预处理以除去RNA酶并增加组织样品在膜上的附着。简言之,在DEPH20中洗涤载玻片,在RNaseAWAY(MolecularBioproductsInc.,SanDiego,CA)中洗涤膜并在DEPH20中漂洗。在将膜固定在载玻片上后,将载玻片在+120。C下烘烤8小时,用TI-SAD(DiagnosticProductsCorporation,LosAngeles,CA,1:50溶于DEPH20中,通过棉絮过滤)处理,然后在+37。C下温育30分钟。在即将使用前,将lOpl等分试样的的RNA酶抑制剂溶液(RNA酶抑制剂2500U=33U/plN211A,PromegaGmbH,Mannheim,Germany,0.5(il溶于400(il含0.15MNaCl、10mMTrispH8.0、0.25mmol二硫苏糖醇的冷冻溶液中)涂抹于组织样品要被封固的膜上。将封固在膜上的组织切片用于LCM。利用结合ZeissAxiovert135显微镜(CarlZeissJenaGmbH,Jena,Germany)的PALM机器人-微束(Robot-Microbeam沐术(P.A丄.M.MikrolaserTechnologie,CarlZeiss,Inc.,Thornwood,NY)捕获了大约2000个上皮细胞/样品。包括正常粘膜周围的间质组织以及癌样品中偶尔插入的间质组分。将所捕获的细胞至于100。/。乙醇的试管中并在-80。C下保存。实施例2-RNA提取和扩增Zymo陽Spin柱(ZymoResearch,Orange,CA92867)用于从LCM捕捉的样品中提取总RNA。将约2ng的总RNA重悬于10(il水中,并进行2轮基于T7RNA聚合酶的扩增以产生约50吗扩增的RNA。实施例3-DNA孩吏阵列杂交和定量通过使用可获得的或可购自Affymetrix,Inc的人U133a芯片,将一个由大约23,000种人DNA克隆组成的DNA微阵列集用于检测样品。如上所概述的获得并制备总RNA,并施加到芯片上,然后根据制造商的说明通过AgilentBioAnalyzer进行分析。所有63份样品都通过质量控制标准并将数据用于标志选择。使用市售自Affymetrix,Inc.的MAS5.0版软件("MAS5.0")分析芯片强度数据。如下所述,无监督分析(unsupervisedanalysis)用于鉴定将会复发以及不会复发的患者相区分的两种基因。将所述获得的芯片强度数据输入作为PARTEK5.1版软件市售的无监督聚类软件中。该无监督聚类算法鉴定了具有高复发频率的一组20位患者(13位复发和7位生存)。从最初的23,000种基因中,该检测分析选择了276种在这些患者中显著差异表达的基因。从该组中,选择了能最好地区分复发患者和那些无复发的患者的两种基因人肠肽相关转运蛋白(Humanintestinalpeptide-associatedtransporter)(SEQIDNO:3)和人脂肪酸结合蛋白l(SEQIDNO:1)。在来自该患者组的复发患者中这两种基因是下调的(事实上它们被关闭或不表达)。然后在剩余的43位患者中进行监督分析以进一步区分复发患者和那些无复发的患者。接着将该患者组数据分成下列组27位患者被分入训练集,16位患者被分入测试集。这确保了相同的数据不被用于鉴定标志及随后验证它们的效用。对训练集执行不等方差t-检验。从具有有意义校正的p值的28种基因列表中,选择了MHCII-DR-B。在复发者中这些基因是下调。MHCII-DR-B(SEQIDNO:2)也具有最小的p-值。在额外一轮的监督分析中,使用上述Partek5.0版软件执行线性判别分析的变量选择步骤以将训练集中的复发者与生存者相分离。该搜索法是预选。所选择的具有最低后验误差(posteriorerror)的变量是免疫球蛋白样转录物5蛋白(SEQIDNO:4)。然后对于生存时间,将Cox比例风险模型(使用来自Insightful,Inc.的"SPlus"软件)用于基因选择以确认上述鉴定的基因选择。在总共27次循环的每次循环中,分别取出维持训练集27位患者中的一位,将剩余的26位患者用于单变量Cox模型回归中来评价基因表达与患者生存时间的相关强度。通过相应估计的标准化参数估计量和从Cox模型回归返回的P值计算这中相关强度。0.01的P值用作为阈值来从每次排除一种基因选择的循环中选择头几位的基因。然后比较从每次循环中所选择的头几位的基因,以便选择那些在总共27次排除一种基因选择的循环中显示至少26次的基因。总共选择了70种基因,MHCII-DR-B和免疫球蛋白样转录物5蛋白位列其中(同样地,显示下调)。种建,差^资舸器..两种基因,即MHCII-DR-B和免疫球蛋白样转录物5蛋白,用于产生使用线性判别分析的预测器。投票得分(votingscore)规定为复发的后验概率(posteriorprobability)。如果患者得分大于0.5,则将患者分类为复发者。如果患者得分小于0.5,则将患者分类为生存者。对训练集测试预测器。豫^/器^Jt互發证一一,应当对独立的数据集测定预测器的性能,原因在于大多数分类方法对在它们建立中所使用的实例工作良好。16位患者的测试集用于评价预测准确性。通过使用ROC曲线确定分类的截断值。使用所选择的截断值,就可确定该测试集中复发及生存患者正确预测的数目。,g沐资^W;63位杜克氏B结肠癌患者的基因表达概况分析导致在这些患者中鉴定了4种具有差异表达(下调或关闭)的基因。这些基因为SEQIDNO:1、SEQIDNO:2、SEQIDNO:3和SEQIDNO:4。36位患者保持无病超过3年,而27位患者在3年内具有肺瘤复发。使用SEQIDNO:2、SEQIDNO:3和SEQIDNO:4的3种基因标记组合,准确地鉴定了27位复发患者中的22位以及36位无病患者中的27位。该结果具有82%的灵敏度和75%的特异性。阳性预测值为71%以及阴性预测值为84%。实施例4:进一步取样随后研究来自74位编码杜克氏B结肠癌患者的冷冻肿瘤样品。在外科手术时收集原发肺瘤及相邻的非肺瘤结肠组织。验证每一样品的组织病理学以确认诊断并一致涉及肿瘤。所选"f奪用于分析的区域包含不具有混合性组织结构的大于50%的肿瘤细胞构成。统一的随访信息也是可获得的。实施例5:基因表达分析根据实施例1-3中所描述的方法,由实施例4的样品提取总RNA。使用标准的Affymetrix实验方案和扫描仪扫描阵列。为了随后分析,每一探针组均被认为是独立的基因。通过使用Affymetrix基因芯片分析软件MAS5.0计算每一基因的表达值。所有用于随后分析的数据都通过质量控制标准。统计方法首先让基因表达数据过方差过滤器(variationfilter),排除所有样品中称为"缺失"的基因。在所考虑的22,000种基因中,17,616种通过该过滤器并被用于聚类。在分层聚类前,每一基因除以患者中其中值表达水平。在至少10%的患者中显示超过平均表达水平大于4倍改变的基因包括在该聚类中。为鉴定具有的截然不同的基因概况的患者亚组,分别通过使用GeneSpring5.0(SanJose,CA)和Partek5.1软件(St.Louis,MO)进行均值连锁分层聚类和k-均值聚类。具有Bonferroni校正的t-检验用于鉴定为该聚类结果所包含的在2个患者亚组之间具有差异表达水平的基因。将0.01的Bonferroni校正的P值选作为用于基因选择的阈值。进一步检查每一具有截然不同表达概况的聚类中的患者的结果信息。为了鉴定能区分复发和无病患者的基因标志,如以下所进一步描述的分别分析每一亚组患者。所有统计分析均使用S-Plus软件(Insightful,VA)进行。患者及肿瘤特征患者及他们的肿瘤的临床和病理学特征概述于表1中。患者具有有关年龄、性别、TNM分期、分级、肿瘤大小和肺瘤位置。74位患者中的73位具有关于受检淋巴结数目的数据,74位患者中的72位具有估计的肿瘤大小信息。在复发和无复发患者之间患者及胂瘤特征没有显著差异。没有患者接受手术前治疗。在该研究中对于所有患者均可获得最短3年的随访数据。通过遗传概况鉴定的患者亚组基于对超过17,000种有意义的基因所测定的他们的表达概况的相似性,无监督分层聚类分析产生了74位患者的簇。鉴定了在他们之间具有超过600种差异表达的基因两个亚组患者(p<0.00001)。较大的亚组以及较小的亚组分别包含54位和20位患者。在54位患者的较大亚组中,仅有18位患者(33%)在3年内发展为胂瘤复发,而在20位患者的较小亚组中,则有13位患者(65%)具有进行性疾病。卡方分析给出了0.028的p值。选择并检查在两种肿瘤类型之间两个具有极端差异表达的显性基因簇。在20位患者的较小亚组中第一个基因簇具有一组下调基因,为肝肠特异的钙粘蛋白17、脂肪酸结合蛋白1、尾型同源异型盒转录因子(caudaltypehomeoboxtranscriptionfactors)CDXl禾口CDX2、粘蛋白以及钙粘蛋白样蛋白MUCDHL。在较小亚组中第二个基因簇为一组上调基因,包括血清诱导激酶SNK、膜联蛋白Al、B细胞RAG相关蛋白、钙结合蛋白2和肿瘤抗原L6。因此,基于他们的基因概况20位患者的较小亚组代表了较少分化的肿瘤。基因特征及其预后价值为了鉴定能区分复发和无病患者的基因标记,分别分析每一亚组的患者。首先将每一亚组中的患者分成具有大约相同数量患者的训练集和测试集。训练集用于选择基因标志并建立预后特征。测试集用于独立-验证。在54位肿瘤患者的丰支大亚组中,36位患者在他们初次it断后保持至少3年无病,18位患者在3年内发展为肿瘤复发。将54位患者分成两组。训练集包含21位无病患者和6位复发患者。在20位肺瘤患者的较小亚组中,7位患者保持至少3年无病,13位患者在3年内发展为肿瘤复发。将20位患者分成两组。训练集包含4位无病患者和7位复发患者。为鉴定区分预后良好组和预后不良组的基因特征,对每一训练集使用监督分类法。单变量Cox比例风险回归用于鉴定其表达水平与患者生存时间相关的基因。使用小于0.02的p-值座位选择标准选择基因。紧接着,对所选择的基因进行t-检验以测定复发和无病患者之间差异表达的显著性(P<0.01)。为避免选择过拟合(overfit)训练集的基因,进行具有t-检验的100次再取样以便搜索在大于80。/。的再取样检测中具有有意义p值的基因。从27位患者训练集中选择了7种基因(表2),从11位患者训练集中选择了15种基因(表3)。将这22种基因与钙粘蛋白17结合起来,使用S-Plus软件构建Cox模型来预测患者复发。在预测具有预后良好的组和预测具有预后不良的组之间,卡普兰-迈耶生存分析显示患者会保持无病的概率具有显著差异(图3)。几种基因与细胞增殖或肿瘤进展相关。例如,酪氨酸3-单加氧酶色氨酸5-单加氧酶活化蛋白(YWHAH)属于负责响应人细胞中DNA损伤的G2细胞周期控制的蛋白14-3-3家族。RCC1是涉及染色体凝聚发生调节的另一种细胞周期基因。BTEB2是已被暗示为不依赖|3-连环蛋白的Wnt-l应答基因的锌指转录因子。一些基因可能涉及局部免疫应答。免疫球蛋白样转录物5蛋白是常见的MHCI分子抑制受体。凝溶胶蛋白/绒毛蛋白家族的独一无二的成员加帽蛋白,CAPG主要在巨噬细胞中表达。LAT是一种联系T细胞受体与细胞活化的高度酪氨酸磷酸化蛋白。因此,胂瘤细胞和免疫细胞表达的基因都可用作为用于患者复发的预后因子。为了验证23种基因预后特征,将包括来自较大亚组的27位患者和来自较小亚组的9位患者的两个测试集中的患者组合并对该测试集中36位独立患者预测结果。该测试集由18位在3年内发展为肿瘤复发的患者和18位保持无病超过3年的患者组成。预测产生了13例正确的复发分类和15例正确的无病分类。总体性能78%(28/36)的准确性,72%(13/18)的灵敏度和83%(15/18)的特异性。该性能显示与具有高于预后特征阈值的值的那些杜克氏B患者相比,具有低于预后特征阈值的值的杜克氏B患者具有在3年内发展为肿瘤复发的13倍优势比(95%CI:2.6,65;p=0.003)。此外,在预测具有预后良好的组和预测具有预后不良的组之间,卡普兰-迈耶生存分析显示患者会保持无病的概率具有显著差异(P〈0.0001)。在多变量Cox比例风险回归中,对肿瘤复发估计的风险比为0.41(95%置信区间,0.24-0.71;P=0.001),表明该23种基因集是预后标记并且与更高的肿瘤复发风险逆相关。使用7种基因组合(表2),获得83%的和80%的特异性(基于12份复发和15份生存的样品集)。使用15种基因组合(表3),获得50%的灵敏度和100%的特异性(基于6份复发和3份生存的样品集)。图1和2分别是对7种和15种基因组合进行卡普兰-迈耶分析的图解表示。此外,如这些结果所证实的,预后可源自原发肿瘤的基因表达概况。表l.患者及其肿瘤的临床和病理特征<table>tableseeoriginaldocumentpage25</column></row><table>表3:15种基因列表登录号sNM_012345.1NM一030955.1NM_001474.1AF&9764.1D13368.1NM—012387.1NMJ316611.1NM—014792.1NM一017937.1NM一001645.2AL5;5035NM_022078-1Al_133089.1NM一001271.1AL137428.1表4.构成预后标记的23种基因p值SEQIDNO:(Cox)基因描述70.0011免疫球蛋白样转录物5蛋白80.0016酪氨酸3-单加氧酶色氨酸5-单加氧酶活化蛋白90.0024细胞周期基因RCC1100.0027转录因子BTEB2110.0045加帽蛋白(肌动蛋白纤丝),凝溶胶蛋白样(CAPG)120.0012T细胞活化的接头(LAT)130.0046拉福拉病(痫蛋白)140.0110核脆性X综合征蛋白相互作用蛋白1(NUFIP1)150.0126具有凝血酶敏感素1型基序的解聚素样和金属蛋白酶(reprolysin型)12(ADAMTS12)160.0126G抗原4(GAGE4)170.0130含粘蛋白样受体EGF样组件EMR3180.0131丙氨酸乙醛酸转氨酶190.0131肽基精氨酸脱亚氨基酶,V型(PAD)200.0136内向整流钾通道,亚家族K,成员4(KCNK4)210,0139KIAA0125基因产物(KIAA0125)220.0142假定蛋白FLJ20712(FLJ20712)230.0145栽脂蛋白C-I(AP0C1)240.0146共有序列包括gb:AL545035250.0149假定蛋白FLJ12455(FLJ12455)260.0150共有序列包括gb:AL133089.1270.0151染色质域解旋酶DNA结合蛋白2(CHD2)280.0152共有序列包括gb:AL137428.16未检验的4丐粘蛋白17实施例6在该研究中,我们现已完成了在获得自两个来源的123位杜克氏B结肠癌患者独立系列中所进行的独立预后标记评价。此外,我们开发了RTQ-PCR检测以便检测FPE样品中的预后基因特征。我们的数据提供了用于杜克氏B结肠癌患者的预先指定的基因特征高置信度的验证。目的:杜克氏B结肠癌患者的5年生存率大约是75%。在我们早期基因表达的基因组广度测量中,我们鉴定了根据临床结果将杜克氏B患者归入亚类并对这些患者可提供更好的个体风险的预测器的23种基因特征。Wang,等.(2005)。本研究验证了在独立且更加多样的患者组中的该基因特征,并将该预后标记发展为使用固定的石蜡包埋的(FPE)月中瘤组织的临床上可行的#r查。患者和方法:使用AffymetrixU133a基因芯片,我们分析了来自123位没有接受辅助全身疗法的杜克氏B患者冷冻肿瘤样品的总RNA中23种基因的表达。此外,我们开发了用于该基因标记的实时定量(RTQ)-PCR检测,以便使用标准的临床FPE样品进行该检测。结果:在独立验证123位患者集合中,在鉴定会发展为远端转移的患者中,该23种基因特征被证明具有高信息含量(风险比,HR2.56;95%置信区间CI,1.01-6.48),甚至当在多变量分析中校正传统的预后因子时,该23种基因特征也被证明是高信息含量的(HR,2.73;95%CI,0.97-7.73)。在具有可获得的FPE样品的独立的110位患者集中,开发用于该基因特征的RTQ-PCR检测也验证了该结果,并且对于在单变量和多变量分析(HR,13.9;95%CI,5.22-37.2)中远处复发发生(HR,6.55;95%CI,2.89-14.8)而言其是强预后因子。结论:我们的结果验证了在独立人群中用于杜克氏B结肠癌患者的预定的预后基因特征,并显示了对标准的FPE样品使用RTQ-PCR检测基因特征的可行性。这种检测鉴定具有不利结果的结肠癌患者的能力证明了临床关联性,用以帮助鉴定需要更积极的治疗选择的处于复发高风险的患者。患者和方法根据伦理审查委员会(InstitutionalReviewBoard)批准的每一地点的实验方案,来自123位编码的杜克氏B结肠癌患者的冷冻的肿瘤样品和来自110位这些患者的FPE肺瘤样品获得自ClevelandClinicFoundation(Cleveland,OH),ArosAppliedBiotechnology,LLC(Aarhus,Denmark)和Proteogenix,LLC(CulverCity,CA)。54位患者具有匹配的冷冻和FPE样品。在外科手术时收集归档的原发胂瘤样品。检查每一样品的组织病理学以确认诊断和肿瘤含量。总细胞群由至少70%肿瘤细胞组成。至少3年的随访是需要的,除非患者在该时间前发展为远处复发。患者只通过外科手术治疗。根据对的结肠癌患者的通例进行对外科手术后患者的监护,包括对患者的体格检查、血细胞计数、肝功能试验、血清CEA和结肠镜检查。所选择的患者进行腹部CT扫描和胸部X-射线检查。如果怀疑肺瘤复发,则对患者加强病情检查,包括允许时进行腹部/骨盆CT扫描、胸部X-射线检查、结肠镜检查和活组织检查。复发时间或无病时间规定为从外科手术日期开始至对于复发患者确认肿瘤复发日期以及从外科手术日期开始至无病患者最后随访曰期的时间间隔。如在我们的初步研究中所描述的,对所有肿瘤组织进行处理用于RNA分离。上述实施例以及Wang等.(2005)。使用发表的方法制备生物素化的靶(Affymetrix,SantaClara,CA)(Lipshutz等.(1999))并与AffymetrixU133a基因芯片(Affymetrix,SantaClara,CA)杂交。利用标准的Affymetrix实验方案扫描阵列。每一探针组均^皮认为是一独立基因。使用AffymetrixGeneChip⑧分析软件MAS5.0并根据之前所描述的分析方法计算每一基因的表达值。Wang等.(2005)。F尸五存^为、庠iA^FPE组织可获得自110位患者。该FPE样品是福尔马林固定的(n=45)或Hollandes固定的(n=65)FPE组织。使用HighPureRNAParaffinKit(RocheAppliedSciences,Indianapolis,IN),才艮氺居改良的实验方案从FPE组织样品分离RNA。根据块的大小对FPE组织块进行切片(6-8mm=6X10(am,8-^10mm=3X10pm)。根据制造商的说明对切片脱蜡。在55°C恒温器中干燥组织沉淀物IO分钟并重悬于100pL组织裂解緩冲液、16|iL10。/。SDS和80|iL蛋白酶K中。在55。C下于热混合器中以400rpm涡旋并温育样品3小时。#^据试剂盒说明书进行随后的样品处理步骤。使用分光光度计通过OD260/280读数定量RNA样品并稀释至50ng尔L的终浓度。在使用前于-80。C下将分离的RNA样品贮存在无RNA酶的水中。灯j3a为Vf使用分离自FPE组织的RNA样品,利用一步多重RTQ-PCR检测评价23种基因标记中的7种基因。为了使RTQ-PCR反应变异性减至最小,四种持家对照基因包括p-肌动蛋白、HMBS、GUSB和RPL13A用于归一化RNA的输入量。为防止任何样品中的污染DNA扩增,用于RTQ-PCR检测的PCR引物或探针设计成能跨越内含子,使得该检测不会扩增任何残留的基因组DNA。将100ng的总RNA用于一步RTQ-PCR反应。使用包含于TaqMan⑤一步PCRMaster混合物试剂盒(AppliedBiosystems,Fresno,CA)之中的40xMultiscribe和RNA酶抑制剂混合物进行逆转录。然后向cDNA添加不含尿嘧咬-N-糖基化酶(UNG)的2xMaster混合物。使用具有10pL反应体积的384-孔板格式在ABI7900HT测序系统(AppliedBiosystems,Frenso,CA)上进行PCR扩增。引物和探针的浓度分别为4和2.5pmol/L。在48°C下温育反应混合物30分钟用于逆转录,之后是在95。C下10分钟的Amplitaq⑤活化步骤,接着是用于变性的95°C持续15秒以及用于退火和延伸的60。C持续1分钟的40个循环。标准曲线产生自100pg-100ng起始材料,并且当/2值>0.99时,循环阔值(Ct)是接受的。此外,根据制造商的说明朝着相同的扩增效率优化所有的引物和探针。对于7种基因中的4种(BTEB2、LAT、CAPG和免疫球蛋白样转录物5蛋白),我们使用了AppliedBiosystems的按需检测(Assay-On-Demand)。用于其他3种基因和4种持家对照基因的引物和探针的序列如下,每条都以5,至3'方向书写痫蛋白正向引物,CATTATTCAAGGCCGAGTACAGATG;SEQIDNO:29痫蛋白反向引物,CACGTACACGATGTGTCCCTTCT;SEQIDNO:30痫蛋白探针,CAGGCGGTGTGCCTGCTGCAT.SEQIDNO:31RCC1正向引物,TTTGTGGTGCCTATTTCACCTTT;SEQIDNO:32RCC1反向引物,CGGAGTTCCAAGCTGATGGTA;SEQIDNO:33RCC1探针,CCACGTGTACGGCTTCGGCCTC.SEQIDNO:34YWHAH正向引物,G(iCGGAGCGCTACGA;SEOIDNO:35YWHAH反向引物,TTCATTCGAGAGAGGTTCATTCAG;SEQIDNO:36YWHAH探针,CCTCCGCTATGAAGGCGGTGSSEQIDNO:37P-肌动蛋白正向引物,AAGCCACCCCACTTCTCTCTAA;SEQIDNO:38P—肌动蛋白反向引物,AATGCTATCACCTCCCCTGTGT;SEQIDNO:39P-肌动蛋白探针,AGAATGGCCCAGTCCTCTCCCAAGTC.SEQIDNO:40HMBS正向引物,CCTGCCCACTGTGCTTCCT;SEQID"NO:41HMBS反向引物,GGTTT丁CCCGCTTGCAGAT;SEQIDNO:42HMBS探针,CTGGCTTCACCATCG.SEQIDNO:43GUSB正向引物,TGGTTGGAGAGCTCATTTGGA;SEQIDNO:44GUSB反向引物,ACTC丁CGTCGGTGACTGTTCAG;SEQIDNO:45GUSB探针,TTTTGCCGATTTCATG.SEQIDNO:46RPL13A正向引物,CGGAAGAAGAAACAGCTCATGA;SEQIDNO:47RPL13A反向引物,CCTCTGTGTATTTGTCAATTTTCTTCTC;SEQIDNO:48RPL13A探针,CGGAAACAGGCCGAGAA.SEQIDNO:49对于每一种样品,计算ACt=Ct(靶基因)-Ct(四种对照基因的平均值)。ACt归一化业已广泛用于临床RTQ-PCR检测。通过使用针对基因表达数据的方差分析(ANOVA),将由在独立临床机构用于样品处理的不同实验方案所引起的数据变异性减至最小。如我们之前研究中所描述的,阵列上钓粘蛋白17基因表达测量值用于决定患者所分入的亚组。上述实施例和Wang等.(2005)。具有可检测到的钙粘蛋白17表达水平的患者分类入亚组I,并使用23种基因特征中的7种基因亚集预测它们的结果。具有无法检测到的钓粘蛋白17表达水平的患者分类入亚组II,并使用并使用23种基因特征中的15种基因亚集预测它们的结果。对每位患者计算复发得分并用于将患者分类入在3年内发展为远端转移的高或低风险组。具有复发得分〉0的患者分类入高风险,具有复发得分O的患者则称为低风险。复发得分计算如下tO如果未^r测到4丐粘蛋白17表达A和B是常数wi是标准化的Cox回归系数Xj是log2标尺中的表达值卡普兰-迈耶生存曲线(Kaplan等.(1958))和对数等级试验用于评价所预测的高和低风险组的差异。灵敏度规定为通过基因标记被正确预测在3年内具有远端转移的患者的百分数,特异性规定为至少3年没有远处复发(distantrecurrence)的患者的百分数,所述患者通过基因标记被预测不会复发。优势比(oddsratioOR)被计算为在预测的复发患者和无复发患者之间远端转移占优的比值。对患者的单个临床参数和临床参数和基因标记的组合执行使用Cox比例风险回归的单变量和多变量分析,所述临床参数包括年龄、性别、T分期、分级和肺瘤大小。HR及其95%CI来源于这些结果。使用S-Plus6.1软件(Insightful,FairfaxStation,VA)进行所有统计分析。结果患者及他们的肿瘤的临床和病理学特性概述于表5和表6中。所有患者都具有关于年龄、性别、TNM分期、分级、肿瘤大小和肿瘤位置的信息。在复发和无复发患者之间患者及肺瘤特性无显著差异。患者仅通过外科手术治疗,且没有一位患者接受新辅助或辅助疗法。除那些具有复发<3年的患者之外,在该研究中对于所有患者均可获得最短3年的随访数据。复发风险得分=A'I+Zl.WiXj+B.(1-1)+艺(l-I).其中tfl如果检测到4丐粘蛋白17表达表5患者及肿瘤特性(冷冻的肿瘤组织研究)AROSCCFAROS+CCF因素数目%数目%数目%表6患者及肿瘤特性(FPE研究)ProteogenexCCFProteogenex+CCF因素数目%数目°/。数目.o/067.岁70岁69岁26(53)37(50)63(51)23(47)37(50)60(49)00037(76)64(86)101(82)7(14)10(14)17(14)5(10)05(4)9(19)6(8)15(12)32(65)56(76)88(72)8(16)12(16)20(16)9(18)4(5)13(11)40(82)68(92)108(88)02(3)2G)5535STG>6"547-00;*(岁osl21707764629117161920073ST47STSA54001071岁173-)-o,)}}ir/o28069o3257336。71161127岁fi-ve254^56::MO龄年的234好等良知s,查男女朗PJPW良中不未G是否审别%级移性^分转234>好等良沐.-^一男女辆TTT未」良中不o是否,审别w级移性^分转齊卑冷《捧品哞差湖标记时为V,作为23种基因标记的函数进行生存分析。首先,作出ROC曲线(图4),曲线下面积(AUC)用于评价预测器性能。23种基因预测器给出了0.66的AUC值。使用3年定义点,计算自该方法的复发得分正确地预测了3年内出现的13位复发者中的8位(62%灵敏度)以及108位无复发者中的74位(69%特异性)。尽管在该123位患者组中肿瘤复发频率只有11%,但卡普兰-迈耶分析产生了用于该患者组的生存曲不良的组之间复发^"间差异显著(P二0.04)口(图4)。'i12;位,i者的单变量和多变量分析中,在鉴定会发展为远端转移的患者中该23种基因标记被证明是高信息含量的(风险比,HR2.56;95%置信区间CI,1.01-6.48),甚至当在多变量分析中校正传统的预后因子时,该23种基因标记也被证明是高信息含量的(HR,2.73;95%CI,0.97-7.73)。在我们初步研究的患者样品组中(Wang等.(2005)),我们检测到两个肿瘤亚组,分别是分化良好和分化不良的肿瘤亚组。妈粘蛋白17基因表达被用于将杜克氏B肺瘤分入两个亚组中,预后基因标记被设计成以包括用于亚组1(7种基因)和亚组11(15种基因)的分类器。在本发明的验证研究中,我们检查了来自2个来源的123位杜克氏B患者的独立样品组,并发现亚组IH又占非常小部分的典型的杜克氏B肿瘤组成(2%)。因此,我们通过除去在随后的RTQ-PCR检测中被选择用于亚组II的15种基因简化了预后基因标记。该微阵列数据集已提交到NCBI/GenbankGEO数据库(待决的系列登记)。F尸五哞《/^标记W》Vi使用如上所述对亚組I患者所选择的7种基因进行RTQ-PCR检测。这些7种基因应当能分类代表性群体中大于95%的患者的结果。进行生存分析。首先,作出ROC曲线(图5)。用于评价预测器性能的参数是曲线下面积(AUC)。7种基因预测器给出0.76的AUC值。使用3年定义点,根据该方法计算的复发得分正确地预测了17例在3年内出现的复发中的11例(65%灵敏度)以及92位无复发者中的78位(85%特异性)。此外,在预测具有预后良好的组和预测具有预后不良的组之间,卡普兰-迈耶分析以及对数等级试验都显示复发时间差异显著(P<0.0001)(图5)。在110位患者中,对于远处复发发生(HR,6.55;95%CI,2.89-14.8)以及在单变量和多变量分析(HR,13.9;95%CI,5.22-37.2)中,该7种基因标记皆被证实为强预后因子(表7)。表7对DMFS的单变量和多变量分析在132位ER阳性的乳腺癌患者中无远处转移生存的多变量和单变量Cox分析单变量分析多变量分析HR2(95%CI)P值HR(95%CI)P值年龄0.98(0.95-1.01)0.24200.97(0.94—1.01)0.1025性别30.81(0.35-1.85)0.61291.15(0.44—3.01)0.7756T分期0.70(0.22—2.28)0.55651.30(0.31-5.48)0.7248分级41.17(0.35-3.95)0.80180.46(0.12-1.70)0.2420肿瘤大小50.61(0.26—1.40)0.24600.59(0.24—1.44)0.24407种基因标记6.55(2.89-14.8)6.6E-0613.94(5.22—37.2)1.5E-07由于在9位患者中漏测数值,因此多变量模型包括101位患者。风险比性别男性对女性卜分级中等和良好对不良;月中瘤大小〉=5mm对<5mm阵列结果将15位患者分类为复发者,将39位患者分类为无复发者,与此同时RTQ-PCR结果预测9位患者为复发者,45位患者为无复发者。这两种方法一致预测了54位患者中的40位患者(74%),但在这两种方法中间有14位患者(26%)预测不一致。已知不同类型的组织样品用于这两种才企测中(冷冻对FPE),因此这两种方法之间的分类结果的一致性是高的。在14份不和谐样品中,4位患者具有非常接近截断值的得分(在5%的截断值内),而其余的10位患者则在两种方法之间具有非常不佳的相关得分(相关系数0.15)。我们使用相同的RNA样品对10份不和谐样品重复了RTQ-PCR^r测,2次RTQ-PCRi企测的得分给出了0.998的相关系数。该数据暗示这些患者的不一致得分可能归因于同一肿瘤取样中的差异性。需要进一步的检测以便评价临床FPE材料中取样波动。讨论我们提供了对之前所确定23种基因特征验证研究的结果。上述实施例和Wang等.(2005)。在上述研究中,该标记的灵敏度和特异性分别为72%和83%。根据预先规定的标准在123位杜克氏B结肠癌患者的独立组中该预后标记用于预测远处复发。此外,我们报道了使用FPE样品的RTQ-PCR检测,利用7种基因标记在IIO位杜克氏B患者的独立组中成功地验证了远处复发。该研究使我们迈向更接近于对结肠癌患者进行这样的分子预后检测的临床应用。其提高了当前用于杜克氏B结肠癌患者的治疗方案的疗效。在我们初步研究的患者样品组中(Wang等.(2005)),使用超过17,000种信息基因的无监督分层聚类检测到2个肿瘤亚组,分别是分化良好的分化不良的肿瘤亚组。我们使用了钓粘蛋白17基因的表达作为指示物以将杜克氏B肿瘤分为两个亚组并设计预后基因标记以包括用于亚组1(7种基因)和亚组11(15种基因)的分类器。最初的患者集可能无法代表典型的杜克氏B肿瘤组成,特别是亚组I和亚组II之间患者的比值。在本发明的验证研究中,我们检查了来自2个来源的独立样品组,并发现在来自这两个来源的样品中亚组II仅占非常小部分的典型的杜克氏B肺瘤组成(2%)。因此,我们通过除去^皮选择用于亚组II的15种基因简化了预后基因特征。旨在开发分子基因特征的研究必须严格验证,并且在结果被真正确认以及对于方法、统计和临床方面结果被证实具有高再现性之前都无法被认为具有临床应用。在这方面,业已对公布的针对组织的基因表达概况研究提出了一些批评,涉及独立验证集的遗漏、训练集和测试集的大小或对所研究的患者人群的治疗的可能混淆的结果。Ransohoff(2005);和Simon等.(2003)。我们本发明的研究是用于结肠癌患者的预定的(pre-specified)预后概况的第一次成功验证。研究优点依赖于来自多个设施的不同的患者组以及使用标准的临床FPE材料。根据机构的实验方案收集并贮存肿瘤样品,并使用容易采用的方法制备RNA样品。不管不同机构处理组织的差异性,基因特征均被证实是牢靠的,且所产生的结果与我们最初的分析的那些结果相一致。总之,本发明验证研究的结果证实了我们初始报告的结果。所证实的结果再现性表明该预后基因特征可被推荐用于未来的临床研究,并且有可能用于临床实践。由于大约20-30%的杜克氏B结肠癌患者复发,因此该预后标记提供了用于选择处于复发高风险患者的有力工具以及可能的额外辅助疗法。Liefers等.(1998);和Markowitz等.(2002)。该鉴定需要加强临床干预的患者的能力可导致疾病生存的改良。实施例7CepheidPCR反应材详牛和方法^y,品为、库iAT丄基于具有下列修改的HighPureRNAParaffinKit说明书(Roche)中所描述的方法和试剂从石蜡组织切片分离RNA。从每种石蜡包埋的组织样品上切下12XlOinm切片。如试剂盒说明书中所述对切片脱蜡,在55°C恒温器中干燥组织沉淀物5-10分钟并重悬于100^1的组织裂解緩冲液、16(il10%SDS和80|il蛋白酶K中。在55。C下于热混合器中以400rpm涡旋并温育样品3小时。随后根据HighPureRNAParaffinKit说明书进行样品处理。通过分光光度计获得的OD260/280读数定量样品并在使用前将分离的RNA于-80。C下贮存在无RNA酶的水中。一,定量其好,合癉链^^。免疫球蛋白样转录物5蛋白(LILRB3)、酪氨酸3-单加氧酶色氨酸5-单加氧酶活化蛋白(YWHAH)、细胞周期基因RCC1(CHC1)、转录因子BTEB2(KLF5)、加帽蛋白(肌动蛋白纤丝),凝溶胶蛋白样(CAPG)、T细胞活化的接头(LAT)、拉福拉病(EP2MA)、核糖体蛋白L13a(RPL13A)、肌动蛋白、p肌动蛋白(ACTB)和羟甲基胆色烷合酶(PBGD)适当的mRNA参照序列登录号连同PrimerExpress2.0被用于开发我们的水解探针结肠预后检测。用于最优的一步qRT-PCR检测的基因特异性引物和水解探针列于表8中。在外显子-内含子剪接位点周围通过设计我们的检测方法排除了基因组DNA扩增。水解探针在5'核苷酸处使用FAM、Quasar570、得克萨斯红或Quasar670作为报道染料(r印orterdye)标记,并在3,核苦酸处使用BHQ作为自淬灭染料标记。在SmartcyclerII序列检测系统(Cepheid)上于25jxl反应管中进行基因特异性RNA的定量。对于每次检测,在基因多重传输之前放大基因标准曲线以便检验PCR效率。用于我们的标志的标准曲线由浓度为2X102、1乂102和5X10ng/反应的总RNA样品中的靶基因组成。在每次检观'j中都没有靶对照包括于其中以确保不产生环境污染。所有样品和对照重复检测两次。在含有100ng模板RNA、RT-PCR緩冲液(125mMN-二[羟乙基]甘氨酸,48mMKOH,287.5nMKAc,15%甘油,3.125mMMgCl,7.5mMMnS04,0.5mM每种dCTP、dATP、dGTP和dTTP)、添加剂(125mMTris-ClpH8,0.5mg/ml牛白蛋白,374.5mM海藻糖,0.5%Tween20)、酶混合物(0.65UTth(Roche),0.13mg/mlAbTP6-25,Tris-Cl9mM,甘油3.5%)的25pl反应混合物中进行定量实时PCR,引物和探针浓度是变化的并列于表9。在SmartcyclerII序列检测系统(Cepheid,Sunnyvale,CA)上运行反应。循环参数如下在95°C持续15秒进行1个循环;在55。C持续6分钟进行1个循环;在59。C持续6分钟进行1个循环;在64。C持续10分钟进行1个循环以及在95。C持续20秒,58。C持续30秒的40个循环。在PCR反应完成后,将Cepheid软件和计算的Ct值输出至MicrosoftExcel。表8.用于Cepheid反应的结肠预后引物和探针序列<table>tableseeoriginaldocumentpage37</column></row><table><table>tableseeoriginaldocumentpage38</column></row><table>表9.结肠预后引物和探针浓度<table>tableseeoriginaldocumentpage38</column></row><table><table>tableseeoriginaldocumentpage39</column></row><table><table>tableseeoriginaldocumentpage40</column></row><table>1.在25ulCepheid试管中混合所有试剂2.使用前,在台式微量离心机中快速旋转试管。3.将试管置于Smartcycler中并选择CUP59作为实验方案CepheidSmartcycler中设定如下95C持续15秒59C持续150秒64C持续420秒95持续20秒58C持续30秒重复4Q个循环序列序列名称5'修饰3'修饰纯化SEQIDNO:(5'至3')(HPLC.Cart.)ATCMGATCATTGCTCCTCCB-肌动蛋白-1052-ICY3Quasar570BHQ2-TGAGCGCi双重HPLC52gCCTCCGCTATGMGGC酬AH268l+GFAMpHQ1々GTGAi双重HPLC58CCACGTGTACGGCTTCGCHC11063T得克萨斯红PHQ1《CCTC双重HPLC34段段段段阶阶阶阶<table>tableseeoriginaldocumentpage42</column></row><table>买验:方法:<table>tableseeoriginaldocumentpage43</column></row><table><table>tableseeoriginaldocumentpage44</column></row><table><table>tableseeoriginaldocumentpage45</column></row><table><table>tableseeoriginaldocumentpage46</column></row><table><table>tableseeoriginaldocumentpage47</column></row><table><image>imageseeoriginaldocumentpage48</image><table>tableseeoriginaldocumentpage49</column></row><table><table>tableseeoriginaldocumentpage50</column></row><table><table>tableseeoriginaldocumentpage51</column></row><table><table>tableseeoriginaldocumentpage52</column></row><table><table>tableseeoriginaldocumentpage53</column></row><table><table>tableseeoriginaldocumentpage54</column></row><table>CepheidSmartcycler中设定如下阶段l:9Sfc疆fe1S秒阶段2....:55.g#麵:-360护-、V'.f阶段259C持续360秒阶段364C持续600秒阶段395持续20秒58C持续30秒重复40个循环结肠IVD引物和探针序列泉因名称序列通道<table>tableseeoriginaldocumentpage55</column></row><table>基因名称正向引物反向引物<table>tableseeoriginaldocumentpage55</column></row><table><table>tableseeoriginaldocumentpage56</column></row><table><table>tableseeoriginaldocumentpage57</column></row><table><table>tableseeoriginaldocumentpage58</column></row><table><table>tableseeoriginaldocumentpage59</column></row><table><table>tableseeoriginaldocumentpage60</column></row><table><table>tableseeoriginaldocumentpage61</column></row><table><table>tableseeoriginaldocumentpage62</column></row><table><table>tableseeoriginaldocumentpage63</column></row><table><table>tableseeoriginaldocumentpage64</column></row><table><table>tableseeoriginaldocumentpage65</column></row><table><table>tableseeoriginaldocumentpage66</column></row><table><table>tableseeoriginaldocumentpage67</column></row><table><table>tableseeoriginaldocumentpage68</column></row><table><table>tableseeoriginaldocumentpage69</column></row><table><table>tableseeoriginaldocumentpage70</column></row><table><image>imageseeoriginaldocumentpage71</image><table>tableseeoriginaldocumentpage72</column></row><table><table>tableseeoriginaldocumentpage73</column></row><table><table>tableseeoriginaldocumentpage74</column></row><table>1.在25ulCepheid试管中混合所有试剂2.使用前,在台式微量离心机中快速旋转试管。3.将试管置于Smartcycler中并选择结肠IVD7a作为实验方案CepheidSmartcycler中设定如下Sr.'.!阶段l95C;^15秒i阶段395持续20秒58C持续30秒潜應,參和豕辦/;/基因名称序列通道,it羅懇^^^K"^^fe^^^^^徵ii^1lii^^l"^^^^^^^^J邏YWHAH268gCCTCCGCTATGAAGGOBHQ1^GGTGAFAM纖^^^^^^^PBGD161MCGGCMTGCGGCTGCAACGGCGGAA别Q2-TTCy5CAPG1032TGGAGATTCTGCCTCAG-8HQ2邻CCGTTXR匿鶸繊LILRB31338CAGGGCCGCCCTCCACACCTG-BHQ1-TTFAMEP2MA493CAGGCGGTGTGCCTGCTGCAT-BHQ2-TT鷗飄钃基因名称_正向引物_反向引.物<table>tableseeoriginaldocumentpage76</column></row><table><table>tableseeoriginaldocumentpage77</column></row><table><formula>formulaseeoriginaldocumentpage78</formula>Rattoetal,(1998)Prognosticfactorsincolorectalcancer.LiteraturereviewforclinicalapplicationDisColonRectum41:1033-1049Rosenwaldetal.(2002)TheuseofmolecuarprofilingtopredictsurvivalafterchemotherapyfordiffliselargerB-celllymphoinaNEnglJMed,346:1937-1947Saltzeta.(1997)AdjuvanttreatmentofcolorectalcanceAnnuRevMed48:191-202Shibataetal.(1996)TheDCCproteinandprognosisincolorectalcancerNEnglJMed335:1727-732Shippetal.(2002)DiffuselargeB-celllymphomaoutcomepredictionbygene-.expressionprofilingandsupervisedmachinelearningNatureMed8:68-74Simonetal.(2亡03)PitfallsintheuseofDNAmicroarraydatafordiagnosticandprognosticclassificationJNatlCancerInst95:14-18Suetal,(2001)MolecularclassificationofhumancarcinomasbyuseofgeneexpressionsignaturesCancerRes61:7388-93Sunetal.(1999)ExpressionofthedeletedincolorectalcancergeneisrelatedtoprognosisinDNAdiploidandlowproliferativecolorectaladenocarcinomaJClinOncol17:1745-1750VandeVijveretal.(2002)Agene-expressionsignatureasapredictorofsurvivalinbreastcancerNEnglJMed347:1563-1575van'tVeeretal.(2002)GeneexpressionprofilingpredictsclinicaloutcomeofbreastcancerNature45:530-536,Van,tV"eeretaL(2002)Geneexpressionprofilingpredictsclinicaloutcomeofbreastcancer.Nature4〗5:530-536Wangetal(2005)Gene-expressionprofilestopredictdistantmetastasisoflymph-node-negativeprimarybreastcancerLancet365:67卜679Wangetal.^2004)GeneexpressionprofilesandmolecularmarkerstopredictrecurrenceofDukes'BcoloncancerJClinOncol22:1564-1571Watanabeetal.(2001)MolecularpredictorsofsurvivalafteradjuvantchemotherapyforcoloncancerNEnglJMed344:U96-1206Wolmarlcetal.(1999)Clinicaltrialtoassesstherelativeefficacyoffluoroijiracilandleucovorin,fluorouracilandlevamisole,andfluorouracil,leuco々orin,andlevamisoleinpatientswithDukes'BandCcarcinomaofthecolon:resultsfromNationalSurgicalAdjuvantBreastandBowelProjectC-04JClinOncol17:3553-3559Zhouetal,(2002)Countingallelestopredictrecurrenceofearly-stagecolorectalcancersLancet359:219-22权利要求1.一种确定预测杜克氏B结肠癌复发的方法,包括步骤a.从患者获得肿瘤样品;和b.测定选自下列编码mRNA的基因在样品中的表达水平i.相应于SEQIDNos7-28;或ii.为相应于SEQIDNos29-79和94-97至少之一的引物和/或探针所识别的;或iii.通过至少一种选自SEQIDNOs5-6、80-93的扩增子的产生所鉴定的;其中基因表达水平超过或低于预定的截断值指示预测杜克氏B结肠癌复发。2.—种确定患者治疗方案的方法,包括步骤a.从患者获得肿瘤样品;和b.测定选自下列编码mRNA的基因在样品中的表达水平i.相应于SEQIDNos:7-28;或ii.为相应于SEQIDNos29-79和94-97至少之一的引物和/或探针所识别的;或iii.通过至少一种选自SEQIDNOs:5-6、80-93的扩增子的产生所鉴定的;其中基因表达水平超过或低于预定的截断值足以指示复发风险,由此能使医师确定用于预防复发的治疗的程度和类型的相关建议。3.—种确定患者治疗方案的方法,包括步骤a.从患者获得肿瘤样品;和b.测定选自下列编码mRNA的基因在样品中的表达水平i.相应于SEQIDNos:7-28;或ii.为相应于SEQIDNos29-79和94-97至少之一的引物和/或探针所识别的;或iii.通过至少一种选自SEQIDNOs:5-6、80-93的扩增子的产生所鉴定的;其中基因表达水平超过或低于预定的截断值足以指示复发风险,由此能使医师确定用于预防复发的治疗的程度和类型的相关建议。4.一种治疗患者的方法,包括步骤a.从患者获得肿瘤样品;和b.测定选自下列编码mRNA的基因在样品中的表达水平i.相应于SEQIDNos:7-28;或ii.为相应于SEQIDNos29-79和94-97至少之一的引物和/或探针所识别的;或iii.通过至少一种选自SEQIDNOs:5-6、80-93的扩增子的产生所鉴定的;c.如果他们是高风险患者,利用辅助疗法治疗患者。5.—种治疗患者的方法,包括步骤a.从患者获得肿瘤样品;和b.测定选自下列编码mRNA的基因在样品中的表达水平i.相应于SEQIDNos:7-28;或ii.为相应于SEQIDNos29-79和94-97至少之一的引物和/或探针所识别的;或iii.通过至少一种选自SEQIDNOs:5-6、80-93的扩增子的产生所鉴定的;和c.如果他们是高风险患者,利用辅助疗法治疗患者。6.权利要求l-5任一项的方法,其中样品获得自原发肿瘤。7.权利要求l、2或4的方法,其中制备物获得自活组织检查或外科手术样品。8.权利要求1-5任一项的方法,进一步包括测定至少一种在样品中组成型表达的基因的表达水平。9.权利要求l-5任一项的方法,其中特异性为至少约40%。10.权利要求l-5任一项的方法,其中灵敏度为至少约90%。11.权利要求l-5任一项的方法,其中将基因表达模式与指示复发患者的表达模式进行比较。12.权利要求ll的方法,其中使用模式识别方法进行表达模式比较。13.权利要求12的方法,其中模式识别方法包括使用Cox比例风险分析。14.权利要求l-5任一项的方法,其中预定的截断值是相对于良性细胞或正常组织,在样品中至少1.5倍过表达或表达不足。15.权利要求l-5任一项的方法,其中预定的截断值具有相对于良性细胞或正常组织在具有转移性细胞的样品中至少统计显著p-值的过表达或表达不足。16.权利要求15的方法,其中p-值小于0.05。17.权利要求l-5任一项的方法,其中在微阵列或基因芯片上测定基因表达。18.权利要求17的方法,其中微阵列为cDNA阵列或寡核苷酸阵列。19.权利要求18的方法,其中微阵列或基因芯片进一步包含一种或多种内对照试剂。20.权利要求1-5任一项的方法,其中通过提取自样品的RNA的聚合酶链反应(PCR)实施的核酸扩增测定基因表达。21.权利要求20的方法,其中所述PCR为反转录聚合酶链反应(RT-PCR)。22.权利要求21的方法,其中RT-PCR进一步包含一种或多种内对照试剂。23.权利要求l-5任一项的方法,其中通过测量或检测基因编码的蛋白质检测基因表达。24.权利要求23的方法,其中通过特异于所述蛋白质的抗体检测所述蛋白质。25.权利要求l-5任一项的方法,其中通过测定基因特性检测基因表达。26.权利要求25的方法,其中被测定的特性选自DNA扩增、曱基化、突变和等位变异。27.包含至少一种选自SEQIDNOs:29-79的探针集的组合物。28.用于在生物样品中实施^r测以确定预测杜克氏B结肠癌复发的试剂盒,包含用于检测下述基因组合的经分离的核酸序列、其互补序列或其部分的物质,所述基因选自相应于SEQIDNOs:7-28的那些编码mRNA的基因。29.权利要求28的试剂盒,进一步包含用于实施微阵列分析的试剂。30.权利要求28的试剂盒,进一步包含介质,由此对所述核酸序列、其互补序列或其部分进行测定。31.用于评价状态的产品,包含用于检测下述基因组合的经分离的核酸序列、其互补序列或其部分的物质,所述基因选自相应于SEQIDNOs:7-28的那些编码mRNA的基因。32.权利要求31的产品,进一步包含用于实施微阵列分析的试剂。33.权利要求31的产品,进一步包含介质,由此对所述核酸序列、其互补序列或其部分进行测定。34.—种用于执行权利要求1-5任一项的方法的微阵列或基因芯片。35.权利要求34的微阵列,包含选自相应于SEQIDNOs:7-28的那些编码mRNA的基因组合的分离的核酸序列、其互补序列或其部分。36.权利要求35的微阵列,其中所述序列选自SEQIDNOs:29-79和94-97。37.权利要求35的微阵列,包含cDNA阵列或寡核苷酸阵列。38.权利要求35的微阵列,进一步包含一种或多种内对照试剂。39.诊断/预后组合(protfolio),包含选自相应于SEQIDNOs:7-28的那些编码mRNA的基因组合的分离的核酸序列、其互补序列或其部分。40.权利要求39的组合,其中所述序列选自SEQIDNOs:29-79和94-97。全文摘要通过分析一组基因的不同表达评价结直肠癌状态。具体而言,用于区别复发和未复发杜克氏B结肠癌手术患者。文档编号C12Q1/68GK101437962SQ200780015953公开日2009年5月20日申请日期2007年3月5日优先权日2006年3月3日发明者A·马祖姆德,T·布里格斯,Y·姜,Y·王申请人:维里德克斯有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1