基于p53状态与基因表达谱的关联而用于分类、预后和诊断癌症的方法、系统和阵列的制作方法

文档序号:440646阅读:393来源:国知局

专利名称::基于p53状态与基因表达谱的关联而用于分类、预后和诊断癌症的方法、系统和阵列的制作方法
技术领域
:本发明主要涉及用于预测患者中疾病易感性的系统、组合物和方法。
背景技术
:p53的突变被认为是发生在超过50%的人类癌症中,在DNA结合和反式激活区域中最为常见,突出了它在抑制肿瘤发展中的转录活性的重要性。与其他癌症类型不同的是,在偶发性的乳癌中,仅在约20%的病例中观察到了p53的突变。然而,在个体乳癌患者中通常观察到的p53的种系突变(即Li-Fraumeni综合症)表明,在乳癌发生中p53失活尤为重要,且或许p53在其他可损及p53功能的因子中,还扮演这类似的重要角色。例如,在超甲基化作用和随后发生的H0XA5转录因子抑制之后的p53转录激活的降低,被认为是p53在乳癌中表达减少的可能的外遗传机制。在乳房肿瘤和其他癌症类型中,MDM2基因的扩增和过度表达被认为与肿瘤生成有关,MDM2基因的扩增和过度表达的产物促进了p53的降解。另夕卜,MDM2的负调节子pl4ARF基因的缺失和外遗传沉默已在许多不同癌症类型中观察到。因此,在乳癌发生过程中的p53的缺乏可以是由除p53基因突变之外的许多机制造成的。有证据表明,p53状态在多种类型的癌症中,特别是在乳癌的预测中具有重要意义。在乳癌中,p53突变产生了更糟的总体和无疾病存活率,以及更高的肿瘤复发的发病率,而这些与其他危险因子无关。最新证据表明,p53失活导致了乳瘤对某些DNA损伤化学疗法和内分泌疗法的抗药性,而这可能是通过p53依赖性凋亡的损失造成的。然而,在所有的这些研究中均发现,p53的预测能力和对疗法的抗药性程度均在很大程度上依赖于突变特异性特征,例如突变种类或突变发生的确切区域。重要的是,这些近期的发现与早期研究所得出的并非所有p53突变都具有相同效果的结论一致某些仅仅表达为功能的损失,某些则产生显性的负面影响(例如,野生型p53的反式显形抑制或致癌性功能获得),还有一些仅显示出部分的功能损失,例如,仅p53下游转录目标基因的一小撮亚群被错调。基于这些原因,仅对p53状态进行单分子级评价不能提供完整的p53功能的绝对指示。需要发现更好的方法来评价不同p53突变对细胞功能的影响,特别是对基因表达的影响,从而得到更好的癌症预测和诊断。
发明内容因此,本发明提供了用来测量体内p53功能的更为有用的方法、系统和组合物。这些方法、系统和组合物可被用于癌症的分类、预测和诊断。在本发明的一个方面中,提供了用于预测患者的预后的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测患者的预后。在本发明的另一方面中,提供了用于预测晚期乳癌患者的预后的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测晚期乳癌患者的预后,其中,该组基因选自由具有以下基因库登记号的基因组成的组BG271923(SEQIDNO:22),NM—002466(SEQIDNO:31),D38553(SEQIDNO:11),NM—000909(SEQIDNO:9),NM—024843(SEQIDNO:1),R73030(SEQIDNO:29),NM003226(SEQIDNO:28),AW299538(SEQIDNO:5)和AI990465(SEQIDNO:25)。在本发明的又一方面中,提供了用于预测早期经局部治疗的乳癌患者的临床结果的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测早期经局部治疗的乳癌患者的预后,其中,该组基因选自由具有以下基因库登记号的基因组成的组AI961235(SEQIDNO:23),BG271923(SEQIDNO:22),NM—002466(SEQIDNO:31),BC001651(SEQIDNO:14),D38553(SEQIDNO:11),AK000345(SEQIDNO:26),BC004504(SEQIDNO:8),NM—000909(SEQIDNO:9):NM—024843(SEQIDNO:1),R73030(SEQIDNO:29),AI435828(SEQIDNO:20),AI810764(SEQIDNO:24),AI922323(SEQIDNO:10),NM—003225(SEQIDNO:32),NM—003226(SEQIDNO:28),AW299538(SEQIDNO:5),NM—003462(SEQIDNO:16),AI990465(SEQIDNO:25):NM004392(SEQIDNO:15),NM—001267(SEQIDNO:7)和AI826437(SEQIDNO:3)。在本发明的再一方面中,提供了用于预测肝癌患者的临床结果的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的P53基因;比较所述基因表达谱,确定哪些基因在突变的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测肝癌患者的预后,其中,该组基因选自由具有以下基因库登记号的基因组成的组NM_002466(SEQIDNO:31),BC001651(SEQIDNO:14),D38553(SEQIDNO:11),NM—024843(SEQIDNO:1),AI435828(SEQIDNO:20),AI810764(SEQIDNO:24),NM—003226(SEQIDNO:28)andAW299538(SEQIDNO:5)。在本发明的另一方面中,提供了用于确定能够预测患者的预后的一组基因的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变的或野生型的P53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;根据它们预测p53突变状态能力的不同,排列所述不同表达的基因;训练排列的基因以区别出突变体的和野生型p53基因表达谱;获得包括一组能够预测p53突变状态的p53分类器;在独立的数据集中检验p53分离基因的有效性;以及评价p53分离基因对预测患者的预后的能力。在本发明的又一方面中,提供了用于预测患者的预后的计算机系统,该系统包括具有处理器和存储器的计算机,该存储器具有存储于其中的可执行的代码,通过处理器执行该代码来完成以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测P53突变状态;以及使用该组基因来预测患者的预后。在本发明的另一方面,提供了用于预测患者对疾病的易感性的诊断工具,包括能够预测p53突变状态的多个固定于固体支撑上的基因。在本发明的又一方面,还提供了用于预测患者对疾病的易感性的核酸阵列,包含固体支撑和展示于该固体支撑上的核酸探针,该探针对应于能够预测p53突变状态的基因。下面将对这些内容和实施方式进行详细叙述。定义在本申请中,除非文中明确指出有不同含义外,不定冠词和定冠词均包括复数形式。例如,术语"试剂"包括多个"试剂",并包括它们的混合物。个体并不限于人,而也可是其他的有机物,包括但不限于哺乳动物、无脊椎动物、植物、真菌、病毒、细菌或衍生自上述个体的一个或多个细胞。在此所用的术语"包含"表示"包括"的意思。术语"包含"的变异的形态也对应着相应的意思。本申请公开中,本发明的多个方面均以范围的形式进行表达。应当理解的是,以范围的形式所进行的描述仅是出于方便和简洁的考虑,而不应当理解为对本发明范围构成不可改变的限制。因此,对范围的描述应当理解为具体揭露了所有可能的子范围,例如,范围的描述是从1到6,应当理解为具体揭露了的子范围如从1到3,从1到4,从1到5,从2到4,从2到6,从3到6等,以及还包括该范围内的具体的数值点,例如l,2,3,4,5和6。这适用于各种宽度的范围。此处使用的术语"组织级"或"肿瘤级"是指根据肿瘤分级的Elston-Ellis系统进行分类的肿瘤的特征。此处使用的术语"p53状态"是指p53基因的突变状态。p53突变肿瘤在p53基因中含有突变,其改变了蛋白的功能。p53野生型肿瘤不含有在p53基因中可检测的突变。此处使用的术语"疾病特异性存活率"或DSS是对存活的评估,其中检验的终点是由于疾病,例如乳癌导致的死亡。此处使用的术语"无疾病存活率"或DFS是对存活的评估,其中检验的终点或者是肿瘤的复发(即由于远缘转移到体内的其他部位而复发癌症),或者是在没有远缘转移证据下的乳癌导致的死亡。此处使用的术语"阵列"是一群有意集聚在一起的分子,它们可通过人工合成或生物合成而制备。阵列中的分子可以相同或各自不同。阵列可采用各种形式,例如,可溶解分子文库;以及束缚到树脂小粒、硅芯片或其他固体支撑上的化合物文库。此处使用的术语"核酸文库或阵列"是一群有意集聚在一起的核酸,它们可通过人工合成或生物合成而制备,并呈现各种不同形式(例如,可溶解分子文库;束缚到树脂小粒、硅芯片或其他固体支撑上的寡核苷酸文库)。此外,术语"阵列"意在包括那些可通过在基质上定点出具有任意长度(例如,从1到约IOOO个核苷酸单体长度)的核酸而制备的核酸文库。此处使用的术语"核酸"是指具有任意长度的聚合形式的核苷酸,或是核苷酸、脱氧核苷酸、或肽核酸(PNAs),其含有嘌呤和嘧啶碱基,或其他天然的、经化学或生物化学改性的、非天然的或衍生尼古丁的核苷酸碱基。多核苷酸的主链可包含那些通常在RNA或DNA中发现的糖和磷酸基团,或经改性的或取代的糖和磷酸基团。多核苷酸可包含改性的核苷酸、例如,甲基化的核苷酸和核苷酸类似物。核苷酸的序列可被非核苷酸组分打断。因此,术语"核苷"、"核苷酸"、"脱氧核苷"和"脱氧核苷酸"通常包括诸如在此描述的类似物。这些类似物是那些具有与天然核苷或核苷酸相同结构特征的分子,因此在当整合如核酸或寡核苷酸序列中时,它们可允许与存在于溶液中的天然的核酸序列进行杂交。通常,这些类似物通过取代和/或改性碱基、核糖或磷酸二酯部分,而衍生自天然的核苷和核苷酸。这些改变可被特制用于对杂种形成进行稳定或去除稳定,或改善与理想的互补核酸序列杂交的特异性。此处使用的术语"互补"是指在核苷酸或核酸之间的杂交或碱基配对,例如,在双链DNA分子的两链之间,或在寡核苷酸引物和位于被测序或扩增的单链核酸上的引物结合部位之间。互补核苷酸通常是A和T(或A和U),或C和G。所谓的两根单链RNA或DNA分子的互补是指,当核苷酸的一根链,最好是经比对和比较,且具有适当的核苷酸插入或缺失,而与另一根链的核苷酸的至少约80%,通常至少约90%到95%,更优选为约98%到100%配对。此外,当RNA或DNA链在选择性杂交条件下与互补体进行杂交时,则存在互补性。通常,选择性杂交发生在当至少14到25个核苷酸中有至少约65%的互补性,优选为至少75%,更优选为至少90%的互补性时。此处使用的术语"片段"、"区段","DNA区段"是指较大的DNA多核苷酸的一部分或DNA。例如,多核苷酸可破裂或断裂为多个区段。本领域已有多种使核苷酸成为片段的方法。这些方法可以是例如化学的或物理的方法。化学的断裂可包括用DNA酶进行部分降解;用酸进行部分脱嘌呤化;采用限制性酶;内含子编码的核酸内切酶;基于DNA的裂解方法,例如三链体和杂种形成方法,它们依赖于核酸区段的特异性地杂交而将裂解试剂定位在核酸分子内的特定位置;或其他的在已知或未知部位裂解DNA的酶或化合物。物理的断裂方法可包括对DNA施加高剪切速率进行断裂。高剪切速率可通过如使DNA移动通过带有凹陷或长钉的空间或沟道,或者迫使DNA样品通过限制尺寸的流动通道,例如具有微米或亚微米级横截尺寸的孔。其他的物理方法包括超声波处理和雾化。这些物理的和化学的断裂方法的组合也可通过热和离子介导的水解进行。例女口,参见Sambrook等,"MolecularCloning:ALaboratoryManual,"3rdEd.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.(2001)("Sambrook等),该文所揭示的内容在此被并入本申请。这些方法可通过优化而将核酸消化到具有选择大小范围的片段。有用的大小范围可以是从100,200,400,700或1000到500,800,1500,2000,4000或10,000碱基对。但更大一些的范围内的碱基对也是有用的,例如在4000,10,000或20,000到10,000,20,000或500,000范围内的碱基对。此处使用的术语"杂交"指其中两股单链多核苷酸非共价地结合以形成稳定的双链多聚核酸的过程。术语"杂交"也指三链杂交。所得的(通常)双链多核苷酸是"杂种"。形成稳定的杂种的多核苷酸的比例在此称为"杂交度"。杂交条件通常包括低于约1M的盐浓度,更常见的是低于约500mM以及低于约200mM。杂交温度可以低到5"C,但通常高于22"C,更常见的是高于约3(TC,优选的是高于约37X:。杂交通常在严格条件下进行,即在该条件下探针将杂交到它的靶序列上。严格条件是依赖于序列的条件,在不同情况下有所不同。较长的片段可能要求更高的杂交温度以进行特异性杂交。如其他因素可影响杂交的严格性,包括碱基组成和互补链长度,有机溶剂的存在和碱基错配的程度,这些参数的组合均比单个参数的绝对影响更为重要。通常而言,严格条件选择为比在确定的离子强度和pH下的特定序列的热熔点(Tm)约低5°C。Tm(在确定的离子强度、pH和核酸组合物下)是指50%的与靶序列互补的探针在平衡条件下与靶序列杂交的温度。通常而言,严格条件包括盐浓度至少为约0.01M,但不超过lMNa离子浓度(或其他盐),且pH为7.0到8.3,温度为至少25'C。例如,5倍SSPE(750mMNaCl,50mM磷酸钠,5mMEDTA,pH7.4)以及稳定为25-30*SSPE(750mMNaCl,50mM磷酸钠,5mMEDTA,pH7.4)及一个介于25-3(TC之间的温度适合于等位基因特异性探针杂交。关于严格条件,参见Sambrook,FritscheandManiatis."MolecularCloningALaboratoryManual"2ndEd.ColdSpringHarborPress(1989),以及Anderson"NucleicAcidHybridization"1stEd"BIOSScientificPublishersLimited(1999),它们所揭示的全部内容在此被并入本申请。此处使用的术语"杂交探针"是指能够以碱基特异性方式结合到核酸互补链的核酸(例如寡核苷酸)。这样的探针包括肽核酸,如在Nielsenetal"Sd置e254:1497-1500(1991),NielsenC匿.所她c/mo/"10:71-75(1999)中描述的其他核酸类似物以及模拟核酸。此处使用的术语"mRNA"或"mRNA转录物"包括但不限于前体mRNA转录物(pre-mRNAtranscript)、转录物加工中间体、有待翻译的成熟的mRNA和基因的转录物或基因,或衍生自mRNA转录物的核酸。转录物加工可包括接合、编辑和降解。这里,衍生自mRNA转录物的核酸是指以mRNA转录物或其序列最终作为模板而合成的核酸。因此,由mRNA逆转录而得的cDNA,由cDNA转录得到的cRNA,由cDNA扩增得到的DNA,由扩增的DNA转录得到的RNA等均衍生自mRNA转录物,且对该衍生产物的检测指示出了样品中原始转录物的存在和/或充裕。因此,衍生自mRNA的样品包括但不限于基因的mRNA转录物或基因、由mRNA逆转录而得的cDNA、由cDNA转录得到的cRNA,由基因扩增得到的DNA,由扩增的DNA转录得到的RNA等。此处使用的术语"探针"是指能够被特定靶识别的分子。在一些实施方式中,探针可被表面固定。本发明中研究的探针的例子包括但不局限于,用于细胞膜受体的兴奋剂和拮抗药、毒素和毒液、病毒抗原决定基、荷尔蒙(例如,阿片样肽、类固醇等)、荷尔蒙受体、肽、酶、酶基质、辅因子、药物、凝集素、糖、寡核苷酸、核酸、寡糖、蛋白质和单克隆抗体。此处使用的术语"靶"是指对给定探针具有亲和力的分子。耙可以是天然的或人造的分子。并且它们可以直接应用,或与其他种类形成聚集体。靶可共价地或非共价地直接或通过特异性结合物质而结合到结合部分上。可应用于本发明的耙的例子包括,但不限于抗体、细胞膜受体、单克隆抗体和对特定抗原决定簇(例如,病毒、细胞或其他物质)有反应性的抗血清、药物、寡核苷酸、核酸、肽、辅因子、凝集素、糖、多糖、细胞、细胞膜和细胞器官。在本领域里,靶有时被成为抗-探针的技术。但此处使用靶并不意味着采用不同的意思。在当两个大分子可通过分子识别而形成复合物时可形成"探针靶对"。本专利或申请文件中含有至少一幅图为彩色。在请求并缴纳了必要的费用后,专利局将对含有彩色附图的本专利或专利申请公开进行处理。作为本说明书一部分的附图,显示出了本发明的实施方式,且结合说明用于解释本发明所公开的原理图1显示了用于本发明的一个公开的实施方式中的使用与p53状态最为统计相关的前250个基因的257肿瘤分级聚类。图2显示了根据本发明一个公开的实施方式的p53状态的基因分类器优化和结果。图3显示了根据本发明一个公开的实施方式的分类器中的基因可预测在独立的cDNA微阵列数据集中的p53状态。图4显示了根据本发明一个公开的实施方式的p53分类器具有比单独基于p53突变状态更为重要的预后意义。图5显示了根据本发明一个公开的实施方式的p53分类器在独立的晚期肿瘤数据集中的有力的预后意义。图6显示了根据本发明一个公开的实施方式的p53分类器具有比基于内分泌治疗患者中p53突变状态更为重要的预后意义。图7显示了根据本发明一个公开的实施方式的p53分类器对在独立的早期经局部治疗的乳癌肿瘤的远缘复发做出预后预测。图8显示了根据本发明一个公开的实施方式的p53的转录物水平,其转录靶和其上游效应物,以区分己知的和预测的类别。详细描述本发明有许多优选的实施方式,且基于许多专利、专利申请和其他的文献以提供给本领域技术人员详细说明。因此,当下文中引用或重复专利、专利申请或其他文献时,应当理解它们的全部内容均被并入本申请。下面将描述公开的用于分类、预后和诊断癌症的方法、系统和组合物。这些方法、系统和组合物提供了更为有用的体内p53功能性的测量手段,从而提供了比单独的p53突变状态更佳的患者预后指示结果。在公开的方法、系统和组合物的实施方式中,其他固有的优点将从以下描述清楚地看出。在癌症发展和进级中的p53突变可引起野生型p53等位基因的反式显形抑制,导致独立于野生型p53得p53失活或致癌功能获得。此外,p53功能的某些效应物活性的改变,包括那些直接影响p53表达的在内,可导致p53缺乏,重现p53-突变体表型。在乳癌中,这些效应显示出更迅速蔓延的肿瘤、抗疗性和差的临床结果。为了提供更有用的体内p53功能性的测量,在此揭露了"p53分类器",这是源于p53野生型与变异体肿瘤的分子构型的不同而得到的表达识别标志。该分类器可包含一定数目的基因,例如,至少3个基因。在其他实施方式中,分类器可包含从约3到约500个基因。表1列出了500个基因。在某些实施方式中,优化的p53分类器包含了32个基因(表2)。优化的32—基因的分类器可非常精确地区别p53变异体和野生型肿瘤,并能预测代表所有受治疗组中的全体的复发和存活。并且,p53分类器比起仅依靠p53突变状态而言是更为有效预测存活率的预测器,其独立于其他临床预测器的多变量的分析显著,而在这点上p53突变状态无法相比。另外,在缺少突变下的p53表达的减量调节(downregulation)足以在转录活动和临床结果中诱导突变(mt)体表型肿瘤行为。在乳癌和肝癌的独立的数据集中,不考虑其他的临床特征,优化的p53分类器的亚集可相当精确地预测p53状态。作为疾病特异性存活率(DSS)的预测器,分类器的表现远远超出p53突变状态单独在大量经混合治疗的患者,以及单独接受了手术后佐剂内分泌治疗的患者群中的表现。并且,在一项对主要包括阶段3的接受了肿瘤辅助化疗患者的cDNA微阵列研究中,9一基因的p53分类器亚集对疾病特异性存活率和无疾病存活率均是非常显著的预测器。p53分类器的基因不仅可精确地辨别出哪个患者会在化疗后复发和死亡,而且也能辨别出哪个后期患者能够存活在癌症下。分类器的21—基因的亚集也可显著地区分出在5年内会经历远缘转移的早期放射治疗的患者与那些不会经历如此遭遇的患者中的分子亚群。因此,通过对上述各方面的定义,在此描述的本发明的p53分类器、方法、系统和组合物展示出了比以往所认识到的p53对人类肿瘤行为的更重要的影响,因此提供了用于临床评价p53功能的更好的方法。在本发明的一个方面中,提供了用于预测患者的预后的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测患者的预后。预后可选自由疾病特异性存活率、无疾病存活率、肿瘤复发和治疗响应组成的组。疾病可以是任何的癌症,但优选为乳癌或肝癌。预测的p53突变状态可通过排列根据与p53突变状态、ER(雌激素受体)状态和肿瘤的组织等级相关的产生不同表达的基因而获得。多变量排列方法,例如线性模型拟和可用于排列基因。排列后的基因可在监督下学习如何区分突变体的和野生型的基因表达谱。可应用的监督学习方法的一个例子是对角线性判别分析(DLDA)。在某些实施方式中,具有预测p53突变状态能力的一组基因可包含至少3个基因,优选为约3—500个基因,最优选为约32个基因。该构成优化的p53分类器的32个基因可选自包含列在表1中的基因的组。在一些实施方式中,该32个基因可包括以下基因库登记号AI961235(SEQIDNO:23),BG271923(SEQIDNO:22),NM—002466(SEQIDNO:31),BC001651(SEQIDNO:14),D38553(SEQIDNO:11),AK000345(SEQIDNO:26),AA742697(SEQIDNO:21),AL080170(SEQIDNO:30),BF245284(SEQIDNO:27),BC004504(SEQIDNO:8),HI5261(SEQIDNO:2),NM—000909(SEQIDNO:9),NM—024843(SEQIDNO:1),R73030(SEQIDNO:29),NM—030896(SEQIDNO:17),AI435828(SEQIDNO:20),AL512727(SEQIDNO:6),AW242997(SEQIDNO:18),AI810764(SEQIDNO:24),AI922323(SEQIDNO:10),AL360204(SEQIDNO:13),NM—003225(SEQIDNO:32),NM—003226(SEQIDNO:28),AW299538(SEQIDNO:5),NM—003462(SEQIDNO:16),AI990465(SEQIDNO:25):NM—004392(SEQIDNO:15),NM—001267(SEQIDNO:7),AF269087(SEQIDNO:4),AI826437(SEQIDNO:3),AL355392(SEQIDNO:12),和AU156421(SEQIDNO:19)。本发明还提供了用于预测晚期乳癌患者的预后的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的P53基因;比较所述基因表达谱,确定哪些基因在突变的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测晚期乳癌患者的预后,其中,该组基因选自由具有以下基因库登记号的基因组成的组BG271923,NM—002466,D38553,NM—000909,NM—024843,R73030,NM—003226,AW299538和AI990465。所有基因库登记号相关的序列和SEQIDNO.示于图9-508中。本发明还提供了用于预测早期经局部治疗的乳癌患者的临床结果的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测早期经局部治疗的乳癌患者的预后,其中,该组基因选自由具有以下基因库登记号的基因组成的组AI961235,BG271923,NM—002466,BC001651,D38553,AK000345,BC004504,NM—000909,NM—024843,R73030,AI435828,AI810764,AI922323,NM—003225,NM—003226,AW299538,NM—003462,AI990465,NM_004392,NM—001267和AI826437。本发明还提供了用于预测肝癌患者的临床结果的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测肝癌患者的预后,其中,该组基因选自由具有以下基因库登记号的基因组成的组NM—002466,BC001651,D38553,NM—024843,AI435828,AI810764,NM—003226和AW299538。在本发明又提供了用于确定能够预测患者的预后的一组基因的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的P53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;根据它们预测P53突变状态能力的不同,排列所述不同表达的基因;训练排列的基因以区别出突变体的和野生型p53基因表达谱;获得包括一组能够预测p53突变状态的基因的p53分类器;在独立的数据集中检验p53器的有效性;以及评价p53器对预测患者的预后的能力。在上述公开的用于确认患者预后的一组基因方法中,不同表达的基因可根据它们与p53状态、ER(雌激素受体)状态和肿瘤的组织等级的关系而通过多变量排列法进行排列。多变量排列方法可以是线性模型拟和或其他本领域人员掌握的方法。训练的步骤可包括采用监督学习方法,例如对角线性判别分析(DLDA)或其他本领域人员掌握的监督学习方法。上述揭露的p53分类器可包含至少3个基因,优选为约3_500个基因,最优选为约32个基因。该32—基因的p53分类器是"优化的分类器",其可包括选自由以下基因库登记号组成的组AI961235,BG271923,固—002466,BC001651,D38553,AK000345,AA742697,AL080170,BF245284,BC004504,H15261,NM—000909,NM一024843,R73030,NM—030896,AI435828,AL512727,AW242997,AI810764,AI922323,AL360204,NM—003225,NM—003226,AW299538,NM—003462,AI990465,NM—004392,NM—001267,AF269087,AI826437,AL355392和AU156421。预后可选择由疾病特异性存活率、无疾病存活率、肿瘤复发和治疗响应组成的组。在一揭露的实施方式中,9一基因部分分类器可预测晚期乳癌患者的临床结果。该9一基因部分分类器可包括选自由以下基因库登记号组成的组BG271923,NM—002466,D38553,NM—000909,NM—024843,R73030,NM_003226,AW299538和AI990465。另一揭露的实施方式中,21—基因部分分类器可预测早期经局部治疗的乳癌患者的临床结果。该21—基因部分分类器可包括选自由以下基因库登记号组成的组AI961235,BG271923,NM—002466,BC001651,D38553,AK000345,BC004504,NM—000909,NM_024843,R73030,AI435828,AI810764,AI922323,NM_003225,NM—003226,AW299538,NM—003462,AI990465,NM_004392,NM—001267和AI826437。在另一揭露的实施方式中,8—基因部分分类器可预测肝癌患者的临床结果。该8—基因部分分类器可包括选自由以下基因库登记号组成的组NM—002466,BC001651,D38553,NM—024843,AI435828,AI810764,NM—003226和AW299538。本发明还提供了用于预测患者的预后的计算机系统,该系统包括具有处理器和存储器的计算机,该存储器具有存储于其中的可执行的代码,通过处理器执行该代码来完成以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测患者的预后。本发明还提供了用于预测患者对疾病的易感性的诊断工具,包括能够预测p53突变状态的多个固定于固体支撑上的基因。该固体支撑可以是例如微阵列。在一个实施方式中,固定在固体支撑上的多个基因可包括由以下基因库登记号组成的组AI961235,BG271923,NM—002466,BC001651,D38553,AK000345,AA742697,AL080170,BF245284,BC004504,HI5261,NM—000909,NM—024843,R73030,NM_030896,AI435828,AL512727,AW242997,AI810764,AI922323,AL360204,NM—003225,NM—003226,AW299538,NM—003462,AI990465,NM_004392,NM—001267,AF269087,AI826437,AL355392和AU156421。在另一实施方式中,固定在固体支撑上的多个基因可包括由以下基因库登记号组成的组BG271923,NM—002466,D38553,NM—000909,NM—024843,R73030,NM—003226,AW299538和AI990465。在又一实施方式中,固定在固体支撑上的多个基因可包括由以下基因库登记号组成的组AI961235,BG271923,NM—002466,BC001651,D38553,AK000345,BC004504,NM—000909,NM—024843,R73030,AI435828,AI810764,AI1922323,NM—003225,NM—003226,AW299538,NM_003462,AI990465,NM—004392,NM_001267和AI826437。在再一实施方式中,固定在固体支撑上的多个基因可包括由以下基因库登记号组成的组NM_002466,BC001651,D38553,NM—024843,AI435828,AI810764,NM—003226和AW299538。本发明还提供了用于预测患者对疾病的易感性的核酸阵列,包含固体支撑和展示于该固体支撑上的核酸探针,该探针对应于能够预测p53突变状态的基因。该核酸阵列可包含至少8,32,100,250或500个核酸探针。因此,上述公开的方法、系统和组合物能够从p53—给予的乳癌肿瘤中区别出p53—缺乏的乳癌肿瘤,并且在其他癌症类型中也可有效地测量p53活性。14%的在DNA序列水平上为p53野生型的乳癌肿瘤可能通过其他方式而产生p53的缺乏。另外,分类器是在各种乳癌人群中的疾病特异性存活率和复发的明显的预测器,因此,在预测这些终点时将具有临床应用性,特别是在那些主要作用于依赖p53的细胞死亡途径的治疗试剂的情况下尤为有用。实施例p53变异体的与p53野生型的分子构型是截然不同。为了进一步观察p53变异体(mt)和p53野生型(wt)乳癌肿瘤之间的分子差异,使用高密度寡核苷酸微阵列来分析基于整体的一系列257活组织检査,所有的这些都事先进行了p53编码区域内的变异测序。(Bergh,J.,Norberg,T"Sjogren,S.,Lindgren,A.&Holmberg,LCompletesequencingofthep53geneprovidesprognosticinformationinbreastcancerpatients,particularlyinrelationtoadjuvantsystemictherapyandradiotherapy.MzZMMl,1029-34(1995),该文内容在此并入本公开文件。原来的患者治疗包括了新鲜冷冻的乳癌肿瘤,其来自基于315名妇女的全体,她们代表了65%的在Uppsala镇从1987年1月1日至lj1989年12月31日期间内切除的所有乳癌(Bergh等,前面己并入本公开)。手术后,将新鲜肿瘤的活部分切割成两部分;一部分立即在异丙垸中进行冷冻,并储存在-7(TC下,待分析用。另一部分用10Q/^的福尔马林固定,并备组织病理检查用。冷冻的肿瘤组织采集自原来的315名患者中的299个。除此之外,270个样品具有足够数量和质量的RNA用以进行微阵列实验,在实施Affymetrix质量监控后,对260个肿瘤的表达谱作了进一步分析。本研究得到KarolinskaInstitute的伦理委员会的认可。p53基因(TP53)的突变分析己按Bergh等(前面已并入本公开文件)所描述在原来的315个肿瘤中进行。在本研究中包含的260个肿瘤中,通过cDNA序列分析内显子2到11,发现有59个具有p53突变(Bergh等,前面己并入本公开文件)。在3个样品中,p53状态无法评价。临床病理的特征通过患者记录和诊断时的常规临床测量获得。雌性激素受体状态通过作为常规临床方法一部分的配体结合测试确定。经由有经验的病理学家确定肿瘤的Elston-Ellis等级,将肿瘤划分微低、中和高等级的月中瘤(Elston,C.W.&Ellis,I.0.Pathologicalprognosticfactorsinbreastcancer.I,Thevalueofhistologicalgradeinbreastcancer:experiencefromalargestudywithlong-termfollow-up.//^to/fl^zo/ogy19,403-10(1991),lt匕文内容在此并入本公开)。在这些260个患者中,有84名中发现有腋窝淋巴结转移,另外166名显示结阴性。10名患者产生未知的结状态,因此,由于其年纪或伴随的严重疾病,未对他们进行腋窝检査。对所有呈结阳性的患者提供佐药治疗。通常,对停经前的妇女提供化疗,停经后的妇女接受内分泌治疗。在260名参与本研究的患者中,有149名没有接受佐药治疗。患者的总的存活率是基于瑞典人口登记的信息,而死亡原因和日期来自1999年末对患者记录的回顾结果。在AffymetrixU133A和U133B阵列上分析已知含p53突变而导致了氨基酸水平的改变的59个肿瘤的RNA,以及已知具有野生型p53的198个肿瘤的RNA。使用QiagenRNeasyMiniKit(Qiagen,德国)进行总RNA提取。将冷冻的肿瘤切成小片,并在含有RLT缓冲液(RNeasy溶解缓冲液)的试管(最多为40mg/试管)中用巯基乙醇匀浆约30-40秒,然后用蛋白酶K在55。C处理混合物10分钟。这种做法在先前的RNA提取中提高了RNA产率(Egyhazi,S.etal.ProteinaseKaddedtotheextractionproceduremarkedlyincreasesRNAyieldfromprimarybreasttumorsforuseinmicroarraystudies.C//wC&m50,975-6(2004)此文内容在此并入本公开文件)。在接下来的在RNeasy柱上的浓縮步骤中,也包括了采用DNase处理来提高RNA的质量。完整的RNA提取物在Agilent2100Bioanalyzer(AgilentTechnologies,Rockville,Md.,U.S.A)上进行测试,测量28S:18S的核糖体的RNA比率。将高质量的RNA提取物储存在-7(TC,待微阵列分析用。根据Affymetrix方案(AffymetrixInc.,SantaClara,Calif"U.S.A),进行体外转录(IVT)产物(即靶)的制备、寡核苷酸阵列的杂交和扫描。使用T7-连接的寡-dT引物,从其起始量的2—5pg总RNA合成cDNA的第一链,然后合成第二链。使用苯酚/氯仿提取和相隔离凝胶纯化的双链cDNA。从cDNA模板通过IVT反应制备生物素化的cRNA靶。标记的cRNA耙使用QiagenRNeasyMiniKit进行纯化,然后再进行化学断裂化。10吗的经断裂的生物素化的cRNA被杂交到Affymetrix寡核苷酸人类阵列HG-U133A和B中,其含有45,000个探针组,代表了来自约33,000个经很好证实了的人类基因的超过39,000个转录物。杂交在杂交炉中于45t:进行,且以60rpm的速度旋转16小时。将阵列洗净,并用根据Affymetrix方案,用FluidicsStation400(AffymetrixInc.,SantaClara,Calif"U.S.A)染色。采用链霉亲和素-藻红蛋白(SAPE,最终浓度为10pg/ml)进行染色,用生物素化的抗链霉亲和素抗体以及第二次SAPE染色进行识别标志扩增。根据厂商说明,对阵列进行清洗和扫描。用MicroarraySuite5.0软件(AffymetrixInc.,SantaClara,Calif.,U.S.A)对原始表达数据进行处理,并用总体平均法进行归一。对于每个微阵列,探针组信号的值通过调整平均对数强度到靶信号值500而进行测量。产生最适度以下的平均信号强度的样品被重新标记,并在新的阵列上重新杂交。如果微阵列有明显瑕疵,则在新的芯片上使用相同的断裂的探针对样品进行重新杂交,或者,如果缺陷区域很小,则受影响的探针经检测后用于后续分析。来自U133A和B芯片的归一化的表达数据被结合,并转换为自然对数。首先调査基因表达模式可区别p53的mt和wt肿瘤的程度。通过魏克森等级和检验(Wilcoxonrank-sumtest),确认了代表约2,770个不同基因(根据UniGenebuild#167)的3,330个Affymetrix探针,它们的表达模式能够区别p53的mt和wt肿瘤,假发现率(FDR)-调整的p值为p<0.001。这些基因中的许多被发现是己知的p53的转录靶,包括PERP,RRM2,SEMA3B,TAP1,GTSE1,CHECK1,禾口CHEK2。图1示出了使用前250个基因进行的分级聚类分析的结果,所有结果均与p53状态相关,其FDRp〈5.9x10—8。从基因选择的条件可预期,p53mt和wt肿瘤中的绝大多数聚类成分离的肿瘤组。在两个支配的聚类结中,在一个聚类中发现了90X的p53突变体(即"突变体样"聚类),而p53wt肿瘤中的77%被其他("野生型样"聚类)隔离。然后调查基因表达谱的分级结构。在肿瘤中,主要观察到两种聚类一种由约200个基因组成,在突变体样肿瘤聚类中高度表达,另一种代表约50个基因,在野生型聚类中更高度表达。前者中,与p53突变状态最为高度相关的基因与细胞周期进程相关,这些与细胞周期进程相关的基因包括CDC2,CDC20,CCNB1,CCNB2,CKS2,CDCA1,CDCA3,CDCA8,CENPA,T0P2A,PTTG1和MCM6。这项发现与wtp53对细胞周期基因具有负调控的效果的发现一致。在更高度在野生型样聚类中表达的基因中,观察到了若干雌性激素调节的和ER状态相关的基因,包括STC2,NC0R1和ADRA2A。对肿瘤的进一步检査揭示了,除了p53状态外,主要的肿瘤聚类还与其他临床特征,即雌性激素受体(ER)状态和肿瘤等级相关。细胞的雌性激素受体状态被发现与许多情况下的癌症相关。正常的乳房细胞通常具有雌性激素的受体。然而,乳房中的癌细胞不总是具有雌性激素的受体。具有雌性激素的受体的乳癌被称为"雌性激素受体阳性",而不具有雌性激素的受体的乳癌被称为"雌性激素受体阴性"。在雌性激素受体阳性的癌症中,癌细胞的生成受雌性激素的控制。相反,雌性激素受体阴性的癌症细胞的生长不受雌性激素的控制。图1示出了使用与p53状态最为统计相关的前250个基因的257个肿瘤分级聚类。肿瘤示于列中,基因示于行中。色彩饱和度反应了对数表达信号的程度;红色色调表示较高的表达水平,绿色色调指示出较低的表达水平。顶行的黑色竖条指示出哪个肿瘤具有p53突变。第二行的竖条指示出为ER阳性的肿瘤。第三行的竖条反映出组织等级(Elston-Ellis分级系统);绿条=1级,蓝条=11级,红条二III级。观察到了由突变体样的聚类产生的分离,86%的雌性激素受体阴性(ER-)肿瘤(pes=l7xlO—1Q),96%的111级肿瘤(pcs=2.5xl0—19),仅有3%的1级肿瘤(pfe=6.9xl0—15)。该结果部分归因于本研究中的p53突变体与ER阴性(pcs=1.7xl0-6)和m状态(p^l.2x10—11)正相关,且与以前的关于证明p53突变体乳癌与阴性ER状态和较高的肿瘤等级高度相关的报道一致。例如,可参见Cattoretti,G.,Rilke,F.,Andreola,S.,D'Amato,L.&Delia,D.P53expressioninbreastcancer,/"f/Cancer41,178-83(1988);Isola,J.,Visakorpi,T.,Holli,K.&Kallioniemi,O.RAssociationofoverexpressionoftumorsuppressorproteinp53withrapidcellproliferationandpoorprognosisinnode-negativebreastcancerpatients./池,/Qzwcer/似/84,1109-14(1992);Andersen,T.I.etal.PrognosticsignificanceofTP53alterationsinbreastcarcinoma.BrJCancer68,540-8(1993)andBhargava,V.etal.Theassociationofp53immunopositivitywithtumorproliferationandotherprognosticindicatorsinbreastcancer.A/od尸aAo/7,361-8(1994)。这些文章的内容均在此并入本公开文件。然而,在突变体样聚类中的p53wt肿瘤中,也观察到了相当程度的超表达的ER-(pcs=2.0xl0-6)和III级肿瘤(P^7.1x10—11)。因此,通过单变量统计分析,与p53状态高度相关的大量基因被确认不但能够在与p53状态相关的方式下隔离肿瘤,而且还可在与组织等级和ER状态相关的方式下隔离肿瘤。实施例2预测p53缺乏的基因表达分类器一部分p53wt肿瘤会与大部分p53突变体聚类在一起的发现表明这些肿瘤事实上可能通过除p53突变以外的机制而出现p53缺乏。相反,发现具有分子构型与多数wt肿瘤类似的p53突变体表明这些肿瘤可能实施上表达为功能完好的p53。但是本研究中分配的肿瘤组是基于通过单变量排列过程选择出的基因,并不能说明p53状态与ER和等级状态的关联。这就产生了这样一种可能,在某种程度上,所选的基因包括那些绝大部分是有级别的和/活ER相关的,从而可能使肿瘤偏向着这些除p53状态以外的本身的性能方面产生聚类。因此,用于预测p53状态的有力的基于基因表达的分类器可通过设计一预测模型而开发。该模型包括在独立于组织等级和ER状态之下,用已知为线性模型拟和(LMF)的多变数线性回归方法来排列p53状态相关的基因。图2示出了用于p53状态的基于基因的分类器的优化及其结果。对角线性判别分析(DLDA)被用于指导p53状态的监督学习,并使用线性模型拟和法排序的基因表达谱。(A):分析由魏克森等级和检验(Wilcoxonmnk-sumtest)或线性模型拟和排列的等级/雌性激素受体(ER)-相关基因和p53—相关基因之间的重叠。热图表明了在100—基因贮藏室(行),且也与p53状态(列;在50—基因贮藏室排列)相关的与肿瘤等级(热图上部)或ER状态(热图下部)相关的基因的数目;p53相关基因用LMF:线性模型拟和或WR二魏克森等级和(Wilcoxonrank-sum)排列;等级相关的基因通过KW=Kruskal-Wallis排列,ER相关的基因用WR排列。(B):用分类器的精确性对用于构造分类器的基因的数目的函数进行作图;优选的分类器由32个基因构成,且错误地分类了40个肿瘤。(C):采用留出-交叉验证法(leave-one-outcrossvalidation)将分类器的结果应用到Uppsala数据集(257个肿瘤)。图中示出了Unigene标记(build#167)、基因库登记号和Affymetrix探针IDs(A.=U133A;B.=U133B)。对于基因选择,用线性模型配合基因表达数据,采用表达水平作为响应,并以p53状态、ER状态和等级状态作为预测器的变量。为将与预测器的变量未发生良好关联的基因移除,首先排除具有p值拟和大于0.001的基因。再使用ER和等级作为额外的预测器,从而滤去那些表达模式可由ER或等级状态解释的基因。运用LMF排列步骤,比起用单变数魏克森等级和检验(Wilcoxonrank-sumtest)(WR)方法,可显著降低许多已知的细胞周期调控基因的名次,从而表明这些基因最好是用高等级进行解释,而不是用p53状态进行解释(图2A,上盘)。相反的,观察到的通过LMF,ER相关的基因向上移动到排列靠上的p53相关的基因,这有可能是因为它们用WR得到的较低的排列是出自大量的更高等级相关的基因(图2A,下盘)。为了进行类的预测,基因根据p53状态参数的绝对值进行将次排列。为了构建分类器,采用了最大可能性方法的变体,DLDA(对角线性判别分析)。这在先前已应用于类的确定问题,并使用了微阵列的数据,描述在如Dudoit,S.,Frilyand,J.&Speed,T.P.Comparisonofdiscriminationmethodsfortheclassificationoftumorsusinggeneexpressiondata.Jow"a/o/Xmen'c朋5teto"cfl/爿^oda"ow97,77-87(2002)中,该文内容并入本公开文件。通过留出-交叉验证法选出具有最大分类精确度的预测器基因。图2B中绘出了分类器的精确度作为其所包含的基因数目的函数。特别值得注意的是,观察到的肿瘤分类器的精确度是高度稳定,无论分类器含有7个基因或500基因,仅有2.7%(即7个肿瘤)的变动。500—基因分类器中的基因示于下表1中。但优化的分类器是具有32个基因(表2),有40个肿瘤(15.6%)是错误分类的。28个的wt肿瘤(14%)被分为突变体样,而12个突变体(20%)被错分为野生型样(图2C)。表l<table>tableseeoriginaldocumentpage32</column></row><table><table>tableseeoriginaldocumentpage33</column></row><table><table>tableseeoriginaldocumentpage34</column></row><table><table>tableseeoriginaldocumentpage35</column></row><table><table>tableseeoriginaldocumentpage36</column></row><table><table>tableseeoriginaldocumentpage37</column></row><table><table>tableseeoriginaldocumentpage38</column></row><table><table>tableseeoriginaldocumentpage39</column></row><table><table>tableseeoriginaldocumentpage40</column></row><table><table>tableseeoriginaldocumentpage41</column></row><table><table>tableseeoriginaldocumentpage42</column></row><table><table>tableseeoriginaldocumentpage43</column></row><table><table>tableseeoriginaldocumentpage44</column></row><table><table>tableseeoriginaldocumentpage45</column></row><table><table>tableseeoriginaldocumentpage46</column></row><table><table>tableseeoriginaldocumentpage47</column></row><table><table>tableseeoriginaldocumentpage48</column></row><table><table>tableseeoriginaldocumentpage49</column></row><table><table>tableseeoriginaldocumentpage50</column></row><table><table>tableseeoriginaldocumentpage51</column></row><table><table>tableseeoriginaldocumentpage52</column></row><table><table>tableseeoriginaldocumentpage53</column></row><table>500—基因分类器基因根据它们与p53状态的相关性排序。基因由它们的基因库登记号、Affymetrix探针选集IDs、UnigeneIDs、Unigene名称和Unigeng{戈号表示。表l中描述的基因的序列和SEQIDNOs见图9-508,其中,上述基因的各个序列均示出,且与基因库登记号,UnigeneID,和/或Unigene名称和SEQIDNO相关。实施例3p53分类器在两项独立数据集中具有显著的精确性对p53分类器在独立数据集中的表现进行了评价。图3示出了分类器的基因可预测独立cDNA微阵列数据集中的p53状态。(A)32-基因分类器的9-基因亚集可预测独立的乳癌数据集中的p53的状态。对我们的分类器中的9个基因的选择是基于它们出现在50%或更多的肿瘤中。用于分析的肿瘤需要具有对>50%的基因具有表达数据。(B)p53分类器的8-基因亚集可预测独立的肝癌数据集中的p53的状态。8个重叠基因的选择是基于它们出现在90%或更多的肿瘤中。用于分析的肿瘤需要具有对〉50%的基因具有表达数据。(A和B)黑色竖条指示出p53突变状态。列出了基因标记(Unigenebuild#167)和相应的图像克隆IDs(IMAGEcloneIDs)(来自原来研究)。分级聚类图示于图中。基因(行)和肿瘤(列)是聚类的。在肿瘤树状图中,绿色分支代表了野生型样的构型,红色分支代表了突变体样的谱。因此,进入两个公共微阵列数据集,其中p5状态是已知的。一个是Sorlie等的乳癌石开究(Sorlie,T.etal.Repeatedobservationofbreasttumorsubtypesinindependentgeneexpressiondatasets.iVocAto/Jcac/C/S^100,8418-23(2003),它的内容并入本公开文件),另一个是Chen等的肝癌研究(Chen,X.etal.Geneexpressionpatternsinhumanlivercancers.Mo/历o/CW/13,1929-39(2002),它们的内容并入本公开文件)。两项研究均是在cDNA微阵列平台上进行的。在Sorlie的数据集中,69个乳癌肿瘤对p53突变进行了测序。对该肿瘤亚集的表达数据的存在对应于分类器的基因的基因有疑问。分类器中的28个基因对应到UniGeneIDs中(build#167)。尽管超过半数的这些基因对应到Sorlie等的微阵列,一部分基因在大部分肿瘤中被表达,一些肿瘤对少于半数的基因具有测量。分类器中仅有9个基因被发现对应于cDNA探针(代表9个不同的基因),它们在>50%的肿瘤中具有表达测量,其中,肿瘤具有对>50%的基因的测量(导致44个完好抽样肿瘤的亚集)。将分类器的该9-基因亚集应用到肿瘤的分级聚类(图3A),77。/。的p53mt肿瘤聚类为一个分支,和77%的野生型聚类为另一个分支(pcs=3.0x10—4),重演了分类器的有力的预测能力。接下来分析基于cDNA-微阵列的肝癌数据集,其中,p53状态通过免疫组织化学进行确定,IHC(Chen,X.etal.Geneexpressionpatternsinhumanlivercancers.Mo/5!'o/Ce〃13,1929-39(2002),其内容并入本公开文件)。在该项研究中,p53蛋白水平有IHC确定。这里,8个分类器基因可对应到所有59个用于分析p53状态的肿瘤(每个基因在90%或更多肿瘤中具有数据显示,且每个肿瘤含有>50%的基因的数据)。通过在乳癌数据集中显示的类似的统计显著性(即p^3.5xl(T4),该分类器的8-基因亚集可将HCC样品聚类成两组主要的与p53状态相关的聚类在一个聚类中含87%的突变体,在另一聚类中含61%的野生型(图犯)。总而言之,观察到的这些结果表明含有p53分类器的基因不仅可根据p53状态分析乳癌肿瘤,并且还可对肝癌进行分析,从而在预测p53状态在其他癌症类型中具有广泛应用性。表2<table>tableseeoriginaldocumentpage55</column></row><table><table>tableseeoriginaldocumentpage56</column></row><table>优化的32-基因p53分类器基因由它们的基因库登记号、Afifymetrix探针选集IDs、UnigeneIDs、Unigene名称和Unigeng代号表示。实施例4p53分类器比起仅p53突变状态,是对患者更好的预后指示器p53状态对乳癌和其他肿瘤类型中的临床结果的预后,例如肿瘤复发、患者存活率和治疗响应,已被人们所广泛认同。假设一基于p53活性的分类器比单独的p53突变状态作为对临床结果的预后指示器方面具有更佳表现,对此进行了测试。图4示出了p53分类器比单独的p53突变状态具有更好的预后作用。Kaplan-Meier存活曲线示出了根据(A)p53突变状态、(B禾卩C)p53分类器,或(D)两者而分类的患者。临床终点为由乳癌导致的死亡(即,疾病特异性存活率)。在A,B和D中,对所有的257名患者进行了检验;在C中仅对198名有p53野生型肿瘤的患者进行了检验。采用沃尔德检验(pw)来检验风险比(HR)的显著性。将分类器和序列级p53突变状态与它们预测疾病特异性存活率(DSS)的能力进行比较。这是在Uppsala的所有257名患者中迸行的,而不考虑治疗类型或临床阶段。使用p53分类器来隔离患者所产生的风险比的显著性比由单独p53突变状态产生的要高出一个量级(分别是pw=0.00057对比pw=0.012)(图4A和B);值得注意的是,该改进的p-值在pme=0.0046是具有统计显著性。另外,p53分类器还可将由198名妇女组成的亚集中的患者显著地隔离成低风险组和高风险组,这在其后通过测序确认,她们具有野生型p53(pw=0.016)(图4C),表明那些具有p53wt肿瘤的患者被分类为突变体样,比那些具有wt样分类的wt肿瘤的患者具有更差的DSS。在图4D中,对所有4组肿瘤亚组的存活曲线做了比较。值得注意的是,观察到具有p53mt或wt肿瘤被划分为mt样(分别为绿色和蓝色曲线)的患者具有类似的存活曲线,而具有p53mt肿瘤(红色曲线)的12个患者显示出的存活曲线落在突变体样p53mt肿瘤(绿色曲线)和具有wt样p53wt肿瘤(黑色曲线)的组之间,且与两条曲线没有显著区别(对mt/mt样比较,pw=0.47,对wt/wt样比较,pw=0.37)。下面检验分类器对Sortie等的cDNA微阵列数据集的预后效果(Sorlie,T.etal.Repeatedobservationofbreasttumorsubtypesinindependentgeneexpressiondatasets./Voc_/V^/爿cadt/51爿100,8418-23(2003),它的内容并入本公开文件)。图5显示了p53分类器在晚期肿瘤的独立数据集中具有强大的预后效果。肿瘤根据在图3中描述的9-基因部分分类器进行分级划分,并分析它们与存活结果的相关性(A)来自Sortie等的数据集的76个肿瘤的分级聚类图;肿瘤聚类图中的黑色分支代表野生型样的构型,红色分支代表突变体样的谱。所示的是Kaplan-Meier对(B)疾病特异性存活率和(C)无疾病存活率的估计,其中,患者组根据肿瘤聚类图(A)中的绿色和红色分支确定。这里,可以77%的精确度分辨nit和wt肿瘤的9-基因部分分类器被用于对76个取样完好的肿瘤样品根据患者存活信息进行分级聚类(图5A)。重要的是,这些肿瘤中的绝大部分(>80%)来自两项独立的阶段ni的有局部晚期乳癌(T3/T4和/或N2)患者的化疗反应的前瞻性研究。肿瘤聚类成两个主要的分支,有31个肿瘤在wt样的聚类中,44个肿瘤在突变体的样聚类中。根据这些肿瘤谱对患者进行分组,在这群患者中,Kaplan-Meier疾病特异性存活率和无疾病存活率的存活曲线(图5B和C)均具有高度的显著性(pw=0.00008(DSS)和p,0.00005(DFS))。值得注意的,在p53wt样聚类中有31名患者显示出90%的7年乳癌存活机率,而在p53mt样组中有44名患者有35%的7年乳癌存活机率(图5B)。因此,在该主要阶段III患者全体中,部分分类器不仅可精确地预测哪些患者将会复发和死亡,并且还可预测哪个晚期患者将存活在他们的癌症下。对于分级聚类分析,采用对数表达值是平均的居中和归一化的值。基因和肿瘤采用皮尔森相关度量和平均连锁法(Pearsoncorrelationmetricandaveragelinkage)进《亍聚类(ClusterandTreeViewsoftwarecourtesyDr.MichaelEisen;软件可由LawrenceBerkeleyNationalLaboratory,UCBerkeley的网站获得)。对于存活分析,根据p53分类器输出,或在一种情况下,根据p53突变状态,对患者进行分级。采用KaplanMeier估计来计算不同患者组中的存活曲线,采用沃尔德检验来评价所得风险比的统计显著性。图4的存活分析检验了仅由机率决定的可能的获取比起单独使用p53状态(盘A)的p=0.012更为显著的、使用通过p53分类器(盘B)确定的团队任务而产生的沃尔德p值,其为0.00057。在IOO,OOO次重复运行下,任意选择了40个肿瘤(即在盘A和B之间的团队任务不同的肿瘤的数目),它们的p53状态倒转,且每次允许都计算沃尔德p-值。仅有564次获得了^).00057的p-值。对此的蒙特卡洛(M^eOzr/o)p-值估计为0.0046。为进行结合检验(即确定在两个或多个组中观察到的事件数目的显著性),采用卡方检验(Chi-squaretest)。当事件的数目在任何种类中都非常小(<5)时,用费雪精确检验(Fisher'sExacttest)代替卡方检验。为了对p53下游靶基因和上游效应物的表达水平进行统计分析,进行双侧双组T检验,以确定在p53wt和mt肿瘤之间的特异表达的基因(图8)。进行单侧双组T检验来比较在mt样分类中的p53wt肿瘤和在wt样分类中的p53wt肿瘤(和反之亦然),检验基因是否在相同方向(或相反方向)有与在p53野生型和突变体中观察到的显著不同的表达。对于本领域技术人员而言,本发明的方法的实施方式并不局限于在此公开的统计方法。本发明的实施方式包含了与之等同的分析方法。在此使用的p-值的縮写包括pwr=魏克森等级和检验(Wilcoxonrank-sumtest)p广T检验(Ttest)Pcs=卡方检验(Chi-squaretest)Pfe=费雪精确检验(Fisher'sExacttest)pw=沃尔德检验(Waldtest)pmc=蒙特卡罗4古计(MonteCarloestimate)在具有已知转录起始点(TSS)的各分类器基因上进行p53结合部位的启动子分析。用BEARR(Vega,V.B.,Bangarusamy,D.K.,Miller,L.D.,Liu,E.T.&Lin,C.Y.BEARR:BatchExtractionandAnalysisofcis-RegulatoryRegions.iVwc/。.cWas32,W257-60(2004),它的内容并入本公开文件)提取启动子序列(从TSS的3000bp上游到500bp下游),并用由TRANSFAC((Kel,A.E.etal.MATCH:AtoolforsearchingtranscriptionfactorbindingsitesinDNAsequences.M/c/ez'c爿c/^s31,3576-9(2003),它的内容并入本公开文件)第6版、(矩阵编号M00272)、基于规范的p53结合位点一致序列5'-RRRCWWGYYYN(0-13)RRRCWWGYYY-3'的简单模式搜索(el-Deiry,W.S.,Kern,S.E.,Pietenpol,J.A.,Kinzler,K.W.&Vogelstein,B,Definitionofaconsensusbindingsiteforp53.Gewd1,45-9(1992),它的内容并入本公开文件)得到的p53位置权重矩阵预测假定的结合部位。实施例5p53-缺乏的分类器(非单独p53状态)在内分泌治疗患者中与结果有显著相关为了进一步检验分类器在患者预后方面的能力,对它在其他相关治疗处理组中的表现进行了分析。最近观察到p53mt乳癌肿瘤表现出比p53wt肿瘤对内分泌疗法更强的抗药性,而对此的部分解释是在抗性的肿瘤中的p53依赖性凋亡的偶联(Bems,E.M.etal.CompletesequencingofTP53predictspoorresponsetosystemictherapyofadvancedbreastcancer.Cancerito60,2155-62(2000),它的内容在此并入本公开文件)。为了检验分类器对荷尔蒙疗法特异性患者群中的结果的预测的能力,对由仅接受了手术后佐剂三苯氧胺治疗的68个ER+的患者组成的Uppsala群的亚群进行了检验。图6示出了p53分类器具有比p53突变状态在经内分泌治疗的患者中更好的预后显著性。68个ER+的经内分泌治疗的患者根据(A)p53突变状态或(B)p53分类器进行分类,并分析了疾病特异性存活率(DSS)。示出了Kaplan-Meier存活评价。如图6A和B中所示的存活分析所示,分类器对疾病特异性存活率有显著预报(pw=0.047),而p53突变状态单独没有(pw=0.395)。接下来,对由van'tVeer等(van'tVeer,L.J.etal.Geneexpressionprofilingpredictsclinicaloutcomeofbreastcancer.A^wre415,530-6(2002),它的内容在此并入本公开文件)公开的分类器在97个乳癌肿瘤上的预后表现进行检验。图7示出了p53在独立的早期经局部处理的乳癌肿瘤中对远缘复发有预后作用。使用对应于优化的分类器的21个基因的探针集,对早期患者手术后经佐剂放疗并经过了至少5年进行分级聚类。用彩色和"C"称号(即C1-C5)区分主要的聚类结。黑色箭头对应于5年内发生了远缘转移(DM)的患者的肿瘤。基因符号和相应的基因库登记号有示出。分级聚类如上文所述进行。这里,所有样品都经控制获得临床一致性,即大小〈5cm(Tl/T2),没有进展的疾病(pNO),均来自诊断时年纪小于55岁、手术后仅经放疗治疗的患者(只有5个病人例外,接受了佐剂体治疗)。通过32-基因分类器,对应于21个基因的24个探针可对应到所有的具有存活信息的97个肿瘤上。肿瘤经聚类后,观察到了具有相似平均距离相关的约4个聚类,它们可显著区别出可能在5年内远缘转移的患者(pfe=2.2xl0—4)(图7)。值得注意的是,聚类l中的26个具有p53mt样肿瘤的分子构型的肿瘤有73%在5年内发生远缘转移,而在聚类3中的39个与p53wt样分子构型最为接近的肿瘤中则有26%在5年内发生远缘转移。这些发现表明p53分类器对早期经局部治疗的乳癌的肿瘤复发有预后作用。实施例6分类器基因功能分析为了获得一些对机制性的认识,对分类器基因的功能评价进行了分析,以期望找到解释它们的表达水平和p53状态和患者预后之间的关联性。令人吃惊的是,发现分类器基因均不是已知的p53的转录靶,且它们也未出现在p53途径上。对具有确定的启动区的启动子分析揭露了在任何的启动子中,均无规范的p53结合部位或最近描述的新的p53结合位点的证据。12个基因具有未知的功能。但对于特征基因,均有一数字与细胞生长和增殖(MYBL2,TFF1,BRRN1,CHAD,SCGB3A1,DACH,CDCA8)、转录(LAF4,NY-BR-1,DACH,MYBL2)、离子传递(CACNG4,CYBRD1,LRP2)、和乳癌生物学(SCGB3A1,TFF1,STC2,NY-BR-1,AGR2)相关。经推测,这些基因中的某些可能能在机制性上与p53突变体样肿瘤的不理想的预后有关。例如,在p53突变体样肿瘤中观察到的为增量调节的MYBL2是与c-MYB致癌基因密切相关的生长促进转录因子。其对应到频繁地在乳癌中扩增的染色体区域(20ql3),且先前被报道在乳癌细胞线禾口散发性卵巢癌中有过度表达(Forozan,F.etal.Comparativegenomichybridizationanalysisof38breastcancerceMlines:abasisforinterpretingcomplementaryDNAmicroarraydata.GawcerAm60,4519-25(2000)禾口Tanner,M.M.etal.Frequentamplificationofchromosomalregion20ql2-ql3inovariancancer.C//"Oz"cer7^6,1833-9(2000),它们的内容在此并入本公开文件)。在p53突变体样肿瘤中观察到为减量调节的SCGB3A1(HIN1)是假定的肿瘤抑制基因,其可抑制过度表达时乳癌细胞生长,且还发现通过其启动子在早期乳癌肿瘤发生的超甲基化作用而转录沉默(Krop,I.E.etal.HIN-1,aputativecytokinehighlyexpressedinnormalbutnotcancerousmammaryepithelialcells.尸rac她f/Jcfldf/S/i98,9796-801(2001),它的内容在此并入本公开文件)。实施例7错分类的肿瘤的性质已发现许多具有野生型p53序列状态的癌症被32-基因分类器通过表达谱而分类为p53突变体。如果"错分类的"p53wt肿瘤实际上是p53缺乏的,则它们会失去一些反映p53途径扰动的分子特征,且这些特征会在大多数的p53突变体肿瘤中发现。首先,p53缺乏可能是来自降低的转录物水平,而降低的转录物水平或是通过转录抑制p53基因(TP53)或通过縮短其mRNA半衰期达到。用t检验比较不同肿瘤类别中的TP53的相对表达水平(使用微阵列上的TP53探针集)(图8)。实际上,按照该假设,观察到TP53的整体表达水平在28个被划分为mt样的wt肿瘤中,比起剩余的170个被划分为wt样的wt肿瘤中(Pt^.4xl0"4)有明显降低。在被正确划分为mt样的p53mt肿瘤和所有wt肿瘤之间,表达水平没有统计学上的显著不同。这与TP53mRNA水平在p53突变体乳癌中通常不会降低一致。图8显示出了p53的转录物水平,其转录靶和其上游效应物识别已知和预测的种类。对p53途径相关的基因的表达水平进行了检验。在不同肿瘤类别之间的转录水平的统计显著性由t检验确定,且示于图右侧的简表中。4个肿瘤类别如下1)47个p53mt肿瘤,划分为突变体,2)28个p53wt肿瘤,划分为突变体,3)170个p53wt肿瘤,划分为野生型,和4)12个p53mt肿瘤,划分为野生型。以灰色表示的统计测量结果在p〈0.05时没有达到显著性。表3示出了p53突变的比较分析。(I)严重突变被定义为插入、缺失或终止密码子。在剩余的错义点突变(mpms;wt样组中有ll个,mt样组中有27个)中,我们确定了发生(II)的频率,其中,(11)在IARCTP53突变数据库(可由InternationalAgencyforResearchonCancer,IARC的网址获得)中定义的在p53中的最常见的错义点突变,以及(III)先前示出的体外突变体,以获得显现负活性。使用费雪精确检验计算p值。该项策略被用于p53的已知的转录靶,其被假定为是在p53缺乏的肿瘤中在某些程度上显示出改变的转录。实际上,许多p53靶基因展示出改变的表达的模式(图8)。TP53诱导的基因TP53INP1,SEMA3B,PMAIP1(NOXA),FDXR,CCNG1,和LRDD均在它们的启动子内含有功能性的p53-结合部位,在被归类为mt样的28wt肿瘤中显示出与其他野生型相比明显降低的表达(所有的均有Pt0.05)。另夕卜,这些基因中除了一个之外,在被归类为mt样(与其他所有wt肿瘤相比)的p53mt肿瘤中有显著的降低;在除了两个之外的所有情况下,与其他突变相比时,这些基因在12个被划分为wt样的mt肿瘤中显示出了明显更高的表达。作为p53的正上游效应物,且使p53磷酸化从而促使其稳定化的CHEK1和CHEK2被认为是被p53转录抑制的。观察到了在突变样种类中的p53wt和mt肿瘤中的这些基因的mRNA水平的显著增加。还观察到了12个被错分类为野生型的mt肿瘤展现出与其他47个p53突变体相比显著降低的基因的表达。值得注意的是,在这些乳癌肿瘤样品中,没有观察到p53-调控的基因CDKNIA(p21),GADD45,PPM1D(WIP1),TP53I3(PIG3),TNFRSF6,BBC3(PUMA),APAF1或BCL2的不同表达。总之,这些数据表明分类器可基于p53转录活性来区别肿瘤,该转录活性在突变样类中的p53突变体和p53野生型中均受到抑制,而在野生型样类中的p53野生型肿瘤(在某种程度上12个p53突变体肿瘤)中则可操作。但看似矛盾的是,观察到的p53-诱导的基因PERP,BAX禾口SFN(14-3-3sigma)在28个错分类的wt肿瘤中都有显著的高水平的表达,而不是产生在如上所述的它们的可诱导的基因负体的低水平的表达。然而,这些基因在被划分为突变体样的p53mt肿瘤中的明显过度表达也表明了在乳癌中,这些基因可能被其他的调控机制在突变体或缺乏p53的情况下所诱导。有趣的是,p53的另一个正上游效应物ATR,其被认为是以类似于CHEK1和CHEK2的方式提高p53的活性,也被发现在突变体样类中的p53突变体和p53wt肿瘤中产生明显较高水平的表达,尽管该基因以p53依赖形式被调控还不为人所知。要注意的是,在上游效应物ATM或PRKDC(DNA-PK)的表达水平中观察到无显著的分别。对p53活性的其他上游调节的表达水平进行检验,以确定可能的替代机制,通过该机制p53的表达和活性可在突变体样p53wt肿瘤中降低。首先,观察到若干已知的p53反式激活的正调节子在包括H0XA5,USF1,EGR1和TP53BP1的突变体样类中的野生型和突变体中均有显著降低。H0XA5,USF1和EGR1均为己知的结合到p53启动子且增强其表达的转录因子。有趣的是,它们三个的缺乏均在乳癌发生中有所暗示。最近,在人乳癌细胞线全体中观察到了p53和HOXA5mRNA的等同缺乏和蛋白表达,且在20个p53阴性人乳癌肿瘤中的16中发现HOXA5启动子发生甲基化。与c-Myc癌蛋白结构上相关的USF1被发现在乳癌细胞系中具有降低的转录活性,且最近被显示出活化雌性激素受体a的表达。具有抗增殖和细胞凋亡功能的DNA损害-响应基因EGR1,当在人乳癌细胞中外源表达时,可抑制肿瘤发生,且观察到降低了在人和鼠乳癌细胞系和肿瘤中的表达。TP53BP1不被认为是一转录因子,而是ATM的含BRCT区域的基质,其相应于DNA损害而发生磷酸化。该基因产物已知结合到p53的中央DNA结合区,从而提高p53靶基因的转录活性。在28个被归类为突变体样的p53wt肿瘤中,有4个基因产生显著的表达减少,在USF1和TP53BP1的情况下,在归类于野生型样的p53突变体中产生了显著的高水平表达。有趣的是,还观察到的是,它们的表达水平在47个被分类为突变体样的p53mt肿瘤中明显降低,表明有一可能的正反馈环的存在,从而野生型p53可增加这些基因的表达,而受损的p53不行。总之,这些观察结果表明,或者通过分开作用或者通过组合作用,这些基因对于完整的p53在乳房的活性可以是重要的,以及当转录沉默时,导致p53的缺乏。最后,对几个已知的p53活性的负调节子因子进行检验。值得注意的是,借由对p53蛋白质进行磷酸化介导的降解而对p53进行负调控的MDM2,未被发现在这里所描述的实验的转录物水平上有所差别,而该MDM2在蛋白质水平上的过度表达已在多种癌症中有暗示。然而,PLK1和GTSE1在转录物水平上有差别。分裂期(M-Phase)调节子PLK1最近被发现具有结合到p53的DNA-结合区域,从而在体外抑制它的转录活性。GTSE1(B99)集合到p53的C-末端调节区,导致对p53反式激活功能的抑制,并且降低了p53蛋白质的细胞内水平。有趣的是,两种基因的转录物水平在mt样分类中的p53wt和mt肿瘤中均有高度显著的过度表达,从而表明这些基因产物在乳癌发展中有可能起到抑制p53功能的作用。下面分析用于相关性的p53突变谱,这可解释将12个p53-突变体肿瘤错分类为野生型样的原因。首先,观察到只有1个突变是野生型样和突变体样肿瘤所共有的在DNA-结合区内的氨基酸220处的Tyr变为Cys。在47个被正确地分类为突变体的p53mt肿瘤中,观察到42%(20/47)具有"严重的"突变,被定义为插入(n=2)、缺失(n=ll)和终止密码子(n=7)(表3-I),导致了移码和其后的平截,其中,在12个被划分为野生型的突变体中,只有1个(8%)含有严重的突变在DNA结合区内有3-bp的插入,从而导致符合读框的加入了甘氨酸残基(pfe=0.025)。使用IARCTP53突变数据库(可由InternationalAgencyforResearchonCancer,IARC的网页获得),其在2003年6月,收入了p53的18,585种体细胞突变和225种系突变,并比较了在12个wt样突变体和47mt样突变体中的人类癌症中大多数的共同的p53突变的发生频率(代表了所有p53突变中的约20%;表l-II)。与mt样组中27个当中有9个(pfe=0.029)相比,没有发现这些共同的突变与wt样组中的11个错义点突变(mpms)的亚集有重叠。然后,将各肿瘤组中的mpms与IARCTP53突变数据库中的完整列出的418个突变体进行了交叉对比,已在44项已发表的研究中的至少一项中对该418个突变体进行了显现负功能的分析。如表2-III所示,在12个wt样突变体中,ll个mpms中仅有一个事先证实了了具有显现负活性,而在mt-样组中27个中有12个显示显现负活性(pfe=0.039)。总之,这些数据表明在序列水平,被划分为野生型样的12个p53突变体实际上主要包含"良性"p53突变体形式,而与那些被划分为突变体样的47个p53突变体不同,从而符合我们的表达分析中的大多数p53wt肿瘤的的分子一致性。<table>tableseeoriginaldocumentpage67</column></row><table>p53突变的比较分析。(I)严重突变被定义为插入、缺失或终止密码子。在剩余的错义点突变(mpms;wt-样组中有11个,mt-样组中有27个)中,我们确定了发生(II)的频率,其中,(II)如在IARCTP53突变数据库(可由InternationalAgencyforResearchonCancer,IARC的网址获得)中定义的在p53中的最常见的错义点突变,以及(III)先前示出的体外突变,以获得显现负活性。使用费雪精确检验计算p值。实施本发明可应用到本领域技术人员、软件和系统熟知的传统生物学方法。前面的例子描述了患者预后的方法。在另一方面,还提供了用于患者预后的计算机系统。该系统可包括具有处理器和存储器的计算机,该存储器具有存储于其中的可执行的代码,通过处理器执行该代码来完成以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测患者的预后。适合的计算机系统可以是通用计算机,例如个人计算机(PC)或麦金托什机(Macintosh)。本发明的计算机软件产品通常包括计算机可读取的媒介,其具有计算机可执行的进行本发明方法的逻辑步骤的指令。合适的计算机苦读媒介包括软盘、CD-ROM/DVD/DVD-ROM、硬盘驱动、闪存、ROM/RAM、磁带等。计算机可执行的指令可以用一种或多种合适的计算机语言编写。基本的计算生物学方法在以下著作中有描述SetubalandMeidanisetal.,IntroductiontoComputationalBiologyMethods(PWSPublishingCompany,Boston,1997);Salzberg,Searles,Kasif,(Ed.),ComputationalMethodsinMolecularBiology,(Elsevier,Amsterdam,1998);RashidiandBuehler,BioinformaticsBasics:ApplicationinBiologicalScienceandMedicine(CRCPress,London,2000),以及OueletteandBzevanisBioinformatics:APracticalGuideforAnalysisofGeneandProteins(Wiley&Sons,Inc.,2<nd>Ed,,2001)。此外,本发明还包括优选的实施方式,其包括通过网络,如国际互联网提供通用信息的方法。另外,本发明的一些实施方式可提供用于多种癌症而进行化学治疗药物设计用的制药学上的耙物质。例如,与p53突变状态最为相关的32基因可作为化学疗法的潜在的分子靶。化学疗法药物(细胞毒素)和抗荷尔蒙治疗通常被用于癌症的治疗。但在一些患者中,包括细胞毒素和抗荷尔蒙的治疗方法会引起中毒到严重的副反应。例如,在乳癌中,这些副反应包括呕吐、恶心、秃头症和疲乏。因此,未来的对癌症的有效治疗取决于那些对它们的靶更有特异性的药物。根据一些研究表明,约有68%的正处于临床开发阶段的乳癌药物正是这一类。因此,如在在本发明的某些方面体现出的分子识别标志将为药物开发提供重要的弓I导,或者其本身将被证明是靶向的化学治疗药物的靶。总之,本发明所揭露的实施方式定义了一基因表达识别标志,其可预测p53状态和人类乳癌肿瘤的存活率(p53识别标志或分类器)。在乳癌和肝癌的独立的数据集中,不考虑其他的临床特征,p53识别标志的亚集可相当精确地预测p53状态。作为疾病特异性存活率(DSS)的预测器,识别标志的表现远远超出p53突变状态单独在大量经混合治疗的患者群中的表现。p53识别标志可显著地分辨出从体佐药疗法和局部区域放疗或多或少地受益的患者。尽管p53途径在大多数人类癌症中会在某个水平上妥协,在对p53途径中涉及的转录物进行的研究表明,p53表达识别标志定义了该途径在乳房肿瘤(优于p53突变状态单独的情况)中的操作性构象,其影响着患者的存活率和治疗的应答。在癌症中,很清楚的是不是所有的p53突变都具有等同的效果某些仅仅给予功能的损失,某些则产生显性的负面影响(例如,野生型p53的反式显性抑制或致癌功能获得),还有一些仅显示出部分的功能损失,例如,仅p53下游转录靶基因的一小撮亚集被异常调节。基于这些原因,仅对p53状态进行分子级评价不能提供完整的p53功能的绝对指示。在此揭露的实施方式表明通过观察p53功能的下游指示器,p53的功能状态比用测序或生物化学的方法可更为精确地得以肯定。应当理解的是,以上描述是出于描述的目的,而不应有任何限制成分。本发明的许多变形对于本领域技术人员而言,在看过以上描述后是显而易见的。本发明的范围应根据权利要求以及其等同物来界定。所有引用的文献,包括专利文献和非专利文献,它们的内容均被并入本公开文件。权利要求1.用于预测患者的预后的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测患者的预后。2.权利要求1的方法,其中,预后是选自由疾病特异性存活率、无疾病存活率、肿瘤复发和治疗响应组成的组。3.权利要求l的方法,其中,疾病是乳癌。4.权利要求1的方法,其中,疾病是肝癌。5.权利要求l的方法,其中,预测的p53突变状态是通过排列不同表达的基因而获得,所述排列根据基因与p53突变状态、ER状态和肿瘤组织等级的相关性进行。6.权利要求5的方法,其中,基因根据多变数排列方法进行排列。7.权利要求6的方法,其中,多变数排列方法为线性模型拟和。8.权利要求5的方法,其中,预测的p53突变状态是通过采用监督学习方法获得。9.权利要求8的方法,其中,监督学习方法是对角线性判别分析。10.权利要求1的方法,其中,该组预测p53突变状态的基因包含至少3个基因。11.权利要求10的方法,其中,该组预测p53突变状态的基因包含3-500个基因。12.权利要求11的方法,其中,该组预测p53突变状态的基因包含32个基因。13.权利要求12的方法,其中,该32个基因选自包含表1中所列出的基因。14.权利要求13的方法,其中,该32个基因包括具有选自由以下序列组成的组中的序列的基因SEQIDNO:23,SEQIDNO:22,SEQIDNO:31,SEQIDNO:14,SEQIDNO:11,SEQIDNO:26,SEQIDNO:21,SEQIDNO:30,SEQIDNO:27,SEQIDNO:8,SEQIDNO:2,SEQIDNO:9,SEQIDNO:1,SEQIDNO:29,SEQIDNO:17,SEQIDNO:20,SEQIDNO:6,SEQIDNO:18,SEQIDNO:24,SEQIDNO:10,SEQIDNO:13,SEQIDNO:32,SEQIDNO:28,SEQIDNO:5,SEQIDNO:16,SEQIDNO:25,SEQIDNO:15,SEQIDNO:7,SEQIDNO:4,SEQIDNO:3,SEQIDNO:12,和SEQIDNO:1915.用于预测晚期乳癌患者的预后的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的P53基因;比较所述基因表达谱,确定哪些基因在突变的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测晚期乳癌患者的预后,其中,编码该组基因的序列选自由以下序列组成的组SEQIDNO:22,SEQIDNO:31,SEQIDNO:11,SEQIDNO:9,SEQIDNO:1,SEQIDNO:29,SEQIDNO:28,SEQIDNO:5禾QSEQIDNO:25。16.用于预测早期经局部治疗的乳癌患者的临床结果的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的P53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测P53突变状态;以及使用该组基因来预测早期经局部治疗的乳癌患者的预后,其中,该组基因选自具有选自由以下序列组成的组的序列的基因SEQIDNO:23,SEQIDNO:22,SEQIDNO:31,SEQIDNO:14,SEQIDNO:11,SEQIDNO:26,SEQIDNO:8,SEQIDNO:9,SEQIDNO:1,SEQIDNO:29,SEQIDNO:20,SEQIDNO:24,SEQIDNO:10,SEQIDNO:32,SEQIDNO:28,SEQIDNO:5,SEQIDNO:16,SEQIDNO:25,SEQIDNO:15,SEQIDNO:7,和SEQIDNO:3。17.用于预测肝癌患者的临床结果的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的P53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测肝癌患者的预后,其中,该组基因具有的序列选自由以下序列组成的组SEQIDNO:31,SEQIDNO:14,SEQIDNO:11,SEQIDNO:1,SEQIDNO:20,SEQIDNO:24,SEQIDNO:28和SEQIDNO:5。18.用于确定能够预测患者的预后的一组基因的方法,该方法包括以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的p53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;根据它们预测p53突变状态能力的不同,排列从所述不同表达的基因;训练排列的基因以区别出突变体的和野生型p53基因表达谱;获得包括一组能够预测p53突变状态的p53分类器;在独立的数据集中检验p53分离器的有效性;以及评价p53分离器对预测患者的预后的能力。19.权利要求18的方法,其中,不同表达的基因是根据它们与p53突变状态、ER状态和肿瘤组织等级的相关性,并通过多变数排列方法而排列。20.权利要求19的方法,其中,多变数排列方法为线性模型拟和。21.权利要求18的方法,其中,训练步骤包括采用监督学习方法。22.权利要求21的方法,其中,监督学习方法是对角线性判别分析。23.权利要求18的方法,其中,p53分类器包含至少3个基因。24.权利要求23的方法,其中,p53分类器包含3-500个基因。25.权利要求24的方法,其中,优化的p53分类器包含32个基因。26.权利要求25的方法,其中,优化的p53分类器包含的基因具有选自由以下序列组成的组中的序列SEQIDNO:23,SEQIDNO:22,SEQIDNO:31,SEQIDNO:14,SEQIDNO:11,SEQIDNO:26,SEQIDNO:21,SEQIDNO:30,SEQIDNO:27,SEQIDNO:8,SEQIDNO:2,SEQIDNO:9,SEQIDNO:1,SEQIDNO:29,SEQIDNO:17,SEQIDNO:20,SEQIDNO:6,SEQIDNO:18,SEQIDNO:24,SEQIDNO:10,SEQIDNO:13,SEQIDNO:32,SEQIDNO:28,SEQIDNO:5,SEQIDNO:16,SEQIDNO:25,SEQIDNO:15,SEQIDNO:7,SEQIDNO:4,SEQIDNO:3,SEQIDNO:12禾卩SEQIDNO:1927.权利要求18的方法,其中,预后是选自由疾病特异性存活率、无疾病存活率、肿瘤复发和治疗响应组成的组。28.权利要求27的方法,其中,9-基因部分分类器可预测晚期乳癌患者的临床结果。29.权利要求28的方法,其中,9-基因部分分类器包含的基因具有选自由以下序列组成的组中的序列SEQIDNO:22,SEQIDNO:31,SEQIDNO:11,SEQIDNO:9,SEQIDNO:1,SEQIDNO:29,SEQIDNO:28,SEQIDNO:5和SEQIDNO:25。30.权利要求27的方法,其中,21-基因部分分类器可预测早期经局部治疗的乳癌患者的临床结果。31.权利要求30的方法,其中,21-基因部分分类器包含的基因具有选自由以下序列组成的组中的序列SEQIDNO:23,SEQIDNO:22,SEQIDNO:31,SEQIDNO:14,SEQIDNO:11,SEQIDNO:26,SEQIDNO:8,SEQIDNO:9,SEQIDNO:1,SEQIDNO:29,SEQIDNO:20,SEQIDNO:24,SEQIDNO:10,SEQIDNO:32,SEQIDNO:28,SEQIDNO:5,SEQIDNO:16,SEQIDNO:25,SEQIDNO:15,SEQIDNO:7和SEQIDNO:3。32.权利要求27的方法,其中,8-基因部分分类器可预测肝癌患者的临床结果。33.权利要求32的方法,其中,8-基因部分分类器包含的基因具有选自由以下序列组成的组中的序列SEQIDNO:31,SEQIDNO:14,SEQIDNO:11,SEQIDNO:1,SEQIDNO:20,SEQIDNO:24,SEQIDNO:28和SEQIDNO:5。34.用于预测患者的预后的计算机系统,该系统包括具有处理器和存储器的计算机,该存储器具有存储于其中的可执行的代码,通过处理器执行该代码来完成以下步骤从肿瘤样品中获得多个基因的基因表达谱,其中,所述肿瘤样品可以是突变体的或野生型的P53基因;比较所述基因表达谱,确定哪些基因在突变体的或野生型肿瘤中产生不同表达;从所述不同表达的基因中衍生出一组基因来预测p53突变状态;以及使用该组基因来预测患者的预后。35.用于预测患者对疾病的易感性的诊断工具,包括能够预测p53突变状态的多个固定于固体支撑上的基因。36.权利要求35的诊断工具,其中,固体支撑为微阵列。37.权利要求35的诊断工具,其中,多个基因包括由具有以下基因库登记号的基因组成的组SEQIDNO:23,SEQIDNO:22,SEQIDNO:31,SEQIDNO:14,SEQIDNO:11,SEQIDNO:26,SEQIDNO:21,SEQIDNO:30,SEQIDNO:27,SEQIDNO:8,SEQIDNO:2,SEQIDNO:9,SEQIDNO:1,SEQIDNO:29,SEQIDNO:17,SEQIDNO:20,SEQIDNO:6,SEQIDNO:18,SEQIDNO:24,SEQIDNO:10,SEQIDNO:13,SEQIDNO:32,SEQIDNO:28,SEQIDNO:5,SEQIDNO:16,SEQIDNO:25,SEQIDNO:15,SEQIDNO:7,SEQIDNO:4,SEQIDNO:3,SEQIDNO:12和SEQIDNO:19。38.权利要求37的诊断工具,其中,多个基因包括的基因具有选自由以下序列组成的组中的序列SEQIDNO:22,SEQIDNO:31,SEQIDNO:11,SEQIDNO:9,SEQIDNO:1,SEQIDNO:29,SEQIDNO:28,SEQIDNO:5和SEQIDNO:25。39.权利要求37的诊断工具,其中,多个基因包括的基因具有选自由以下序列组成的组中的序列SEQIDNO:23,SEQIDNO:22,SEQIDNO:31,SEQIDNO:14,SEQIDNO:11,SEQIDNO:26,SEQIDNO:8,SEQIDNO:9,SEQIDNO:1,SEQIDNO:29,SEQIDNO:20,SEQIDNO:24,SEQIDNO:10,SEQIDNO:32,SEQIDNO:28,SEQIDNO:5,SEQIDNO:16,SEQIDNO:25,SEQIDNO:15,SEQIDNO:7和SEQIDNO:3。40.权利要求37的诊断工具,其中,多个基因包括具有选自由以下序列组成的组中的序列SEQIDNO:31,SEQIDNO:14,SEQIDNO:11,SEQIDNO:1,SEQIDNO:20,SEQIDNO:24,SEQIDNO:28,和SEQIDNO:5。41.用于预测患者对疾病的易感性的核酸阵列,包含固体支撑和展示于该固体支撑上的核酸探针,该探针对应于能够预测患者中P53突变状态的基因。42.权利要求41的核酸阵列,其包含至少8个核酸探针。43.权利要求42的核酸阵列,其包含至少32个核酸探针。44.权利要求43的核酸阵列,其包含至少500个核酸探针。全文摘要本发明提供了用于预测患者对疾病的易感性的方法、系统和组合物,其是基于将对一组预先确定的基因进行p53突变状态和基因表达谱的关联。在一些实施方式中,提供了用于分类、预后和诊断癌症的方法。在另一些实施方式中,本发明提供了用于构建基于基因表达的分类器的统计学方法,该分类器可用于预测患者对疾病的易感性、对肿瘤进行分类,以及对临床结果进行预后。文档编号C12Q1/68GK101111604SQ200580041881公开日2008年1月23日申请日期2005年10月5日优先权日2004年10月6日发明者J·乔治,L·D·米勒,V·B·维加申请人:新加坡科技研究局
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1