用于鉴别鼻咽癌中的预后型亚类的基因表达谱的制作方法

文档序号:3558365阅读:350来源:国知局

专利名称::用于鉴别鼻咽癌中的预后型亚类的基因表达谱的制作方法用于鉴别鼻咽癌中的预后型亚类的基因表达谱本发明总体上涉及评估和/或预测鼻咽癌的状态和结果的方法,包括测定与这种癌症相关的基因的表达水平,由此使得可以对这些癌症患者的结果进行个体化预测或评估。导曰鼻咽癌(NPC)是一种独特类型的头颈部癌症,其与上呼吸消化道的其它恶性肿瘤在流行病学、病理学、临床表现和对治疗的反应方面有所不同1,2。据信NPC的发生与Epstein-Barr病毒(EBV)感染相关3,4。这种类型的癌症在中国南方地区、台湾和东南亚地区是地方流行病(25-30/100,000/年)5—8。其是更具侵润性的头颈部癌症之一,可以侵入相邻器官、侵袭咽后和颈部淋巴结并传播于远离部位"1。在过去的三十年期间放射治疗的进展得以成功地长期控制NPC12'16。毫无疑问,放疗是治疗NPC的主要方法。疾病I期和II期患者仅利用放疗就可具有较高的治愈率。然而,70%以上的新诊断的NPC患者处于疾病的III期和IV期14,17。这些患者另外需要同时进行化疗以改善其治疗结果15,16。另外,大约30。/。的疾病m期和IVa/b期NPC患者最后产生远处转移14,17,即在NPC的局部区域外的转移。10-20%的NPC患者在最初诊断时即出现远处转移并处于疾病IVc期14,17。在发生远处转移之后不久,大多数患者死于该病。远处转移通常在III期和IV期NPC患者未出现局部区域复发的情况下发生,是最重要的预后因素。近来的元分析(meta-analysis)表明晚期NPC患者生存期改善可能是同时进行全身性化疗而可能防止和控制远处转移的结果15,16。考虑到70%以上的NPC患者处于疾病的m期和IV期,及大约30%的这些患者中可发生远处转移14,17,因此需要在首发时即成功鉴别具有高远处转移风险的患者,从而进一步改善这些患者的生存期。当这种预测变成现实时,就可以应用目前最优的治疗方法,然后可以设计临床试验测试更新的治疗方法,以更有效地防止和控制远处转移从而改善总体生存期。已知远处转移的风险随着NPC的更晚期阶段而增加14,17,己经使用TNM分级以指导选择放疗和化疗的合适组合,以防止远处转移及改善长期生存15,16,31。例如,在台湾台北辜公亮基金會和信治癌中心对AJCC的III期患者(具有TlN2M0和T2aN2M0疾病的排除在外)已经同时用化疗-放疗(CCRT)加上两个周期的顺铂和5-FU的辅助化疗进行了治疗31。IVa/b患者用CCRT治疗,随后进行2个周期的辅助化疗及每周一次用5-FU和甲酰四氢叶酸维持化疗共6个月31。尽管许多III期患者对这种治疗反应良好并具有极佳的生存期(图6),但是大约20%的111期患者发生远处转移并且生存期不佳。在开始治疗的三年内发生远处转移的III期患者的总体生存期和无转移生存期与IVa/b期NPC患者的重叠(图6)。这些发现提出这样的问题,即处于发生远处转移风险的m期患者是否应该通过新辅助化疗、更新或更强的辅助化疗和,/或维持化疗而更积极地进行治疗。对处于发生远处转移的IVa/b期NPC患者的治疗的适当性也是一个问题(图6)。所有这些发现强调在诊断时和在开始治疗之前鉴别出处于发生远处转移风险中的NPC患者的临床重要性。鉴别这种患者及排除处于低远处转移风险中的III期和IVa/b期NPC患者的能力对于进行更有效的临床试验非常重要。如先前所报道,微阵列分析已经成功用于鉴别肿瘤分类的分子标记18_22及其临床特点2>3(),例如预测各种类型恶性肿瘤患者发生远处转移的风险及总体生存期。其它研究涉及NPC3、54。也参见2002年10月24日申请的美国专利申请No.60/420,729、2002年10月25日申请的美国专利申请No.60/421,102、2002年10月25日申请的美国专利申请No.60/421,062、2002年11月8日申请的美国专利申请No.60/424,701、2002年11月8日申请的美国专利申请No.60/424,718、2002年11月8日申请的美国专利申请No.60/424,715、2002年11月12日申请的美国专利申请No.60/425,256、2003年2月21日申请的美国专利申请No.60/448,462、2003年2月21日申请的美国专利申请No.60/448,466、2003年3月27日申请的美国专利申请No.60/457,877、2003年3月31日申请的美国专利申请No.60/458,373、2002年ll月12日申请的美国专利申请No.10/291,878、2002年11月12日申请的美国专利申请No.10/291,886、2002年11月12日申请的国际专利申请No.US02/38216、及2002年11月12日申请的国际专利申请No.US02/38222、2004年12月20日申请的美国专利申请No.l1/015,764、2005年3月28日申请的美国专利申请No.11/090,294及2005年3月25日申请的美国临时申请No.60/665,652的描述,所述文献中使用的方法学在此并入作参考。发明概述本发明鉴别了NPC患者中的涉及远处转移的基因组特征(genomicsignatures)。改良的对NPC患者发生远处转移进行预测的方法使得临床医生可以鉴别处于高风险中的个体患者,对他们可以选择合适的治疗方法(例如放疗和/或化疗)以防止和/或改善远处转移并改善长期生存率。因此,本发明一方面涉及使NPC患者中的基因表达水平与所述患者中的风险因子和临床结果相关联的方法。因此,本发明涉及一种评估鼻咽癌患者发生远处转移风险的方法,所述方法包括评估所述患者样品中下表4和5中列出的至少一个基因的表达谱。优选地,在患者样品、优选NPC组织样品中评估表4中列出的基本上全部的、特别是全部52个基因和/或表5中列出的基本上全部的、特别是全部12个基因的表达水平。因此,可以利用表4或5中的两或多个基因,只要用于概率分析而评估的基因的数目与疾病结果(例如远处转移)相关联即可。在其它实施方案中,对于所述12个基因系列,可以利用其中的3或多个、4或多个、5或多个、6或多个、7或多个、8或多个、9或多个、IO或多个,或者ll或多个基因。对于所述52个基因系列,也可以利用这样数目的基因,或者12或多个、…、15或多个、…、20或多个、…、25或多个、…、30或多个、…、35或多个、…、40或多个、…、45或多个、…、50或多个、51或多个基因,以及在此未明确表述的其它基因数目。在下文描述的组合方法中也可以利用来自每个系列的所述的基因数目。当然,为了优化结果,通常利用全部或者基本全部的基因。因此,另一方面,前述方法中使用的基因是本文列出的一或多个基因。本发明还涉及在例如介质或试剂盒等中的与远处转移相关的这些基因的全部或亚集的集合,并且本发明涉及进行本发明方法使用的相关的方法、介质和试剂盒。根据本发明的另一方面,所分析的患者样品可以是任何组织,例如血液、肿瘤或细胞等。优选地,所述样品来自NPC肿瘤。获得所分析样品的方法为本领域所已知。本发明提供了与评估或预测NPC患者中的远处转移相关的基因集合。这些基因具有与至少一种这种癌症表型相关的表达模式(即水平表达或无表达)。可以理解NPC中也包含另外的基因。对于本发明,对自具有完整记录的临床数据的NPC患者收集的组织活检样品进行基因表达模式研究。所有进行研究的活检样品均在液氮中贮存。仅对总RNA无明显降解的样品进行研究。为了使与操作者相关的变量最小化,在肿瘤样品的处理和微阵列数据的收集中仅包括两名经高级培训的技术人员。他们随机处理相似数目的具有高和低远处转移风险的患者的样品。对由这两名技术人员进行和收集的微阵列数据的统计学分析未示出任何统计学偏差(图7)。在研究过程中还使用相同的流体自动输送仪(fluidicstation)和相同的扫描仪。为了进一步使得与芯片生产、样品处理、cRNA的荷载量及芯片处理相关的变量最小化,使用AffymetrixMAS5.0软件将每个微阵列的基因表达强度数据校正为切尾均值(trimmedmean)500,随后根据先前在我们实验室中确定的NPC参考标准对每个探针集的表达强度进行分位数校正。见实施例I所述。这种校正方法的效果通过对比六个随机选择的NPC样品重复测定的GeneChip结果而确认。结果示出在探针水平的分位数(qauntile)校正程序对于校正实验变量确实有效(图8)。进行严密监视下的分析。如先前所述,在开始治疗的三年内未发生远处转移的大多数NPC患者具有良好的长期生存率,生存结果不佳的NPC患者通常在首次治疗后的三年内发生远处转移。这两组在临床上处于疾病两端的患者的活检组织样品用于分析中,以鉴别用于预测远处转移的更可靠的分子标记。最近报道了采取这种方法发现可靠的分子预测因子(predictor)的益处35。同时,如Simon等"所述,过匹配(overfitting)是从具有高维测量值的有限数目的患者中发现类别预测因子的一个严重缺陷。为了克7服过匹配问题,一组用于确证的真正独立的测试病例被包括进来,并且在这项研究中包含尽可能多的患者。138名符合条件的患者被包括进来。另外,将来自低风险和高风险组的l/3的患者在研究刚开始时随机分配至一个独立测试组(testset)以进行确认。重要的临床变量如年龄、性别、肿瘤阶段、随访持续时间被考虑以用于随机化。所有测试组病例均未参与训练过程中预测基因的选择和预测规则的确定。本发明的测试组的结果显示灵敏性、特异性和总精确性与文献中针对其它类型实体肿瘤报道的结果相当或更好23,24'27'3()。存活的肿瘤细胞和周围的淋巴/炎症/介质细胞的数量在不同患者的活检组织样品之间可以显著变化(生物学异质性)。然而,由于可利用的活检组织的数量非常有限及RNA的不稳定性,因此对用于基因表达谱分析的活检组织样品未进行组织学检验。同样,诊断性活检组织样品的组织学与预测结果的精确性无关联,因为用于诊断和GeneChip研究的活检部位不同。与活检组织样品的异质性相关的噪音(noise)会限制预测的精确性。本发明产生了两项优选的预测规则。见实施例IV和V所示。一项基于52个基因的特征和k-NN分类方法,另一项基于12个基因和逻辑回归(logisticregression)。在一组中,来自9个不同SOM簇的52个基因被用于进行预测。它们总结于表4。在这52个基因中,根据MAID-DAVIDTools7■mMmT;.gov/iav,,有参与信号转导(n-9)、mRNA力口工(11=7)、转录调节(!1=3)、蛋白质合成(11=4)、核苷酸代谢(n-4)、脂质代谢(11=3)、蛋白质折叠(11=3)、胞质分裂(11=2)、核转运(!1=2)、蛋白质分解代谢(11=2)、抗细胞凋亡(n4)、ATP合成(r^1)、细胞周期(n=l)、免疫应答(n-l)、胞内蛋白质转运(11=1)和氨基酸转运(11=1)的成员。剩余7个基因的功能未知。在高风险组中,这52个基因中有22个基因表达降低,3个基因表达增加。当对比高风险和低风险组的预测基因的表达强度时,注意到在预测的高风险组中几乎所有参与mRNA加工、核转运、核苷酸代谢和蛋白质折叠的基因的平均表达水平均更高。相反,在预测处于高远处转移风险组中,所有参与转录调节和蛋白质分解代谢的基因的表达均降低。对于基于12个基因的预测方法,有6个基因也存在于通过k-NN方法进行预测的所述52个基因中。根据Affymterix探针集ID,其它6个基因不存在于所述52个基因的列表中。这12个基因总结于表5。在这12个基因中,有3个基因参与蛋白质折叠,2个基因参与蛋白质合成,2个基因参与核糖体生物发生(biogenesis),2个基因参与核苷酸代谢,l个基因参与mRNA加工和蛋白质分解代谢。最后一个基因(假设蛋白质FLJ12671)已知具有核仁外切核酸酶基序,其实际功能未知。所有12个基因的功能均显示出与所述52个基因中的那些基因的功能明显重叠。注意到未包含在所述52个基因中的6个基因之一(不含POU结构域的蛋白质)实际上与所述52个基因中的不同探针集ID所表示的基因相同。这个基因参与mRNA加工。所述12个基因的组中的3个基因是含有相同伴侣蛋白的t-复合物l(TCP-l)的ot、P、Y亚单位34,它们参与肿瘤细胞增殖。亚单位a和Y的基因既存在于所示12个基因中,也存在于所述52个基因中。亚单位(3的基因仅存在于所述12个基因中。所有这些发现示出这两组预测基因之间的高度一致性。使用预测规则的结果示出52个基因的预测方法较12个基因的预测方法假阳性率低(14%对28%)。相反,52个基因的预测方法较12个基因的预测方法具有较高的假阴性率(31%对15%)。当所述预测方法用于选择具有高远处转移风险的患者进行临床试验时,需要将假阳性和假阴性率降低至最小值,以便保护低风险患者的安全和对高风险患者的正确治疗。例如,可以将所述两种方法组合成为一种方法。仅认可两种方法的一致结果。不一致的结果被看作是不确定结果(11=8)。见实施例VI所述。通过采取这种方法,假阳性率降低至10%。假阴性率为大约15%。尽管在独立测试中不确定病例占所有患者的19%(8/42),但是通过组合使用分子预测因子仅将2名临床高风险患者指定为属于不确定范畴。以这种方式,以排除15%(2/13)的临床高风险患者的代价,错误地将低风险的患者(goodriskpatient)划分在高风险患者试验组中的几率可被有效最小化。其它15%的临床高风险患者被错误地预测为低风险患者(表6)。然而,至少70%的高风险患者将得以正确鉴别并可以包括在针对高风险患者设计的临床试验中。因此,已经鉴别了52个基因和12个基因的可靠分子学特征,以预测处于发生远处转移的高风险或低风险状态的NPC患者。所述预测经42个独立测试组病例确认。由独立测试组评估的总精确性对于所述52个基因特征、12个基因特征及其组合特征分别为81%、76%和85%。这些结果与近来公布的也使用独立测试组进行确认的预测研究结果相当283。据报道预测乳腺癌对新辅助化疗反应的准确率为78%28,预测头颈部鳞状细胞癌的淋巴结转移的准确率为86%3()。所述分子特征可用于指导在NPC患者中进行新的新辅助化疗、辅助化疗、维持化疗和/或靶向治疗,以用于防止、改善和控制远处转移及进一步改善长期生存率。具有远处转移的低或高风险的NPC患者的鉴别也可以降低治疗过度或不足的比率。NPC转移相关基因的集合可以是物理集合(physicalcollection)或虚拟集合(virtualcollection)。物理集合包括一群不同的核酸分子,其中NPC癌症相关基因存在于所述群中,即所述群中有相应于所述集合中的NPC癌症相关基因的基因组序列,或者更常见地,编码序列的核酸分子。在许多实施方案中,所述核酸分子的序列与其相应的基因的有义链基本相同或相同,或者与其相应的有义链互补,通常与其相应的有义链在严格条件下杂交。杂交条件(即低、中等、或高严格条件)的确定为本领域技术人员所己知。严格杂交条件的一个例子是在50'C或更高温度下在0.1SSC(15mM氯化钠/1.5mM柠檬酸钠)中杂交。严格杂交条件的另一个例子是在42'C在如下溶液中保温过夜50%甲酰胺,5xSSC(150mMNaCl,15mM拧檬酸三钠),50mM磷酸钠(pH7.6),5xDenhardt's溶液,10%硫酸葡聚糖,及20mg/ml变性剪切的鲑精DNA;随后在大约65'C在0.1xSSC中洗涤滤膜。严格杂交条件是至少与上述条件一样严格的杂交条件,其中如果与上述特定严格条件至少大约80%、通常至少大约90%—样严格,则认为是至少一样严格的。其它严格条件为本领域所已知,也可以用于鉴别本发明这个特殊实施方案的核酸。组成所述物理集合的核酸可以是单链或双链核酸。另外,组成所述物理集合的核酸可以是线性或环状核酸,各个核酸分子除了NPC癌症相关基因之外还可包括其它序列,例如载体序列。各种不同核酸可以组成所述物理集合,例如库,如本发明的载体库,其中不同类型核酸的例子包括但非限于DNA,例如cDNA等,RNA,例如mRNA、cRNA等等。所述物理集合的核酸可以存在于溶液中或者粘附即附着于固体支持物上,如在阵列实施方案中的基质上,关于这种不同实施方案的进一步描述在下文提供。本发明还提供了NPC相关基因的虚拟集合。虚拟集合是指包括集合的基因的序列信息的一或多个数据文件或者其它计算机可读数据组织元件,其中所述序列信息可以是基因组序列信息,但通常是编码序列信息。所述虚拟集合可以记录在任何便利的计算机或处理器可读存储介质上。其上存储了所述集合数据的计算机或处理器可读存储介质可以是任何便利的介质,包括CD、DAT、软盘、RAM、ROM等,所述介质能由装置的硬件部分读取。本发明还提供了NPC相关基因的表达谱数据库。这种数据库通常包含具有NPC相关表型的各种细胞/组织的表达谱,如NPC的各个阶段、阴性表达谱、预后谱等,在下文对这类谱进一步描述。所述表达谱及其数据库可以提供在各种介质中以便于其应用。"介质"是指含有本发明所述表达谱信息的产品。本发明的数据库可以记录在计算机可读介质例如可以由计算机直接读取和存取的任何介质上。这种介质包括但非限于磁性存储介质,如软盘、硬盘存储介质及磁带;光学存储介质如CD-ROM;电子存储介质如RAM和ROM;及这些存储介质的混合物如磁性/光学存储介质。本领域技术人员可易于意识到目前已知的任何计算机可读介质可怎样用于产生包含本发明数据库信息的产品。"记录"是指使用本领域已知的任何方法在计算机可读介质上存储信息的过程。基于用于存取所存储信息的方式,可以选择任何便利的数据存储结构。可以使用各种数据处理器程序和格式进行存储,例如文字处理文本文件(wordprocessingtextfile),数据库丰莫式(databaseformat)等。如本文所用,"基于计算机的系统"是指用于分析本发明信息的硬件、软件和数据存储装置。本发明的基于计算机系统的最小硬件包含一个中央处理器(CPU)、输入装置、输出装置,及数据存储装置。技术人员可易于意识到任一种目前可利用的基于计算机的系统均适用于本发明中。数据存储装置可包括任何包含如上述本发明信息的记录制品,或者可以存取这种制品的记忆存取装置。可以使用输入和输出装置的许多结构格式以在本发明的基于计算机的系统中输入和输出信息。输出装置的一种格式是对与参考表达谱具有不同程度相似性的表达谱进行排列(rank)。这种表示为技术人员提供了相似性的排列,并且可以鉴别测试的表达谱中包含的相似性程度。基因表达谱可以在一个时间点测定或者在一段时间的几个时间点测定。基因的表达水平可以通过本领域已知的任何方法确定(例如定量的聚合酶链反应(PCR)、逆转录酶/聚合酶PCR)或者通过将开发的可提供关于基因表达的定量信息的方法确定。在另一个实施方案中,基因表达水平是通过量化基因表达产物如蛋白质、多肽或核酸分子(例如mRNA、tRNA、rRNA)而确定的。量化核酸可以通过对核酸进行直接量化或者通过对相应的调节基因或调节序列元件进行量化而进行。另外,可以对基因的变体如剪切变体和多态性变体进行量化。在另一个实施方案中,基囟表达是通过量化从mRNA翻译的蛋白质或多肽的水平而测定的。量化样品中蛋白质或多肽的水平并使这种数据与表达水平相关联的方法为本领域所已知。例如,特异于蛋白质或多肽的多克隆或单克隆抗体可以通过本领域已知的方法获得,并用于检测和/或测量样品或标本中的蛋白质或多肽。在一个优选的实施方案中,基因表达是通过量化样品或标本中的mRNA水平而测定。这可以通过本领域已知的任何方法进行。在一个实施方案中,将mRNA与包含特异于感兴趣的基因的固定的核酸探针的合适微阵列接触,确定样品中mRNA与微阵列上探针的杂交程度。这种微阵列也在本发明的范围内。产生寡核苷酸微阵列的方法的例子在例如WO95/11995中描述。本领域易于获知其它方法。测定或估定的基因表达值是得自可以测量基因表达水平的装置的数值。所述数值是得自所述装置的原始数值,或者是优选经过重定比例、过滤和/或标准化的数值。见例如实施例I所述。已经进行特定严格条件处理的样品的核酸(例如mRNA)与芯片上的探针杂交。分离进行分析的核酸(例如靶核酸)、扩增,在与阵列杂交之前用可检测的标记物(例如32P或荧光标记物)进行标记。杂交后,将所述阵列插入可以检测杂交模式的扫描仪中。这些模式通过检测与所述微阵列附着的标记的靶而进行检测,例如如果所述耙是荧光标记的,则收集从标记的基团中发射的光作为杂交数据。由于标记的耙在本领域技术人员已知的合适的严格条件下与所述微阵列中包含的互补寡核苷酸特异性杂交,及由于已知所述阵列中每个寡核苷酸的序列和位置,因此可以确定应用于所述探针的耙核酸的性质。本发明还提供了一种通过监测本发明的基因表达谱而监测个体中治疗方案的效果的方法,例如可以确定个体的基础基因表达水平,并且可以在治疗期间在不同时间点重复确定基因表达谱。基因衣込l首/A与个往tf」^汀结米TO天tf、」谐特父刀与改吾的汩〗了结果相关的谱是治疗方案有效的指征,而重复的与不佳治疗结果相关的表达谱表示无效的治疗方案。在本发明的诊断性应用中,对细胞或其集合例如组织以及包括所述细胞/组织的动物(对象、宿主等,例如哺乳动物如宠物、家畜和人等)进行分析,以确定发生NPC转移的存在和/或可能性。如此,诊断性分析包括确定这种表型存在的方法。在某些实施方案中,不仅确定了表型的存在,而且还确定了表型的严重性或阶段。另外,诊断性方法还包括确定发生这种癌症表型的倾向,由此^J以确定这种癌症表型不存在但可能发生。在进行所述诊断及其它方法中,对得自或衍生自要被诊断的细胞、组织或对象的核酸样品进行分析,以产生表达谱,然后进行本发明的方法。如上所述,进行分析以产生表达谱用于所述诊断方法中的样品是核酸样品。所述核酸样品包括多个或一群不同的核酸,所述核酸包含进行诊断的感兴趣的细胞或组织的NPC相关基因的表达信息。所述核酸可包括RNA或DNA核酸,例如mRNA、cRNA、cDNA等,只要所述样品保留其从中获得的宿主细胞或组织的表达信息即可。所述样品可以本领域已知的许多不同方式制备,例如通过从细胞中分离mRNA,其中分离的mRNA被扩增,用于制备cDNA、cRNA等,如差异表达领域所已知的那样进行。所述样品通常是从待诊断的对象收集的细胞或组织中制备的,例如通过使用标准方案进行组织活检而收集,其中从中可以产生这种核酸的细胞或组织包括其中存在待确定的NPC表型的表达谱的任何组织,包括但非限于单核细胞、内皮、和/或平滑肌。可以使用任何便利的方案从原始核酸样品中产生所述表达谱。虽然已知各种不同的产生表达谱的方式,如用于基因差异表达分析领域中的那些方式,但是一种代表性的便利的产生基因表达谱的方案是基于阵列的基因表达谱产生方案。所述应用是杂交分析,其中采用这样的核酸,所述核酸展示针对待产生的表达谱中的每个被分析的/描绘的基因的"探针"核酸。在这些分析中,首先从进行分析的原始核酸样品中制备靶核酸样品,其中制备可包括用标记物(例如信号产生系统的一个成员)标记所述靶核酸。在制备靶核酸样品后,将样品与所述阵列在杂交条件下接触,从而与同所述阵列表面所附着探针序列互补的耙核酸形成复合物。然后定量或定性检测杂交复合物的存在。可用于产生本发明方法中采用的表达谱的特殊杂交技术包括在如下并入本文作参考的文献中描述的技术美国专利No:5,143,854、5,288,644、5,324,633、5,432,049、5,470,710、5,492,806、5,503,980、5,510,270、5,525,464、5,547,839、5,580,732、5,661,028、5,800,992,以及WO95/21265、WO96/31622、WO97/10365、WO97/27317、EP373203和EP785280。在这些方法中,将包括其表达被分析的每个NPC相关基因的探针的"探针"核酸阵列与上述耙核酸接触。在杂交条件例如上述严格杂交条件下进行接触,然后除去未结合的核酸。所得的杂交核酸模式提供了已经探査的每个基因的表达信息,其中所述表达信息是关于所述基因表达与否以及表达的水平,并且通常表达数据即表达谱可为定量和定性的。在一些实施方案中,应用上述获得的关于所分析的细胞/组织的信息对宿主、对象或患者关于已经发生的疾病的存在、阶段或倾向加以诊断、对疾病过程和结果加以预测。例如,在确定进行分析的细胞/组织具有NPC转移表型的情况中,所述信息可用于诊断从中获得所述细胞/组织的对象具有癌症复发的可能性。除了监测特定治疗方法的效果之外,本发明可用于筛选潜在的候选药物在治疗NPC转移可能性中的效果。在这个实施方案中,将用所述候选药物治疗之前和之后的样品表达谱进行比较,其中经治疗的样品的基因表达谱从不佳治疗结果相关的谱向改善的治疗结果相关的谱的转变表示药物的效果。可以使用常规的方法在体外或者在动物模型中进行这种分析。本发明的NPC相关基因的集合的另一个应用是用于监测或评定给定的治疗方案。在这种方法中,使用本文描述的方法监测经历治疗的患者的细胞/组织样品,其中将获得的表达谱与一或多种参考表达谱进行比较,以确定给定的治疗方案对治疗的疾病是否具有希望的影响。例如,在治疗期间从患者中定期获得表达谱,将其与包括各种NPC转移阶段和正常表达谱的一系列参考/对照谱进行比较。在监测的表达谱中观测到的朝向正常表达谱的转变表示给定的治疗方案以希望的方式起作用。治疗剂筛选应用本发明还涵盖了鉴别具有调节(例如增强或消除)NPC转移表型能力的物质的方法,所述方法可用于鉴别治疗剂。调节这种表型的化合物的鉴别可以使用任何药物筛选技术实现。本发明的筛选分析通常基于所述物质调节NPC转移表型决定基因的表达谱的能力。如本文所用,术语"物质(agent)"是指具有调节差异表达的基因产物的生物学活性的能力的任何分子,例如蛋白质、小分子或其它药物。通常将具有不同物质浓度的多种分析混合物平行运行,以获得对不同浓度的反应。通常,这些浓度之一作为阴性对照,即为零浓度或者低于检测水平。候选物质涵盖了各种化学类别的物质,但其通常是有机分子,优选分子量大于50而小于大约2,500道尔顿的小的有机化合物。候选物质通常包含为与蛋白质在结构上相互作用所必需的功能基团,特别是氢键,通常包括至少一个胺基团、羰基、羟基或羧基,优选至少两个所述化学功能基团。所述候选物质通常包含环状碳或杂环17结构和/或用一或多个上述功能基团取代的芳香结构或芳香聚合结构。还在生物分子中发现候选物质,包括但非限于肽、糖、脂肪酸、类固醇、嘌呤、嘧啶、衍生物、结构类似物或其组合。候选物质得自各种来源,包括得自合成或天然的化合物。例如,可利用多种方式随机及直接地合成各种有机化合物和生物分子,包括随机化的寡核苷酸和寡肽的表达。或者,细菌、真菌、植物和动物提取物(包括人体组织提取物,用以鉴别影响差异表达的基因产物的内源因子)形式的天然化合物文库是可利用或易于产生的。另外,天然或合成产生的文库和化合物易于通过常规的化学、物理和生物化学方式加以修饰,可用于产生组合文库。可以对已知的药物制剂进行直接或随机化学修饰,如酰化、烷化、酯化、酰胺化等,以产生结构类似物。特别感兴趣的候选物质例如包括但非限于反义多核苷酸、抗体、可溶的受体等。抗体及可溶的受体是特别感兴趣的候选物质,其中目标差异表达的基因产物在细胞表面分泌或是表面可及的(accessible)(例如与细胞外膜稳定关联的受体及其它分子)。筛选分析可以基于本领域技术人员可利用的及已知的各种技术。通常地,所述筛选分析包括将已知具有NPC转移表型的细胞或组织与候选物质接触,基于由表型决定基因组成的基因表达谱分析评定对基因表达谱的影响。可以使用任何便利的方法检测所述作用结果,在许多实施方案中应用上述诊断方案。这种分析通常在体外进行,但是对许多分析可以进行修改以适于体内分析,例如在动物癌症模型中进行分析。药物靶向筛选在另一个实施方案中,本发明涉及鉴别本文列出的基因及其产物作为治疗靶。在一些方面,这与鉴别具有调节(例如降低或增加)NPC转移表型的活性的物质的上述分析相反,涉及鉴别特定表型决定基因或其表达产物,以作为治疗靶。在这个实施方案中,治疗靶是通过检测可被证实或已经被证实调节NPC表型卩例如抑制或阻抑这种表型)的物质的作用而鉴别的。例如,所述物质可以是特异于所选择的基因转录物的反义寡核苷酸。例如,所述反义寡核苷酸可以具有相应于本文表中列出的基因序列的序列。鉴别治疗靶的分析可以利用本领域技术人员熟知的各种方法以各种方式进行。例如,将表达或过表达候选基因例如本文表中列出的基因的测试细胞与已知的NPC药剂接触,评估候选基因产物对NPC表型的作用及生物学活性。所述候选基因的生物学活性可以通过检测例如对编码候选基因产物的基因表达的调节d列如通过转录物水平或多肽水平的增加或减少进行检测)或者对及基因产物的酶学或其它活性的调节而分析。NPC转移表型的抑制或阻抑表明所述候选基因产物是一种合适的治疗耙。可对本文中描述的和/或本领域已知的分析进行修改以适于鉴别治疗靶。通常地,这种分析是在体外进行的,但是可以对许多分析进行修改以适合体内分析,例如在合适的本领域公认的动物模型中进行的分析。试剂与试剂盒本发明还提供了进行上述一或多种方法的试剂及其试剂盒。所述试剂及其试剂盒可以非常不同。感兴趣的试剂包括特别设计用于产生上述NPC表型决定基因的表达谱的试剂。一种类型的这种试剂是核酸探针阵列,其中存在感兴趣的NPC转移表型决定基因。本领域已知各种不同的阵列形式,具有多种不同的探针结构、基底成分和附着技术。感兴趣的代表性阵列结构包括如下并入作参考的文献中所描述的那些阵列美国专利No.5,143,854、5,288,644、5,324,633、5,432,049、5,470,710、5,492,806、5,503,980、5,510,270、5,525,464、5,547,839、5,580,732、5,661,028、5,800,992,以及WO95/21265、WO96/31622、WO97/10365、WO97/27317、EP373203禾BEP785280。在许多实施方案中,所述阵列包括本文列出的至少两个基因的探针。在某些实施方案中,阵列上存在的基因数目为至少5、10、25、50或更多个,包括本文列出的所有基因。所述阵列可仅包括本文列出的那些基因,或者其还可包括本文未列出的其它基因。在某些实施方案中,当所述阵列包括这种其它基因的探针时,存在的其它基因数的百分比不超过大约50%,通常不超过大约25%。在许多实施方案中,当包括这种其它基因时,所述集合中的大多数基因是NPC癌症表型决定基因,大多数是指至少大约75%,通常为至少大约80%,有时为至少大约85、90、95%或更高,包括所述集合中100%的基因是NPC癌症表型决定基因的实施方案。在许多实施方案中,所述阵列中代表的至少一种基因是其在功能上不易参与NPC癌症表型的产生的基因。特别适合产生NPC癌症表型决定基因的表达谱的另一种类型的试剂是设计为选择性扩增这种基因的基因特异性引物的集合。基因特异性引物及其使用方法在美国专利No.5,994,076中描述,所述专利在此并入作参考。特别感兴趣的是具有本文列出的至少两种基因的引物的基因特异性引物集合。在某些实施方案中,具有所述集合中的引物的这种基因的数目是至少5、10、25、50或更多种,包括本文列出的所有基因。所述基因特异性引物集合可仅包括本文列出的那些基因,或者可包括本文未列出的其他基因的引物。在所述基因特异性引物集合包括这种另外的基因的情况中,在某些实施方案中所述另外的基因的百分数不超过大约50%,通常不超过大约25%。在许多实施方案中,在包括这种另外的基因的情况中,集合中的大多数基因是NPC表型决定基因,大多数是指至少大约75%,通常为至少大约80%,有时为至少大约85、90、95%或更高,包括其中集合中100%的基因是NPC表型决定基因的实施方案。在许多实施方案中,基因特异性引物集合中代表的至少一种基因是其在功能上不易于参与NPC癌症表型产生的基因。本发明的试剂盒可包括上述阵列和/或基因特异性引物集合。所述试剂盒可进一步包括用于各种方法中的一或多种另外的试剂,如产生靶核酸、dNTP和域rNTP的引物,它们可以是预先混合的或单独的,一或多种独特标记的dNTP和/或rNTP,如生物素酰化的或Cy3或Cy5标记的dNTP,具有不同的散射光谱的金或银粒子,或者其他合成后标记试剂,如荧光染料的化学活性衍生物,酶如逆转录酶,DNA聚合酶,RNA聚合酶等,各种缓冲介质,例如杂交和洗涤缓冲液,预制的探针阵列,标记的探针纯化试剂和成分,如离心柱(spincolumns)等,信号产生和检测试剂,例如链霉亲和素-碱性磷酸酶结合物,化学荧光或化学发光物等。除了上述成分之外,所述试剂盒进一步包括实践本发明方法的说明书。这些说明书可以各种形式存在于所述试剂盒中,其中一或多种可存在试剂盒中。这些说明书的一种形式是印刷于合适的介质或基质上,例如试剂盒包装内或者包装插入页等中的印有所述信息的一或多张纸等。另一种方式是计算机可读介质,例如其上记录了所述信息的磁盘、CD等。另一种方式是用于通过因特网在远程位置获取所述信息的网址。治疗NPC转移的化合物和方法
技术领域
:本发明还提供了可以减少NPC转移可能性的方法和组合物。本发明提供了通过调节一或多种靶基因的表达或者其一或多种产物的活性而减轻例如治疗这种疾病的方法,其中所述靶基因是一或多种本文列出的NPC表型决定基因。某些NPC疾病至少部分是由基因产物水平过多或者存在显示异常或过高活性的基因产物而引起的。如此,降低这种基因产物的水平和/或活性将使得疾病的复发得以减少。下文描述了降低靶基因表达水平或靶基因产物活性水平的技术。或者,某些其他NPC疾病阶段至少部分是由于缺乏基因表达或基因表达水平降低或者基因产物活性水平降低所致。如此,增加基因表达水平和/或所述基因产物的活性可以改善所述疾病。下文描述了增加靶基因表达水平或靶基因产物活性水平的技术。抑制突变的靶基因的表达、合成或活性的化合物如上所述,参与NPC疾病的靶基因可以通过耙基因活性水平增加而导致所述疾病。在疾病条件下细胞/组织中的基因处于正调节的情况中,可以利用各种技术抑制这种靶基因和/或蛋白质的表达、合成或活性。例如,根据本发明可应用经本发明所述方法鉴别的呈现抑制性活性的那些化合物以改善疾病症状。如上所述,所述分子可包括但非限于小的有机分子、肽、抗体等。抑制性抗体技术在下文描述。例如,可给予与内源配体竞争靶基因产物的化合物,其中所述靶基因产物与内源配体结合。所得配体结合的靶基因数目的减少将调节内皮细胞生理学。特别用于这种目的的化合物包括例如可溶的蛋白质或肽,如包含靶基因产物的一或多个胞外结构域或其一部分和/或类似物的肽,包括例如可溶的融合蛋白如具有Ig-尾(Ig-tailed)的融合蛋白(关于产生具有Ig尾的融合蛋白的描述见例如美国专利No.5,116,964.)。或者,结合靶基因产物受体位点但不激活所述蛋白质的化合物如配体类似物或抗体(例如受体-配体拮抗剂)可有效抑制靶基因产物活性。另外,根据本发明也可以应用抑制耙基因表达的反义和核酶分子抑制异常的靶基因活性。这种技术在下文描述。另外,也如下文所描述,可利用三螺旋分子抑制异常的靶基因活性。抑制性反义物、核酶和三螺旋方案显示降低NPC转移能力的化合物是反义物、核酶和三螺旋分子。这种分子被设计为降低或抑制突变的靶基因活性。产生和应用这种分子的技术为本领域技术人员所熟知。反义RNA和DNA分子通过与耙mRNA杂交及阻止蛋白质翻译而直接阻断mRNA的翻译。关于反义DNA,优选衍生自翻译起始位点、例如位于感兴趣的革E基因核苷酸序列的-10至+10区域之间的寡脱氧核糖核苷酸。核酶是能催化RNA特异性裂解的酶RNA分子。核酶的作用机制包括核酶分子与互补的靶RNA的序列特异性杂交,随后经内切核酸酶切割。核酶分子的成分必须包括与耙基因mRNA互补的一或多个序列,以及必须包括mRNA切割所需的熟知的催化序列。为此参见以其全文并入作参考的美国专利No.5,093,246所描述。由此在本发明范围内的是工程化锤头状基序核酶分子,其特异性地和有效地催化编码靶基因蛋白质的RNA序列的内切核酸酶切割。任何潜在的RNA靶内的特异性核酶切割位点最初是通过扫描包括GUA、GUU和GUC序列的感兴趣的分子的核酶切割位点而鉴别。一旦鉴别,则可以评价相应于包含所述切割位点的靶基因区域的15-20个核糖核苷酸的短RNA序列的预测的结构特点,如可导致寡核苷酸序列不合适的二级结构。候选序列的适合性也可以通过使用核糖核酸酶保护分析测试其与互补的寡核苷酸杂交的可能性而评价。在三螺旋构成中用于抑制转录的核酸分子应是单链的并由脱氧核糖核苷酸组成。这些寡核苷酸的基本成分必须设计为通过Hoogsteen碱基配对原则促进三螺旋形成,这通常需要双链体的一个链中存在相当大的一段嘌呤或嘧啶的序列。核苷酸序列可以基于嘧啶,这样将产生跨越(across)所得三螺旋的三个相关联链的TAT和CGC+三联体。富含嘧啶的分子提供了与双链体的一个链的富含嘌呤区域以与该链平行的方向的碱基互补。另外,可以选择富含嘌呤的核酸分子,例如一段含有G残基的序列。这些分子与富含GC碱基对的DNA双链体形成三螺旋,其中大部分嘌呤碱基位于靶双链体的一个链上,导致GGC三联体跨越三螺旋中的三个链。或者,可被靶向而用于三螺旋形成的潜在序列可通过产生所谓的"switchback"核酸分子而增加。Switchback分子是以交替的5'-3'、3'-5'方式合成的,由此其首先与双链体的一个链进行碱基配对,然后与另一个链进行碱基配对,从而无需在双链体的一个链上存在一段相当大的嘌呤或嘧啶的序列。本文描述的反义物、核酶和/或三螺旋分子可降低或抑制正常及突变的靶基因等位基因产生的mRNA的转录(三螺旋)和/或翻译(反义物、核酶)。为了保证维持靶基因活性的正常水平,可以将编码和表达呈现正常活性的靶基因多肽的核酸分子通过基因疗法导入细胞中,所述基因疗法如下文所述那些方法,不包含对应用的反义物、核酶或三螺旋治疗易感的序列。为了保证维持靶基因活性在基本正常的水平,可以将编码和表达呈现正常活性的靶基因多肽的核酸分子通过如下文所述基因疗法导入细胞中,所述核酸分子不包含对应用的反义物、核酶或三螺旋处理易感的序列。或者,可优选将正常的靶基因蛋白质共同给予所述细胞或组织中,以维持细胞或组织靶基因活性的必需水平。可以根据本领域己知的合成DNA和RNA分子的任何方法制备本发明的反义RNA和DNA、核酶及三螺旋分子。这些方法包括本领域熟知的化学合成寡脱氧核糖核苷酸和寡核糖核苷酸技术,例如固相膦酰胺(phosphoramidite)化学合成方法。或者,RNA分子可以通过编码反义RNA分子的DNA序列的体外和体内转录而产生。这种DNA序列可以掺入包含合适的RNA聚合酶启动子如T7或SP6聚合酶启动子的多种载体中。或者,可以将根据所用启动子而组成型或诱导型合成反义RNA的反义cDNA构建体稳定导入细胞系中。可以对DNA分子中进行各种熟知的修饰以提高胞内稳定性和半衰期。可能的修饰包括但非限于在所述分子的5,和/或3,末端两侧加入核糖核苷酸或脱氧核糖核苷酸序列,或者在寡脱氧核糖核苷酸主链中使用硫代磷酸或者2'O-甲基键而不是磷酸二酯键。靶基因产物的抗体可以使用特异于靶基因蛋白质并干扰其活性的抗体以抑制耙基因功能。这种抗体可以使用本领域已知的标准技术针对蛋白质自身或者相应于蛋白质一部分的肽而产生。这种抗体包括但非限于多克隆抗体、单克隆抗体、Fab片段、单链抗体、嵌合抗体等。在靶基因蛋白质是胞内完整抗体的情况中,可优选内化型抗体(internalizingantibody)。然而,可以使用lipofectin脂质体将所述抗体或结合靶基因表位的Fab区域片段输送至细胞中。在使用所述抗体的片段的情况中,优选结合靶蛋白质的结合结构域的最小抑制片段。例如,可以使用这样的肽,其具有相应于结合靶基因蛋白质的抗体可变区的结构域的氨基酸序列。这种肽可以是利用本领域熟知的方法经化学合成的或者通过重组DNA技术产生的(例如见Creighton,1983,如前;及Sambrooketal.,1989,如前所述)。或者,也可以给予结合胞内靶基因表位的单链中和抗体。这种单链抗体可例如通过在耙细胞群内表达编码单链抗体的核苷酸序列而给予,通过例如Marascoetal.(Marasco,W.etal.,1993,Proc.Natl.Acad.Sci.USA90:7889-7893)所述那些技术进行。在一些情况中,靶基因蛋白质是胞外蛋白质或者是跨膜蛋白质。特异于基因产物的一或多个胞外结构域并干扰其活性的抗体特别适用于治疗乳腺癌。由于这种抗体可从血流中直接到达靶区域而特别有效。下文描述的适合给予肽的任何给予技术均可用于将抑制性靶基因抗体有效地给予至其作用部位。恢复靶基因活性的方法导致NPC转移的耙基因在疾病状态下可以被低表达。在基因在疾病状态下被下调或者靶基因产物的活性被消除,导致疾病症状产生的情况中,可以应用这样的方法,其使得靶基因活性水平可以增加至其中NPC疾病症状得以改善的水平。基因活性水平可例如通过增加存在的耙基因产物的水平或者通过增加存在的活性靶基因产物的水平而增加。例如,可以给予呈现这种症状的患者足以降低NPC转移的水平的靶基因蛋白质。可利用下文描述的任何技术进行给予。本领域技术人员已知怎样利用下文描述的那些技术确定正常靶基因蛋白质的有效非毒性剂量浓度。另外,可以将编码靶基因蛋白质的RNA序列直接给予显示NPC转移的患者,所述的RNA序列以足以产生改善这种症状的靶基因蛋白质的水平浓度给予。可以利用下文描述的可实现胞内给予化合物的任何技术如脂质体给予法来给予这种RNA分子。所述RNA分子可以例如通过本领域已知的重组技术产生。另外,可以通过基因置换疗法治疗患者。使用载体可以将正常靶基因的一或多个拷贝或者指导具有靶基因功能的正常靶基因蛋白质产生的基因部分插入细胞中,所述载体除了将DNA导入细胞中的其他微粒如脂质体之外,还包括但非限于腺病毒载体、腺伴随病毒载体和逆转录病毒载体。另外,可利用如上述那些技术将正常靶基因序列导入人体细胞中。然后将含有表达基因序列的正常靶基因的细胞、优选自体细胞导入或者再导入患者一定部位中以改善症状。当例如靶基因产物是分泌的胞外基因产物时,优选这种细胞置换技术。药物制备与给药方法经鉴别抑制靶基因表达、合成和/或活性的化合物可以治疗有效量给予患者,以治疗或降低NPC转移。治疗有效量是指足以使得症状改善的化合物的量。有效量所述化合物的毒性和治疗效果可以通过标准药物学方法在细胞培养物或实验动物中确定,例如确定LD50(50%致死量)和ED50(50%治疗有效量)。毒性与治疗作用之间的剂量比率为治疗指数,其可以LD50/ED50比率表示。显示较高治疗指数的化合物是优选的。当使用呈现毒性副作用的化合物时,应仔细设计输送系统以将这种27化合物靶向受影响组织部位,使得对未受影响的细胞的潜在损害最小化,从而降低副作用。得自细胞培养物分析和动物研究的数据可用于制定用于人体的剂量范围。这种化合物的剂量优选包括ED50的循环浓度范围,在所述浓度范围毒性很低或无毒性。所述剂量根据应用的剂型和给药途径而可以在这个范围内变化。对于本发明方法中使用的任何化合物而言,治疗有效量最初可以从细胞培养物分析中估算。可以在动物模型中配制药剂以达到这样的循环血浆浓度范围,其中包括在细胞培养物中确定的IC50(即达到症状的半数最大抑制的测试化合物浓度)与相同水平的范围。这个信息可用于更精确地确定在人体中的有效剂量。血浆中的水平可以例如通过高效液相层析技术测量。配制及应用根据本发明应用的药物组合物可以使用一或多种生理学可接受的载体或赋形剂以常规方式配制。因此,可以配制所述化合物及其生理学可接受的盐和溶剂化物,以通过吸入或吹入法(通过口或鼻)或者口服、含服、肠道外或直肠给药方式给予。对于口服给予方式,药物组合物可以是例如通过常规方式用药物学可接受的赋形剂配制的片剂或胶囊,所述赋形剂如结合剂(例如预糊化的玉米淀粉、聚乙烯吡咯垸酮或羟丙基甲基纤维素)、充填剂(例如乳糖、微晶纤维素或磷酸氢钙)、润滑剂(例如硬脂酸镁、滑石或硅石)、崩解剂(例如马铃薯淀粉或羧甲淀粉钠(sodiumstarchglycolate)),或者增湿剂(例如十二垸基硫酸钠)。片剂可以通过本领域熟知的方法包被。口服的液体制品可以是例如溶液、糖浆或悬浮液形式,或者可以是干品,在使用之前用水或其他合适载体组建。这种液体制品可以通过常规方式用药物学合适的添加剂制备,所述添加剂如悬浮剂(例如山梨醇糖浆、纤维素衍生物或氢化可食用脂肪)、乳化剂(例如卵磷脂或阿拉伯树胶)、非水溶液载体(例如杏仁油、油脂、乙醇或分馏的植物油),及防腐剂(例如甲基或丙基-p-对羟苯甲酸酯或山梨酸)。所述制品也可以适当地含有缓冲盐、调味品、色素和甜味剂。口服制品可以适当配制以控制活性化合物的释放。对于含服方式给药,组合物可以是以常规方式配制的片剂或锭剂形式。对于吸入方式给药,本发明使用的化合物是从加压包装或喷雾器中以气雾形式常规给予的,使用合适的推进剂如二氯二氟甲垸、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其他合适的气体。在加压气雾剂情况中,剂量单位可以通过输送计量数量的阀门控制而确定。用于吸入器或吹入器中的例如凝胶的药囊(Capsules)和药筒(cartridges)可以配制为含有所述化合物及合适的粉末基质如乳糖或淀粉的混合粉末的形式。化合物可以配制为用于通过注射经肠道外给予,例如推注或持续输注而给予。注射配制品可以单位剂量形式存在,例如存在于具有添加的防腐剂的安瓿或多剂量容器中。组合物可以是油相或水相载体中的悬浮液、溶液或乳状液形式,可以含有配制剂如悬浮剂、稳定剂和/或分散剂。或者,活性成分可以是在使用之前用合适载体如无菌无热原水组建的粉末形式。化合物也可以配制为经直肠给药形式,如栓剂或保留灌肠,例如含有常规的栓剂基质如可可油或其他甘油酯。除了前述的配制品之外,化合物也可以配制为储库型(depot)制品。这种长效配制品可以通过植入(例如皮下或肌内)或者通过肌内注射给予。因此,例如化合物可以用合适的聚合物或疏水材料或者离子交换树脂配制,或者配制为难溶的衍生物,例如难溶的盐。如果需要,则组合物可以存在于包含含活性成分的一或多个剂量形式的包装或分配器中。所述包装可例如包含金属或塑料薄膜,如铝塑包装。所述包装或分配器可以附带给药说明书。附图简述结合附图可以更好地认识到本发明的各种特征及伴随的优势,其中不同视图中相同或相似的部分用类似参考特征标出图1示出了用于基于mRNA转录物谱数据产生和确认分子预测因子的策略概述。图2示出了使用选自96个训练组(trainingset)病例的798个基因进行的分层聚类分析(hierarchicalclusteranalysis)。各个基因在左侧和右侧成排示出。各个病例在上方以柱示出。结果表明基因簇聚于6个组中,在左侧以有色条柱示出。图3示出对通过52个基因特征和k-最近邻分类方法(k-nearestneighborsclassifyingmethod)预测为低远处转移风险和高远处转移风险病例进行的无转移生存概率和总体生存概率的Kaplan-Meier分析。所示结果得自独立的测试组病例。p值用log-rank检验计算。图4示出对通过12个基因特征和逻辑回归模型预测为低远处转移风险和高远处转移风险病例进行的无转移生存的概率和总体生存的概率的Kaplan-Meier分析。所示结果得自独立的测试组病例。p值用log-rank检验计算。图5示出根据52个基因和12个基因特征的组合预测结果对无转移生存的概率和总体生存的概率的Kaplan-Meier分析。在两种特征之间示出不一致结果的病例被认为是"不确定病例"(表6)。示出一致结果的病例分类为低或高远处转移风险的类别。当对比低风险和高风险特征组的无转移和总体生存期时,p值分别O.OOOl和0.002。不确定组与低风险或高风险'组之间在无转移生存期(p-0.09和0.05)和总体生存期(p-0.31和0.09)之间无显著差异。p值用log-rank检验计算。图6示出对有和无远处转移的III期或IVa/b期NPC患者之间总体生存期和无转移生存期的概率的Kaplan-Meier分析。这项研究中包括的大多数患者在1997年至2002年之间根据制定的方案开始接受治疗,随后定期进行。上面一组示出四组患者的总体生存期曲线。有106名III期患者不发生远处转移,27名III期患者发生远处转移。相似地,有47名IV期患者不发生远处转移,35名IV期患者发生远处转移。发生和不发生远处转移的III期或IV^期患者之间的总体生存期的差异均是显著的,p值〈0.0001。在发生(p峋.39)或不发生(p《35)远处转移的III期和IVa/b期患者之间无显著差异。下面一组示出最后发生远处转移的III期和IVa/b期患者的无转移生存期的概率。所有III期患者仅用同时的化疗-放疗和辅助化疗治疗,而对IVa/b期患者加上维持化疗。图7示出两个不同操作者之间"存在(present)"的探针集的中位值强度相关性。训练组中所有NPC样品均由两个操作者随机操作。操作者A操作训练组中24个无转移病例和14个阳性转移病例。操作者B操作35个无转移病例和18个阳性转移病例。计算每个操作者操作的病例的每个探针集的标准化表达强度的中位值。结果示出完全的对角线性相关,提示不存在与操作者相关的系统性偏差。图8示出在探针水平校正实验偏差的分位数校正(Quantilenormalization)结果。来自6个(I-VI)不同NPC样品的cRNA样品分为两部分,与两种U133-A基因芯片在不同日期杂交。对于每个病例,在U133-A基因芯片上进行人基因的所有探针集的强度相关性分析,如图所示。上面一组示出来自未标准化的chp文件的探针集强度的相关性。中间组示出在按比例换算切尾均值为500之后探针集强度的相关性。下面一组示出在将所有人探针集的表达强度经分位数校正为预先确定的标准值之后探针集强度的相关性。结果示出在探针集水平分位数校正有效校正了实验偏差。不用进一步详细描述,据信本领域技术人员根据前文描述可以最大程度应用本发明。如下优选的特定实施方案仅是例证了本发明,而无以任何方式限制本发明之意。在前述及如下的实施例中,除非特别指出,则所有温度均设定为摄氏度,所有部分和百分比均为重量比。在优选的方面中,本发明提供了1.评估鼻咽癌患者发生远处转移的风险的方法,所述方法包括评估得自所述患者的样品中表4禾n5所列基因中的至少一个基因的表达谱。2.如1所述的方法,包括评估表4列出的52个基因中的两或多个基因的表达谱。3.如1所述的方法,其包括评估表4列出的52个基因的表达谱。4.如3所述的方法,其中对表4所列52个基因的表达的评估是使用表4示出的9个基因簇中的每一个基因簇的回归模型进行的。5.如4所述的方法,其中洛基分数(logitscore)是针对所述9个基因簇中的每一个基因簇使用表1所示的相应的回归模型公式产生的。6.如5所述的方法,其中远处转移风险的预测规则是通过应用于所述9个基因簇的所述洛基分数的k-最近邻分类方法而产生的。7.如1所述的方法,包括评估表5列出的12个基因中的两或多个基因的表达谱。8.如l所述的方法,包括评估表5列出的12个基因的表达谱。9.如8所述的方法,其中表5列出的12个基因的表达的评估是使用逻辑回归模型进行的。10.如9所述的方法,其中洛基分数是使用表2的回归模型公式基于所述12个基因的表达谱而产生,所述洛基分数与发生远处转移的风险相关联。11.如IO所述的方法,其中低远处转移风险的预测规则是-=1i+e-(洛基分数)12.如6所述的方法,其中将得自所述预测规则的远处转移风险与得自第二独立预测规则的远处转移风险进行对比,所述第二预测规则是使用如下公式评估所述风险=1j+e-(洛基分数)其中洛基分数是使用表2的回归模型公式和表5列出的12个基因的表达谱产生的。13.如12所述的方法,当从这两种方法中确定的远处转移风险均为低或高时,则分别将该风险记录为低风险或高风险;当所述确定的风险不一致时,则将该风险记录为不确定。14.如l所述的方法,其中所述表达谱在NPC肿瘤样品中评估。15.如1所述的方法,其中所述表达谱从mRNA转录中产生。16.用于确定鼻咽癌患者中远处转移风险的核酸微阵列,其主要由确定下述基因的表达谱的探针组成(a)表4列出的52个基因,(b)表5列出的12个基因或者(c)所述52个及12个基因。17.在介质或试剂盒形式中的集合,其主要由表4列出的所有52个基因和/或表5列出的所有12个基因;和/或所述52个基因的子集或所述12个基因的子集或前述两个子集组成,在每种情况中所述子集均可有效预测鼻咽癌患者发生远处转移的风险。实施例实施例l对在治疗之前获得的原发NPC的138个组织活检样品进行mRNA转录物谱分析。所述样品代表NPC患者的两个相反临床组在开始治疗后三年内发生远处转移组(高风险组,n=47)、随诊三年以上的时间内无远处转移组(低风险组,n=91)。将138个样品的2/3随机确定为训练组,1/3随机确定为测试组。进行监督分析(Supervisedanalyses)以揭示训练组(r^96)中与发生远处转移相关的基因表达特征。所揭示的分子预测因子在单独的42个样品的测试组中确证。患者选择和肿瘤组织可利用在台湾台北辜公亮基金会和信治癌中心肿瘤库(KF-SYSCC)于1992年至2004年收集的375名NPC患者的原发肿瘤的新鲜冷冻的活检组织样品进行总RNA提取。获得所有患者的书面知情同意书,并且这项研究获得伦理委员会的许可。105名患者的RNA严重降解,将其从该研究中排除。在剩余的270个样品中,仅138个样品符合如下任一标准,选择用于该研究中。针对留待选用的患者的第一项选择标准是其未发生远处转移及在开始治疗的三年或更多年内定期随诊。这组患者(11=91)称作远处转移临床低风险组。针对留待选用的患者的第二个选择标准是其在接受首次治疗时已经发生远处转移或者在开始治疗的三年内发生远处转移。远处转移是指NPC在肺、骨、肝、肾、脑及其他内脏器官中的转移。经过细针穿刺活检或者穿刺活检经组织学检测证实转移。这组患者(11=47)称作远处转移临床高风险组。在1995年至2004年之间收集所有符合条件的患者的原发肿瘤组织活检样品,排除在1992年收集的一个样品。大多数样品(83%)在1998年至2001年收集。患者年龄在诊断时为11至71岁,中值和平均值分别为44和45岁。在最初诊断和分期后,根据拟定方案对患者进行治疗31。后续的治疗时间的中值和平均值分别为3.34和3.29年。在后续的治疗期间,29名患者死亡,其中28名患者为临床高风险组成员。根据1997AJCC规定对NPC患者进行分期。mRNA转录物谱分析研究使用Trizol试齐U(Invitrogen,Carlsbad,CA),根据厂商指导从于液氮中冷冻的组织中分离总RNA。使用RNAEasyMini试剂盒(Qiagen,Valencia,CA)对分离的RNA进一步纯化,在Agilent2100生物分析仪(AgilentTechnologies,Waldbronn,Germany)中通过RNA6000Nano分析定性。用于基因表达谱研究的所有RNA样品的RNA分子完整性指数(RNAIntegrityNumber,RIN)均在6.0至10.0之间(7.8±1.1,平均值士SD)之间。根据Affymetrix方案从总RNA中制备杂交耙,并与AffymetrixU133A基因芯片杂交。所述U133A基因芯片含有大约13,000个人体基因的22,238个探针集。所述阵列的特征为常见那样,例如在Affymetrix网站(www.affVmetrix.com/products/arravs)详细描述。简而言之,从每个样品的8吗总RNA中合成双链cDNA。生物素标记的互补RNA(cRNA)通过从cDNA中体外转录而产生。在杂交之前纯化所述cRNA并经化学方式片段化。根据生产商的方案组合特定量的片段化cRNA、探针阵列对照、牛血清白蛋白和鲱精DNA以制备混合物。将所述cRNA混合物与寡核苷酸探针在U133A基因芯片上在45'C杂交16小时。在杂交后,使用EukGEWS2v4方案将杂交的探针阵列在Affymetrix基因芯片洗涤工作站400中进行自动洗涤和染色。之后在AffymetrixGeneArray扫描仪2500中扫描U133A基因芯片。微阵列数据的换算与标准化i吏用AffymetrixMicroarrayAnalysisSuite(MAS)5.0软^牛,通过靶修正均值500换算确定每个基因的表达强度。U133A基因芯片上经换算的所有人体基因的表达强度以基数2进行对数转换,使用分位数校正方法标准化32。分位数校正的参考标准预先在我们的实验室中从164个原发NPC、15个正常鼻咽部组织及23个转移的NPC的U133A基因芯片数据中确定。见2004年12月20日的USSN11/015,764及2004年3月28日的USSN11/090,294所述,所述文献在此以其全部内容并入作参考。其他U133A基因芯片数据的定性测量数据包括作为"存在"而可察觉的基因的百分比(52.1±5.8%,平均值±SD),及GAPDH3,与5,的比率(0.96士0.18,平均值士SD)。这两个参数均支持样品和分析的良好总体质量。实施例II数据的统计学分析应用的统计学分析方法在图1中概括示出。样品分为训练组和测试组在我们的研究所包括的138个NPC病例中,91个病例在开始首次治疗后不发生任何远处转移并随诊超过三年。这91个病例分类为临床低远处转移风险组。在剩余的47个病例中,在首次治疗或者在开始首次治疗后的三年内均发生远处转移。将其分类为临床高远处转移风险组。对于所有患者,首次诊断日期与首次治疗日期之间的平均间隔为20±51天(平均值士SD)。使用SAS软件(版本9.1)将每个风险组2/3的患者随机指定为训练组(SAS软件可得自SASInstituteInc.,Cary,NC.)。1/3的患者指定为测试组。对低风险组患者根据性别、年龄(^和>45岁)、1997AJCCTNM分期(I和II期对III和IV期)、后续治疗时间(^和>4.5年)分出层次。对高风险组患者根据性别、年龄、TNM分期及从首次治疗至发生远处转移的时间(S和>1.5年)分级。在训练组中有62个低风险病例和34个高风险病例;在独立的测试组中有29个低风险病例和13个高风险病例。所述独立的测试组样品不参与训练过程。选择用于分析的基因仅选择通过AffymetrixMAS5.0软件在排除测试组样品的所有NPC样品中确定"存在"其表达的探针进行分析。首先使用GeneLinkerPlatinum4,5软{牛(PredictivePatternsSoftware,Inc.,Irwerary,Canada),对每个基因经标准化和对数转换的表达数据在低风险组和高风险组之间进行Kruskal-Wallis检验分析。选择p值0.05的798个基因通过自组织映射(SOM)方法(GeneLinkerPlatinum4.5software)进行进一步研究。SOM分析通过SOM分析所述798个基因。SOM分析的参数包括基因方向、距离的Pearson相关系数、及2(高度)X3(宽度)的一维映像(mapdimension)。对于参考向量和算法性质,使用默认值。2X3维数的选择根据对训练组病例798个基因的分层聚类分析进行(图2)。这种方法提供了选择SOM分析映射范围的客观方式。将所有798基因分为六个不同SOM基因簇(I至VI)。使用SPSS9.0软件(SPSS,Inc.,Chicago,Illinois)通过二元前进法逻辑回归进一步选择每个SOM基因簇中的基因。前进法逻辑回归的入口(Entry)和去除(removal)p值分别为O.05和〉0.1。在逻辑回归分析之后,选自SOM基因簇II、V和VI的基因数目分别为6、6和5。在逻辑回归期间,SOM基因簇I、III和IV被完全分离。随后,对SOM基因簇I、m和IV的基因单独进行二维SOM分析。SOM基因簇Ia、Ib、IIIa、IIIb、Iva和IVb中选择的基因的所得数目分别为9、5、8、4、6和3。因此,在九个SOM基因簇中有52个基因。预测方法的确立确立鉴别发生高远处转移风险的NPC患者的两种预测方法。第一种方法基于九个SOM基因簇中的52个基因。针对每个基因簇的基因建立回归模型。每个回归模型的公式列于表l。针对每个样品从每个公式中产生洛基分数(logitscore)。训练组中每个样品的九个洛基分数(logitscore)用于产生预测规则,使用SAS9.0软件通过k-最近邻(k-NN)分类方法进行。使用训练组独立检验l、3、5、10和30的"k"值。进行Leave-one-out交叉验证。根据leave-one-out交叉验证,检验的k值为10时提供最佳结果,选择其进行预测方法。第二种预测方法基于得自原始SOM基因簇I中197个基因的12个基因。如上所述,在使用前进法选择分析进行逻辑回归期间三个SOM基因簇示出完全分离。结果提示这三个SOM基因簇的潜在亭度预测价值。为了鉴别哪个SOM基因簇的基因可以可靠地用于预测,38使用训练组病例通过二元前进法逻辑回归(SPSS9.0软件)从每个SOM基因簇中选择基因,基因的选择在发生完全分离之前正确停止。从每个基因簇中选择的基因用于产生洛基分数(logitscore),将其用于估算概率。概率高于0.5则指定为低远处转移风险,概率低于0.5则指定为高远处转移风险。结果示出使用训练组病例从SOM基因簇沖选择的12个基因产生最佳结果。基于SOM基因簇I中12个基因的回归模型的公式示于表2。生存期分析使用SAS9.0软件通过Kaplan-Meierlogrank检验进行无转移生存期和总体生存期分析。生存期解释为首次治疗开始日期至最后一次随诊日期或死亡日期之间的期间。无转移生存期是指首次治疗开始日期至首次诊断远处转移的日期之间的期间。实施例III结果概述正如所示出的,确定两个预测因子鉴别处于发生高远处转移风险或低远处转移风险中的NPC患者。第一个预测因子基于在九个不同的自组织映射聚类数(selforganizingmapsclusters)中的52个基因和k-最近邻分类方法。第二个预测因子基于12个基因和逻辑回归模型。这两种方法均可强烈预测独立的测试组病例中短的远处转移间隔期和短的总体生存期。这两种方法在独立的测试组中估定的总精确率分别为81%和76%。当组合这两种预测方法时,精确率增加至85%。高风险特征组与低风险特征组之间的估计的发生远处转移风险比为ll.l(95%置信区间2,4-52.4,p=0.002)。患者的特征为了鉴别预测处于发生高或低远处转移风险并具有不良或良好总体生存期的NPC患者的基因特征,在两组临床充分确定的NPC患者之间进行监督分析。已经充分认识到在首次治疗后三年内不发生远处转移的NPC患者具有良好的长期无转移生存期和总体生存期31,33。相反,在首次治疗时或之后的三年内发生远处转移的NPC患者通常死于该疾病及具有不良的生存期。在我们研究的138名患者中,91名患者属于临床低风险组,47名患者属于临床高风险组。随机指定2/3的低风险患者和高风险患者为训练组,1/3的患者为测试组。这些患者的特征示于表3。在低风险组和高风险组训练组与测试组病例之间列出的临床特征无显著差异。另外,训练组(r^34)和测试组(n-13)的远处转移部位的分布为骨50%vs69%,肝50。/。vs54。/。,肺38%vs23%,其他部位15%vs23%。其他部位包括脑、肾、脾和盆腔器官。两组之间分布相似。实施例IV通过52个基因的特征预测远处转移为了鉴别预测基因,进行高度监督分析。这项研究中仅使用在排除测试组病例后所有NPC样品中通过AffymetrixMAS5.0软件可以确定为"存在"的基因(4,814个探针集)。然后在训练组的临床低风险组和临床高风险组之间进行Kruskal-Wallis检验。选择示出其表达显著差异(p<0.05)的798个基因进一步研究。使用选择的798个基因对训练组病例进行无人监督的分层聚类分析。结果示出六个主要基因簇(图2)。基于分层聚类分析结果,选择2X3的一维映像进行SOM分析。每个SOM簇中的大多数基因聚集在一起,与通过分层聚类分析产生的基因簇平行。所述六个SOM簇的每一基因簇中的基因通过逻辑回归进一步分析,在训练组中用前进法选择低风险和高风险病例。三个SOM簇基因示出完全分离的问题。这三簇中每簇的基因通过SOM针对两个亚簇进一步分析。从九个SOM基因簇中选择共52个基因,用于产生针对远处转移的预测模型。这52个基因概括示于表4中。用于从每个SOM簇中基因中确定洛基分数(logitscore)的公式示于表l。因此,从每个病例的所述52个基因的表达强度中产生9个洛基分数(logitscore)。训练组中每个病例的所述9个洛基分数(logitscore)用于通过k-NN分类方法建立预测规则。针对预测规则的Leave-one-out交叉验证示出预测训练组病例远处转移为高风险的特异性和灵敏性分别为98%(61/62)和88%(30/34)。总精确率为95%(91/96)。当根据确定的预测规则分析独立的测试组病例(n-42)时,特异性、灵敏性和总精确率分别为86%(25/29)、69%(9/13)和81°/。(34/42)。针对相关性(association)的Fisher,s确切概率法(exacttest)(p-0.0007)证实所述52个基因预测因子的稳健性(robustness)。就远处转移和较短总体生存期而言,预测的高风险特征组与低风险特征组之间估计的危险性比(estimatedhazardratio)分别为7.1(p=0.002,95%置信区间2.2-23.5)和5.4(p=0.001,95%置信区间1.5-19.4)。当对比预测为低远处转移风险(11=29)或高远处转移风险(11=13)测试组中的患者的无转移生存期和总体生存期时,预测为具有高远处转移风险的患者具有显著较短的无转移生存期(p-0.0001)和较短的总体生存期(pi.003)(图3)。实施例V通过12个基因特征预测远处转移第二种预测方法基于通过逻辑回归分析中SOM簇I中的基因中选择的12个基因。用于计算低远处转移风险的概率的公式在表2中概述。所述12个基因列于表5中。当所述12-基因预测规则应用于所述独立的测试组病例(n-42)时,预测高风险转移的灵敏性、特异性和总精确性分别为85%(11/13)、72%(21/29)和76%(32/42)。对于这12个基因预测因子,针对相关性的Fisher,s确切概率法(p-0.0008)证实与所述52个基因预测因子的相似稳健性。就远处转移和较短的总体生存期而言,预测的高风险和预测的低风险特征组之间估计的危险性比分别为8.2(p=0.006,95%置信区间1.8-37.4)和6.3(p=0.02,95%置信区间1.3-29.7)。当分析通过12个基因预测因子预测为低风险(n-23)或高风险(n49)病例的无转移生存期和总体生存期时,'结果示出经预测为高远处转移风险的患者具有显著较短的无转移生存期(p-0.0007)和总体生存期0)=0.007)(图4)。实施例VI通过组合特征预测远处转移当分析实施例IV和V的两种预测方法的结果在独立测试组病例中的一致性时,有22例(52%)由这两种方法均预测为低风险病例及12例(29%)预测为高风险病例(表6)。有8例(19%)在这两种方法之间不一致,认为是不确定病例。在一致的情况中(11=34),有5例是错误预测病例,3例是假阳性及2例是假阴性病例。因此,总精确率为85%(29/34)。就远处转移和较短的总体生存期而言,高风险与低风险特征组之间的估计的危险性比分别为U.l(p=0.002,95%置信区间2.4-52.4)和8.5(p=0.009,95%置信区间1.7-42.8)。对经预测为低风险、高风险和不确定的病例进行生存期分析表明高风险病例较经预测为低风险的那些病例具有明显较差的无转移生存期和总体生存期(图5)。低风险和不确定病例之间无转移生存期与总体生存期之间的差异无统计学意义。实施例VIIIII期和IV期NPC患者之间生存期对比为了认识到确定的预测方法的潜在临床效果,收集i33个m期和82个Iva和IVb(IVa/b)期NPC患者的临床资料。在这些患者中,仅90例是上述mRNA转录物谱分析研究的一部分。所有患者均已经根据拟定的方案31在1997年至2003年之间进行治疗及后续的随诊。将TNMm或IVa/b期患者根据随后远处转移的发生而进一步分为两组。对比这四组患者的总体生存期和无转移生存期。结果示出随后发生远处转移的III期NPC患者的总体生存期与无转移生存期与也发生远处转移的IVa/b期患者(n-35)的总体生存期和无转移生存期相似(图6)。相反,未发生远处转移的III期(i^l06)或IVa/b期(n4:7)患者较发生远处转移的那些患者具有较好的总体生存期(图6)。结果表明在III期或IV^b期患者中存在两个不同组。一组呈现发生远处转移的低风险水平及良好的临床结果。另一组在开始治疗的三年内发生远处转移并具有不良的生存结果(图6)。这些发现支持了这样的观点,即对于处于发生高远处转移风险中的患者的精确预测不仅具有重要的预知意义,而且还提供了选择合适患者测试新的治疗形式以改善长期治疗效果的方式。参考文献1.Lo,W.K.,To,K.F.&Huang,D.P.Focusonnasopharyngealcarcinoma-CancerCell5,423-428(2004).2.Altun,Metal.Undifferentiatednasopharyngealcancer(UCNT):currentdiagnosticandtherapeuticaspects.Int.J.Radiat.Oncol.Biol.Phys.32:859-877(1995).3.Young,L.S.&Riskinson,A.B.Epsein-Barrvirus:40yearson.NatureRevCancer4:757-768(2004).4.Cohen,J丄Epstein-Barrvirusinfection.NewEngJMed343,481-492(2000).5.Yu,M.C.Nasopharyngealcarcinoma:EpidemiologyandDietaryFactorspp.39-47.Lyon:IARC,(1991)6.Ho,J.Nasopharyngelcarcinoma.Adv.CancerRes.15:59-72(1972)7.Yeh,S.&Cowdry,E.IncidenceofmalignanttumorsinChinese.Cancer7:425-436,1954.8.Yu,M.C.&Henderson,B.E.Nasopharyngealcancer.In:SchottenfieldD,FraumeniJF,eds.Cancerepidemiologyandprevention.2nded.NewYork:OxfordUniv.Press1996:603-18.9.Fandi,A.etal.Nasopharyngealcancer:epidemiology,staging,andtreatment.Semin.Oncol.21:382-397(1994).10.Vikram,B,etal.Patternsoffailureincarcinomaofthenasopharynx:failureatdistantsites.HeadNeckSurg.8:276-279(1986).11,Hung,S.C.Nasopharyngealcancer:areviewof1605paatientstreatedradicallywithcobalt60,Int.J.RadiatOncol.Biol.Phys.6:401-407(1980).12.Geara,F.B.etaLCarcinomaofthenasopharynxtreatedbyradiothera[yalone:determinantsofdistantmetastasisandsurvival.Radiother.Oncol,43:53-61(1997).13.Perez,C.A.etal.Carcinomaofthenasopharynx;factorsaffectingprognosis.Int.J.Radiat.Oncol.Biol.Phys.23:271-280(1992).14.Lee,A.W.M.etal.Retrospectiveanalysisof5037patientswithnasopharyngealcarcinomatreatedduring1976-1985:overallsurvivalandpatternsoffailure.Int.J.Radiat.Oncol.Biol.Phys.23:261-270(1992).15.Agulnik,M&Siu,L丄.State-of-the-artmanagementofnasopharyngealcarcinoma:currentandfuturedirections.Br.J.Cancer92:799-806(2005).16.LangendijkJA,LeemansCR,ButerJ,eta;/Theadditionalvalueofchemotherapytoradiotherapyinlocallyadvancednasopharyngealcarcinoma:ameta-analysisofhepublishedliterature.JClinOncol2004;22:4604-4612.17.Chang,J.T-C.etaLNasopharyngealcarcinomastagingby9180F-fluorodeoxyglucosepositronemissiontomography.Int.J.Radiat.Oncol.Biol.Phys.62:501-507(2005).18.Perou,C,M.etal.Molecularportraitsofhumanbreasttumours.Nature406:747-752(2000).19.AlizadehAA,EisenMB,DavisRE,etal.DistincttypesofdiffUselargeB-celllymphomaidentifiedbygeneexpressionprofiling.Nature2001;405:503-511.20.KhanJ,WeiJS,RingerM,etal.Classificationanddiagnosticpredictionofcancersusinggeneexpressionprofilingandartificialneuralnetworks.NatureMed2001;7;673-679,21.DyrskjotL,ThykjaerT,KruhofferM,etal.Identifyingdistinctclassesofbladdercarcinomausingmicroarrays.NatureGent2003;33:90-96.22.BullingerL,DohnerK,Blaire,etal.Useofgene-expressionprofilingtoidentifyprognosticsubclassesinadultacutemyeloidleukemia.NewEngJMed2004;350:1605-1615.23.van'tVeerLJ,DaiH,vandeVijverMJ,etal:Geneexpressionprofilingpredictsclinicaloutcomeofbreastcancer.Nature2002;415:530-536.24.PomeroySL,TamayoP,GaasenbeekM,etal.Predictionofcentralnervoussystemembryonaltumouroutcomebasedongeneexpression.Nature2002;415:436-442.25.ShippMA,RossKN,TamayoP,etal.DiffUselargeB-celllymphomaoutcomepredictionbygene-expressionprofilingandsupervisedmachinelearning.NatureMed2002;8:68-74.26.RosenwaldA,WrightG,ChanWC,etal.TheuseofmolecularprofilingtopredictsurvivalafterchemotherapyfordiffuselargeB-celllymphoma.NewEngJMed2002;346:1937-1947.27.HuangE,ChengSH,DressmanH,etal.Geneexpressionpredictorsofbreastcanceroutcome.Lancet2003;361:1590-1596.28.AyersM,SymmansWF,StecJ,etal.Geneexpressionprofilespredictcompletepathologicresponsetoneoadjuvantpaditaxelandfluorouracil,doxorubicin,andcyclophosphamidechemotherapyinbreastcancer.JClinOncol2004;22:2284-2293.29.MazzantiC,ZeigerMA,CostourpusN,etal.Usinggeneexpressionprofilingtodifferentiatebenignversusmalignantthyroidtumors.CancerRes2004;64:2898-2903.30.RoepmanP,WesselsLFA,KettelarijN,etal.Anexpressionprofilefordiagnosisoflymphnodemetastasisfromprimaryheadandnecksqua咖ouscellcarcinoma.NatureGenetics2005;37:182-186.31.ChengSH,TsaiSYC,YenKL,etal.Prognosticsignificanceofparapharyngealspacevenousplexusandmarrowinvolvement;potentiallandmarksofdisseminationforsatgeI-IIInasopharyngealcarcinoma.IntJRadiatOncolBiolPhys2005;61:456-465.32.BolstadBM,IrizarryRA,AstrandM,etal.Acomparisonofnormalizationmethodsforhighdensityoligonucleotidearraydatabasedonvarianceandbias.Bioinformatics2003;19:185-193.33.LeeAWM,SzeWM,AuJSK,etal.Treatmentresultsfornasopharyngealcrcinomainthemodernera:thehongKongExperience.IntJRadiatOncolBiolPhys2005;61:1107-1116.34.YokotaS,YamamotoY,ShimizuK,etal.IncreasedexpressionofcytosolicchaperoninCCTinhumanhepatocellularandcoloniccarcinoma.CellStressChaperones2001;6:345-350.35.LiuH,LiJ&WongL.Useofextremepatientsamplesforoutcomepredictionfromgeneexpressiondata.Bioinformatics2005;21:3377-3384.36.SimonR,RadmacherMD,DobbinK,etal.PitfallsintheuseofDNAmicroarraydatafordiagnosticandprognosticclassification.JNCI2003;95:14-18.37.ChangY,LeeTC,LiJC,LaiTL,ChuaHH,ChenCL,DoongSL,ChouCK,SheenTS,TsaiCH.Differentialexpressionofosteoblast邻ecificfactor2andpolymericimmunoglobulinreceptorgenesinnasopharyngealcarcinoma.HeadNeck.2005Aug3138.FangWY,LiuTF,XieWB,YangXY,WangS,RenCP,DengX,LiuQZ,HuangZX,LiX,DingYQ,YaoKT.Reexploringthepossiblerolesofsomegenesassociatedwithnasopharyngealcarcinomausingmicroarray-baseddetection.ActaBiochimBiophysSin(Shanghai).2005Aug;37(8):541-6.39.LungHL,BangarusamyDK,XieD,CheungAK,ChengY,KumaranMK,MillerL,LiuET,GuanXY,ShamJS,FangY,LiL,WangN,ProtopopovAI,ZabarovskyER,TsaoSW,StanbridgeEJ,LungML.THY1isacandidatetumoursuppressorgenewithdecreasedexpressioninmetastaticnasopharyngealcarcinoma.Oncogene,2005Jun20;[Epubaheadofprint]40,ZhangB,NieX,XiaoB,XiangJ,ShenS,GongJ,ZhouM,ZhuS,ZhouJ,QianJ,LuH,HeX,LiX,HuG,LiG.Identificationoftissue-specificgenesinnasopharyngealepithelialtissueanddifferentiallyexpressedgenesinnasopharyngealcarcinomabysuppressionsubtractivehybridizationandcDNAmicroarray.GenesChromosomesCancer.2003Sep;38(l):80陽90.41.GuoX,LuiWO,QianCN,ChenJD,GraySG,RhodesD,HaabB,StanbridgeE,WangH,HongMH,MinHQ,LarssonC,TehBT.Identifyingcancer-relatedgenesinnasopharyngealcarcinomacelllinesusingDNAandmRNAexpressionprofilinganalyses.IntJOncol.2002Dec;21(6):l197-204.42.HuiAB,LoKW,TeoPM,ToKF,HuangDP.Genomewidedetectionofoncogeneamplificationsinnasopharyngealcarcinomabyarraybasedcomparativegenomichybridization.IntJOncol.2002Mar;20(3):467-73.43.SooR,PuttiT,TaoQ,GohBC,LeeKH,Kwok-SengL,TanL,HsiehWS.Overexpressionofcyclooxygenase-2innasopharyngealcarcinomaandassociationwithepidermalgrowthfactorreceptorexpression.ArchOtolaryngolHeadNeckSurg.2005Feb;l31(2):147-5244.LeeSW,ChoKJ,ParkJH,KimSY,NamSY,LeeBJ,KimSB,ChoiSH,KimJH,AhnSD,ShinSS,ChoiEK,YuE.ExpressionsofKu70andDNA-PKcsasprognosticindicatorsoflocalcontrolinnasopharyngealcarcinoma.IntJRadiatOncolBiolPhys.2005Aug1;62(5):1451-7.45.MaBB,PoonTC,ToKF,ZeeB,MoFK,ChanCM,HoS,TeoPM,JohnsonPJ,ChanAT,Prognosticsignificanceoftumorangiogenesis,Ki67,p53oncoprotein,epidermalgrowthfactorreceptorandHER2receptorproteinexpressioninundifferentiatednasopharyngealcarcinoma—aprospectivestudy.HeadNeck.2003Oct;25(10):864-72.46.FariasTP,DiasFL,LimaRA,Kligerm肌J,deSaGM,BarbosaMM,GoncalvesFBJr.Prognosticfactorsandoutcomefornasopharyngealcarcinoma.ArchOtolaryngolHeadNeckSurg-2003JuI;129(7):794-9.47.HsiaoJR,JinYT,TsaiST,ShiauAL,WuCL,SuWCConstitutiveactivationofSTAT3andSTAT5ispresentinthemajorityofnasopharyngealcarcinomaandco订elateswithbetterprognosis.BrJCancer.2003Jul21;89(2):344-9.48.ChanAT,LoYM,ZeeB,ChanLY,MaBB,LeungSF,MoF,LaiM,HoS,HuangDP,JohnsonPJ.PlasmaEpstein-BarrvirusDNAandresidualdiseaseafterradiotherapyforundifferentiatednasopharyngealcarcinoma.JNatlCancerInst.2002Nov6;94(21):1614-9.49.MaJ,Nicholas,TerryHA,LinSX,PatelN,MaiHG,HongMH,LuTX,CuiNJ,MinHQ.PrognosticsignificanceofDNAploidyandproliferativeindicesinpatientswithnasopharyngealcarcinoma.AiZheng.2002Jun;21(6):644-50.50.RubioL,BurgosJS,Lopez-GuerreroJA,MoreraC,Vera-SempereFJ.Expressionofp53proteinandtumorangiogenesisasprognosticfactorsinnasopharynge.alcarcinomapatients.PatholResPract.2002;198(2):97-102.51.FujiiM,YamashitaT,IshiguroR,TashiroM,KameyamaK.Significanceofepidermalgrowthfactorreceptorandtumorassociatedtissueeosinophiliaintheprognosisofpatientswithnasopharyngealcarcinoma.AurisNasusLarynx.2002Apr;29(2):175-81.52.oYM,ChanAT,ChanLY,LeungSF,LamCW,HuangDP,JohnsonPJ.MolecularprognosticationofnasopharyngealcarcinomabyquantitativeanalysisofcirculatingEpstein-BarrvirusDNA.CancerRes.2000Dec15;60(24):6878-81.53.HengDM,WeeJ,FongKW,LianLG,SethiVK,ChuaET,YangTL,KhooTanHS,LeeKS,LeeKM,TanT,ChuaEJ.Prognosticfactorsin677patientsinSingaporewithnondisseminatednasopharyngealcarcinoma.Cancer.1999Nov15;86(10):1912-20,54.GuoX,MinHQ,ZengMS,QianCN,HuangXM,ShaoJY,HouJH.nm23-Hlexpressioninnasopharyngealcarcinoma:correlationwithclinicaloutcome.IntJCancer.1998Dec18;79(6):596-600.°魏^殺^鹏姐彩《龄^->1:R菌i射'(woosi!soo凝^愛裕冀44^g《明fp「《w。盈翻頃挲W梨對明啄甚^VNH"i明奪扭貌革點姿挲去竊裕斜奪招纷x!JPm4jv明+^班+厶9厶9'lx(ib—卯oe:OZ)+90£Z/Zx(ib—x—S06乙02)+IS8S7x(ib—99S10Z)=I八丄IDCn—————(沖0Z/S-)x(ib—x一s[aO乙)+(Sl78S.Z.)x(ib—s—z_soiOZ)+(S8£9,Z-)x(ib—s—iZ600乙)=八丄IOCH—————+(86S6'o-)x(ib一s—69乙is乙)+(19wn-)x(ib—x">88nz)+aosr乙-)x(w—hkoz)=q八i丄19cn£0£^乙乙+》6乙1^-)x(1B一8it^9)+88丄£'£x(IB—6S98[乙)+SW乙工(1B—696厶I乙)+(8S"'I-)x(1B、smZ)+(9W"x(ib—n6乙I乙)+(t6l9'乙-)x8AI10乙)=b八I丄IDOl+8WZx(IB—乙si60。+^Or乙x(18—s一S9厶80。+SS6"x(IB—o咖OZ)=qill丄IOCH—_86'厶11-(9092'乙-)x(p:s—£1611乙)+(9Z"卞-)X(1B:s〕乙sl乙)+x(1B:x:sniI乙)+I0£8.Zx(1B:s—86980Z)+(S088'l.)二x—t^S卯Z)+91S6'Ax(ib—s—IOKO乙)+WI6'£x(ib—乙179I0乙)+IS980x(ib—s—£乙o乙)=Bni丄IDOl—————6W9Zl(lW。x(IB—x—I乙)+(£8Wl-)xOlB—s—t^SOZ)+(9厶88.e歷)x(W一s—9厶600乙)=II丄IDCH——A600'6A(926!£-)xx—t6W乙Z)+A0't^丄lB—£厶681乙)+ioii'Zx(IB—s—o厶8U乙)+W00Tx(IB—x—isi"乙)+££W2x(IB—s—%8102)=qi丄IOOl——906^81Z8Zfr.tx(IB—s—ilog^十("外T-)x乙9乙frTx(IB—s—sun^+3027x(IB—/^乙乙i乙)+£[167x(IB—x—66980Z)+Z^(^'Sx(IB—s—>n80。+SW9'£x(IB—"KO乙)+(SZS6'fr-)x(IB—016003)+SW9卞q^OOZ)=bi丄I9CH^否明蔬翁曰回辑盈明図耷明薪菜小翁园耷WOS+Vi封1挲虽,s/a憲法能改£了9Z^008900S表2:用于基于12个基因的表达强度计算洛基分数(logitscore)以估计远处转移的风险的公式计算洛基分数的逻辑回归模型公式:<formula>formulaseeoriginaldocumentpage50</formula>计算低远处转移风险的概率的公式<formula>formulaseeoriginaldocumentpage50</formula>7:洛基分数;低远处转移风险的概率;《:常数;系数;X:每一探针集的标准化强度括号中的Affymetrix探针集标识数字表示指定探针集的mRNA转录的标准化表达强度。从列出的公式计算洛基分数,用于估计低远处转移风险的概率。概率>0.5认为是低远处转移风险。概率0.5认为是高远处转移风险。表3:138名患者的临床特征<table>tableseeoriginaldocumentpage51</column></row><table>*:所有临床低风险案例均已经随诊三年以上,未发生远处转移。**:所有临床高风险案例在首次治疗后的三年内均已经发生远处转移列出的参数在训练组和测试组患者分布中无统计学显著差异表4:预测远处转移选择的9个基因簇<table>tableseeoriginaldocumentpage52</column></row><table>表4(续)<table>tableseeoriginaldocumentpage53</column></row><table>表5:通过逻辑回归法预测远处转移的12个基因探针集ID200057sat200842丄at221494—x一at201947—s—at200910—at222011sat基因符号NONO208699xatTKT201892satIMPDH2EPRSEIF3S12CCT2CCT3TCP1基因名称含有非-POU结构域,八聚体-缚合转酮酶(Wernicke-Korsakoff综合症)IMP(—磷酸肌苷)脱氢酶2谷氨酰-脯氨酰-tRNA合成酶真核翻译起始因子3,亚基12含有TCP1的伴侣蛋白,亚基2(p)含有TCP1的伴侶蛋白,亚基3(力含有TCP1的伴侣蛋白,亚基l(a)208722—s_atANAPC5后期启动复合体亚基5201948—atGNL2鸟嘌呤核苷酸结合蛋白质样2(核仁)218593—atRBM28RNA结合基序蛋白28208114satFLJ12671假设蛋白FLJ12671功能mRNA加工核苷酸代谢,磷酸戊糖途径核苷酸生物合成蛋白质生物合成蛋白质生物合成蛋白质折叠蛋白质折叠蛋白质折叠遍在蛋白依赖性蛋白质代谢/细胞周期核糖体生源核糖体生源未知加亮的基因在表4中不存在.54表6:基3卩<table>tableseeoriginaldocumentpage55</column></row><table>*:"0"是指低低远处转移风险**:"l"是指高远处转移风险;***:"9"是指两种预测方法之间的不一致。本文引用的所有专利申请、专利和出版物的全文在此并入本文作参考。前述实施例可以通过改变本发明在该实施例中所用的一般或特别描述的反应物和/或操作条件而获得相似的成果。从前文的描述中,本领域技术人员可易于明了本发明的基本特征,在不偏离本发明精神和范围的前提下,可以对本发明进行各种改变和修改以适应其各种用途和条件。权利要求1.一种评估鼻咽癌患者发生远处转移的风险的方法,所述方法包括在来自所述患者的样品中评估表4列出的52个基因的表达谱,所述评估是使用通过应用于洛基分数(logitscore)的组的k-最近邻分类方法而产生的预测规则来进行的,所述洛基分数的组是通过使用表1中相应的回归模型公式针对表4示出的9个基因簇中的每一个基因簇而产生的;使用以下预测规则评估表5中列出的12个基因的表达谱,[低远处转移风险的概率]=^_i+e-(洛基分数)其中所述洛基分数(logitscore)是使用表2所示回归模型公式基于所述12个基因的表达谱而产生;对比得自所述两个预测规则的远处转移风险值,由此当通过这两种方法确定的远处转移风险均为低或高时,则分别记录为低或高风险,当所述确定的风险不一致时,则记录为所述风险不确定。全文摘要mRNA转录物谱分析可用于阐明原发NPC远处转移的分子预测因子。所述预测结果与短的无转移和总体生存期高度相关。使用基于52个基因和基于12个基因的预测因子(predictor)进行预测。文档编号C07K14/05GK101313306SQ200680043762公开日2008年11月26日申请日期2006年9月22日优先权日2005年9月22日发明者A·黄,K-j·高申请人:中国合成橡胶股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1