用于预测癌症复发的评定体系的制作方法

文档序号:5840709阅读:278来源:国知局
专利名称:用于预测癌症复发的评定体系的制作方法
技术领域
本发明涉及预测癌症复发的评定体系。更具体地,本发明涉及选择基因和/或蛋白,通过测量人肿瘤组织中基因和/或蛋白的表达,并将它们的表达模式与具有癌症复发以及没有癌症复发的患者的人原发性肿瘤中该基因和/或蛋白的表达模式进行比较,利用所选的基因和/或蛋白产生用于预测癌症复发的公式。
本发明还涉及一种用于实施本发明的方法的试剂盒,包含DNA芯片、寡核苷酸芯片、蛋白芯片、肽、抗体、探针和引物,这些是实现DNA微阵列、寡核苷酸微阵列、蛋白阵列、Northern印迹、原位杂交、核糖核酸酶保护分析、Western印迹、ELISA、反转录聚合酶链式反应(以下称之为RT-PCR),以检测指示癌症复发的至少2个或更多个基因和/或蛋白,优选4个或更多个基因和/或蛋白,更优选6个或更多个基因和/或蛋白,并且最优选12个或更多个基因和/或蛋白的表达所必需的。
背景技术
癌症是世界上引起死亡的主要原因之一。癌症总体流行率大约占人口的1%,并且年发病率大约为0.5%。大约十分之一从医院遣返的患者被初步诊断为癌症。主要的现有治疗模式是外科手术切除术、放射疗法、化学疗法以及包括激素疗法在内的生物疗法。此外,新近发展的生物技术提供了新的治疗模式,例如基因疗法。尽管如此,癌症是可怕的疾病,因为在大多数情况下实际上不存在有效的治疗。癌症治疗的主要困难之一是癌细胞变得对药物具有抗性的能力,并且扩散到组织其它部位,在那里它们可以产生新的肿瘤,这常常导致复发。如果癌症复发在发生复发前可预测,则这种癌症通过用外科手术局部治疗是可医治的。
在各种肿瘤中,肝细胞癌(以下称之为HCC)是世界上最为常见的致命癌症之一,并且发病数目在许多国家包括美国、日本、中国和欧洲国家是渐增的。乙型肝炎病毒(以下称之为HBV)和丙型肝炎病毒(以下称之为HCV)感染都可以是引起HCC的原因。事实上,HCC患者的增加与慢性HCV感染的增加是对应的(El-Serag,H.B.& Mason,A.C.Rising incidence of hepatocellularcarcinoma in the United States,N.Engl.J.Med.340,745-750(1999)以及Okuda,K.Hepatocellular carcinoma,J.Hepatol.32,225-237(2000))。尽管HCC发病率提高,对于这种疾病没有有前景的治疗。治疗HCC的主要问题是肝内转移。在30到50%接受肝脏切除术的HCC患者中观察到复发(Iizuka,N.等.NM23-H1 and NM23-H2 messenger RNA abundance in human hepatocellularcarcinoma,Cancer Res.55,652-657(1995),Yamamoto,J.等Recurrence ofhepatocellular carcinoma after surgery,Br.J.Surg.83,1219-1222(1996),以及Poon,R.T.等Different risk factors and prognosis for early and late intrahepaticrecurrence after resection of hepatocellular carcinoma,Cancer 89,500-507(2000))。尽管病理学TNM分类系统已用于HCC的治疗,这个系统只能拙劣地预测经受肝脏切除术患者的复发(Izumi,R.等Prognostic factors ofhepatocellular carcinoma in patient undergoing hepatic resection,Gastroenterology 106,720-727(1994))。也已经提出了许多分子作为HCC的预测性标志,没有任何一个被证明临床上可用(Iizuka,N.等NM23-H1 andNM23-H2 messenger RNA abundance in human hepatocellular carcinoma,Cancer Res.55,652-657(1995),Hsu,H.C.等Expression of p53 gene in 184unifocal hepatocellular carcinomasassociation with tumor growth andinvasiveness,Cancer Res.53,46914694(1993),以及Mathew,J.等CD44 isexpressed in hepatocellular carcinomas showing vascular invasion,J.Pathos179,74-79(1996))。因此,任何预测复发的方法对于理解癌症机制以及对于建立新的癌症疗法将是非常有价值的。然而,由于存在着传统方法对预测复发的技术局限,而且更多的局限可归于高度的患者间肿瘤异质性,有必要设计新的方法描述肿瘤特征并预测癌症复发。
最近发展的允许人们对大量基因进行平行的表达分析的微阵列技术,在医学领域开拓了一个新的纪元(Schena,M.等Quantitative monitoring of geneexpression patterns with a complementary DNA microarray,Science 270,467-470(1995),以及DeRisi,J.等Use of a cDNA microarray to analyze geneexpression patterns in human cancer,Nature Genet.14,457-460(1996))。尤其是,cDNA微阵列对肿瘤基因表达的研究已经对恶性肿瘤的性质例如预后和药物敏感性提供了重要的深刻见解(Alizadeh,A.A.等Distinct types of diffuselarge B-cell lymphoma identified by gene expression profiling,Nature403,503-511(2000),以及Scherf,U.等A gene expression database for themolecular pharmacology of cancer,Nature Genet.24,236-244(2000))。
最近,监控记忆被引入基因表达分析中(Brazma,A.& Vilo,J.Geneexpression data analysis,FEBS Lett.480,17-24(2000)以及Kell,D.B.& King,R.D.On the optimization of classes for the assignment of unidentified readingframes in functional genomics programsthe need for machine learning,TrendsBiotechnol.18,93-98(2000))。利用分类的样品,监控记忆具有很好的关于数据性质的演绎知识的决定性优势(Duda,R.O.等Pattern classification,JohnWiley & Sons(2001),以及Jain,A.K.等Statistical pattern recognitionA review,IEEE Trans.Pattern Analysis and Machine Intelligence.22,4-37(2000))。然而,没有任何一种以前公开的监控记忆方法直接地评价基因的组合从而能够利用有关统计特征的信息,即基因分布结构(Golub,T.R.等Molecularclassification of cancerclass discovery and class prediction by gene expressionmonitoring,Science 286,531-537(1999),以及Brown,M.P.等Knowledge-based analysis of microarray gene expression data by using supportvector machines,Proc.Natl.Acad.Sci.USA 97,262-267(2000))。
预测癌症复发的评定体系是用统计模式识别中的监控记忆(superviseedlearning in statistical pattern recognition)通过分析DNA微阵列数据创建的(Duda,R.O.等Pattern classification,John Wiley & Sons(2001))。
统计模式识别的监控记忆已经被成功地用于解决诸如文献分类、语音识别、生物统计分析、以及遥感等大量问题(Jain,A.K.等Statistical patternrecognitionA review,IEEE Trans,Pattern Analysis and MachineIntelligence.22,4-37(2000))。
在本发明中,发明人提供了一种通过分析人原发性肿瘤基因和/或蛋白的表达而预测癌症复发的评定体系。也就是说,本发明涉及一种预测癌症复发的方法,其包括检测人原发性肿瘤组织基因和/或蛋白的表达,并将它与具有癌症复发以及没有癌症复发的患者的人原发性肿瘤基因和/或蛋白的表达进行比较。


图1图示了基因选择的程序(步骤1-7)以及用最佳的基因子集对评定体系的评价(步骤8-10)。
图2图示了最佳的基因数目。
图3图示了被选择用于早期肝内复发预测的基因的mRNA的平均差异。比较了A组(显示为A)和B组(显示为B)之间12个基因的mRNA的平均差异。
图4图示了用于早期肝内复发预测的病毒类型、TNM阶段、以及分值(T值)之间的关系。利用12个基因的最佳子集,用3个测试样品评价通过30个训练样品创建的评定体系。这一操作独立重复10次。计算所有测试样品的T值。在T值低于0时预测到早期肝内复发。不管阶段和病毒类型,T为负值的所有HCC具有早期肝内复发,而T为正值的所有HCC没有复发。填充的,A组(具有早期肝内复发的患者);空白的,B组(没有早期肝内复发的患者);○,I期;◇,II期;△,III期;□,IVA期;B;HBV-阳性,C;HCV-阳性,N;HBV-HCV-双阴性。
图5图示了评定体系。
发明的详细说明在本发明中,利用了来自包括脑、肺、乳房、胃、肝、胰腺、胆囊、结肠、直肠、肾脏、膀胱、卵巢、子宫、前列腺以及皮肤的那些肿瘤的人组织。在外科手术期间切除人组织后,优选它们立即在液氮或含有干冰的丙酮中冷冻,并贮存于-70和-80℃之间备用,包埋或不包埋在O.C.T.化合物中(Sakura-Seiki,Tokyo,Japan,目录号4583)。
测试癌症复发可能性的患者的肿瘤组织中基因和/或蛋白的表达是通过测量RNA和/或蛋白的水平来分析的。在许多情况下,RNA和/或蛋白的水平是通过测量包括荧光素和罗丹明在内的底物的荧光、发光氨(lumenole)的化学发光、放射性物质包括3H,14C,35S,33p,32p和125I的放射活性、以及光学密度确定的。RNA和/或蛋白的表达是通过已知的方法包括DNA微阵列(Schena,M.等Quantitative monitoring of gene expression patterns with acomplementary DNA microarray,Science 270,467-470(1995),以及Lipshutz,R.J.等High density synthetic oligonucleotide arrays,Nature Genet.21,20-24(1999))、RT-PCR(Weis,J.H.等Detection of rare mRNAs via quantitativeRT-PCR,Trends Genetics 8,263-264(1992),以及Bustin,S.A.Absolutequantification of mRNA using real-time reverse transcription polymerase chainreaction assays,J.Mol.Endocrinol.25,169-193(2000))、NORTHERN印迹和原位杂交(Parker,R.M.& Barnes,N.M.mRNAdetection in situ and northernhybridization,Methods Mol.Biol.106,247-283(1999))、核糖核酸酶保护试验(Hod,Y.A.Simplified ribonuclease protection assay,Biotechniques 13,852-854(1992),Saccomanno,C.F.等A faster ribonuclease protection assay,Biotechniques 13,846-850(1992))、Western印迹(Towbin,H.等Electrophoretic transfer of proteins from polyacrylamide gels to nitrocellulosesheets,Proc.Natl.Acad.Sci.USA 76,43504354(1979),Burnette,W.N.WesternblottingElectrophoretic transfer of proteins form sodium dodecylsulfate-polyacrylamide gels to unmodified nitrocellulose and radioiodinatedprotein A,Anal.Biochem.112,195-203(1981))、ELISA分析(Engvall,E.&Perlman,P.Enzyme-linked immunosorbent assay(ELISA)Quantitative assay ofimmunoglobulin G,Immunochemistry 8871-879(1971))、以及蛋白阵列(Merchant,M.& Weinberger,S.R.ReviewRecent advancements insurface-enhanced laser desorption/ionization-time of flight-mass spectrometry,Electrophoresis 21,1164-1177(2000),Paweletz,C.P.等Rapid protein displayprofiling of cancer progression directly from human tissue using a protein biochip,Drug Development Research 49,34-42(2000))确定的。
已有和没有早期复发的癌症患者肿瘤中基因和/或蛋白的表达以与测试复发可能性的患者相同的方式确定。
虽然癌症的早期复发在不同癌症类型中有差异,但通常是在切除后一到两年内发生。所以在切除后一到两年内已有复发的癌症患者的肿瘤可以被用作为早期复发患者的肿瘤,而在切除后一到两年内没有复发的癌症患者的肿瘤可以用作没有早期复发的患者的肿瘤。
有早期复发和没有早期复发的癌症患者之间,肿瘤基因和/或蛋白的表达水平或模式的差别,可通过已知的统计学分析方法予以分析和检测。统计模式识别中的监控记忆可用于肿瘤基因和/或蛋白表达模式的统计学分析。通过统计模式识别中的监控记忆,从所检测的基因和/或蛋白中挑选出其表达可指示癌症复发的2个或多个基因和/或蛋白。
首先通过一维的判据(criteria)挑选一些可指示癌症复发的基因和/或蛋白。然后,用能够将基因和/或蛋白所有可能的组合考虑在内的“排除一个”的方法通过详尽的研究,从这些基因和/或蛋白中挑选出基因和/或蛋白的最佳子集。
预测癌症复发的公式是通过利用可指示癌症复发的至少2个或更多个基因和/或蛋白,优选4个或更多个基因和/或蛋白,更优选6个或更多个基因和/或蛋白,最优选12个或更多个基因和/或蛋白的最佳子集创建的。即使是在样品数目比基因和/或蛋白数目少时也能较好地工作的简单分类程序例如线性分类程序被用来创建公式(Duda,R.O.等Pattern classification,JohnWiley & Sons(2001),及Jain,A.K.等Statistical pattern recognitionA review,IEEE Trans.Pattern Analysis and Machine Intelligence.22,4-37(2000))。
本发明还涉及实施本发明的方法的试剂盒。检测可指示癌症复发的2个或多个基因和/或蛋白的表达模式的试剂盒由包括RNA提取试剂、用于合成cDNA和cRNA的酶、DNA芯片、寡核苷酸芯片、蛋白芯片、分析用的探针和引物、对照基因的DNA片断、以及各种蛋白的抗体在内的组分组成。试剂盒的组分很容易从市场上获得。例如,寡核苷酸芯片、胍-酚试剂、逆转录酶、T7 RNA聚合酶以及taq聚合酶可以购买并组装为本发明的试剂盒。
下列实施例仅仅阐释了本发明优选的用于预测癌症复发的方法,而不应当解释为局限于此。
实施例实施例1.选择病人用于早期肝内复发分析据报道外科手术后的早期肝内复发(在一年之内)主要是因肝内转移引起的,而晚期复更可能是多发源点发生(Poon,R.T.等Different risk factors andprognosis for early and late intrahepatic recurrence after resection ofhepatocellular carcinoma,Cancer 89,500-507(2000))。而且,公知肝内复发的患者比多发源点发生的患者的结果更严重(Yamamoto,J.等Recurrence ofhepatocellular carcinoma after surgery,Br.J.Surg.83,1219-1222(1996),and Poon,R.T.等Different risk factors and prognosis for early and late intrahepaticrecurrence after resection of hepatocellular carcinoma,Cancer 89,500507(2000))。因此研究了外科手术后的一年内与早期肝内复发关联的基因表达模式。
33个患者在1997年3月和2000年1月之间在Yamaguchi Univers的医院经受过HCC外科手术治疗。在外科手术前从所有的病例中都得到了书面的公告同意。研究方案在1996年5月得到了Yamaguchi大学医学院人类用途制度审查委员会的批准。在外科后术后在所有患者中进行了HCC组织病理学诊断。组织病理学检查同样揭示了在所有33个HCC样品中没有残余肿瘤(R0)。表1显示了基于Union Internationale Contre le Cancer(UICC)TNM分类的33个患者的临床病理学特征(Sobin,L.H.& Wittekind,C.TNM classification of MalignantTumors,5th ed.,UICC,Wiley-Liss,74-77(1997))。在血清学上,7个患者是乙型肝炎表面抗原阳性,22个患者是抗-HCV抗体阳性,而其余4个患者两者均为阴性。这33个患者继肝切除之后每3个月通过超声照相法、计算机X线断层摄影术、和甲胎蛋白水平来追踪癌症复发。必要时,增加磁共振成象和肝血管造影术。这33个HCC患者患者中,有12人(36%)发现早期肝内复发。在这12个患者的11人中,复发的HCC在残余的肝脏内检测为多小结或者弥漫性扩散。在一个患者中,在外科手术后9个月在邻近切除的原发性病变的部位检测到作为单个小结的新肿瘤。然后,观察到多发性肺转移。其余的21个患者没有一个在外科手术后一年之内发生肝内复发及其它远距离的转移。这些患者被分成两组;在一年之内具有肝内复发的患者在A组(n=12)而那些没有复发的在B组(n=21)(表1)。使用x2检验和Fisher′s exact检验阐明这2组之间临床病理学因素方面的差异。
实施例2.自组织中提取RNA组织碎片(大约125mm3)被悬浮在TRIZOL(Life Technologies,Gaithersburg,USA,目录号15596-018)或Sepasol-RNAI(Nacalai tesque,Kyoto,Japan,目录号306-55)中,并用Polytron匀浆两次(Kinematica,Littau,Switzerland)(以最大速度匀浆5秒)。加入氯仿之后,将组织匀浆物以15,000×g离心10分钟,并回收含RNA的水相。用异丙醇沉淀细胞总RNA,用70%乙醇洗涤1次,并悬浮在DEPC-处理的水中(Life Technologies,Gaithersburg,USA,目录号10813-012)。RNA在用1.5单位DNase I(Life Technologies,Gaithersburg,USA,目录号18068015)处理之后,用TRIZOL/氯仿再抽提,用乙醇沉淀,并溶在DEPC-处理的水中。之后,根据厂家的操作说明书,利用RNeasy Mini试剂盒(QIAGEN,Hilden,Germany,目录号74104)除去小分子量核苷酸。总RNA的质量依据琼脂糖凝胶电泳后28S与18S核糖体RNA的比率判断。纯化的总RNA在70%乙醇溶液中贮存于-80℃备用。
实施例3.cDNA和标记的cRNA探针的合成利用逆向SuperScript选择系统(Life Technologies,Gaithersburg,USA,目录号18090-019)根据厂家的操作说明书合成cDNA。5μg纯化的总RNA与含有T7启动子序列的寡聚-dT引物(Sawady Technology,Tokyo,Japan)和200单位SuperScriptII反转录酶杂交,并在42℃温育1小时。产生的cDNA用酚/氯仿提取并用Phase Lock Gel Light(Eppendorf,Hamburg,Germany,目录号0032 005.101)纯化。
还利用MEGAscript T7试剂盒(Ambion,Austin,USA,目录号1334),并以所述cDNA作为模板,根据厂家的操作说明书合成cRNA。大约5μg cDNA与2μl含有T7聚合酶、腺苷三磷酸(ATP)和鸟苷三磷酸(GTP)各7.5mM、胞苷三磷酸(CTP)和尿苷三磷酸(UTP)各5.625mM、Bio-11-CTP和Bio-16-UTP(ENZO Diagnostics,Farmingdale,USA,目录号分别为42818和42814)各1.875mM的酶混合物在37℃温育6小时。单核苷酸和短寡核苷酸通过CHROMA SPIN+STE-100柱(Clontech,Palo Alto,USA,目录号K1302-2)柱层析除去,洗脱物中的cRNA通过添加乙醇而沉淀。cRNA的质量依据琼脂糖凝胶电泳后cRNA的长度判断。纯化的cRNA在70%乙醇溶液中贮存于-80℃备用。
实施例4.有复发和没有复发的患者的肿瘤基因表达分析来自肝癌患者的人原发性肿瘤的基因表达通过高密度寡核苷酸微阵列检测(HuGeneFL array,Affymetrix,Santa Clara,USA,目录号510137)(Lipshutz,R.L.等High density synthetic oligonucleotide arrays,NatureGenet.21,20-24(1999))。为与芯片上的寡核苷酸杂交,cRNA于95℃在含有40mM Tris(Sigma,St.Louis,USA,目录号T1503)-乙酸(Wako,Osaka,Japan,目录号017-00256)(pH8.1)、100mM乙酸钾(Wako,Osaka,Japan,目录号160-03175)、和30mM乙酸镁(Wako,Osaka,Japan,目录号130-00095)的缓冲液中片断化35分钟。杂交在200μl含有0.1M 2-(N-吗啉代)乙磺酸(MES)(Sigma,St.Louis,USA,目录号M-3885)(pH6.7)、1M NaCl(Nacalai tescque,Tokyo,Japan,目录号313-20)、0.01%聚氧烯(polyoxylene)(10)辛基酚醚(Wako,Osaka,Japan,目录号168-11805)、20μg鲱鱼精DNA(Promega,Madison,USA,目录号D181B)、100μg乙酰化牛血清白蛋白(Sigma,St.Louis,USA,目录号B-8894)、10μg片断化的cRNA、以及生物素标记的对照寡核苷酸,生物素-5′-CTGAACGGTAGCATCTTGAC-3′(Sawady technology,Tokyo,Japan)的缓冲液中于45℃进行12小时。在用含有0.01M MES(pH6.7)、0.1MNaCl、0.001%聚氧烯(10)辛基酚醚缓冲液的缓冲溶液洗涤芯片后,芯片与生物素标记的抗-链抗生物素蛋白抗体(Funakoshi,Tokyo,Japan,目录号BA0500)温育,并用链抗生物素蛋白R-藻红蛋白着色(Molecular Probes,Eugene,USA,目录号S-866),以便提高杂交信号,正如操作说明书中所述的那样(Affymetrix,Santa Clara,USA)。用激光扫描仪(Affymetrix,Santa Clara,USA)收集每个像素水平,并且用Affymetrix GeneChip ver.3.3和AffymetrixMicroarray Suite ver.4.0软件计算每种cDNA的表达水平和可信度(Present/Absent call)。从这个实验中,测定了肝癌患者的人原发性肿瘤中6000个基因的表达。
实施例5.动态RT-PCR分析基因的表达还通过动态RT-PCR来测定。动态RT-PCR通过实时荧光PCR系统进行。利用LightCycler仪(LightCycler system,Roche Diagnostics,Mannheim,Germany,目录号2011468),在20μl由主混合物和缓冲液(LightCycler DNA Master hybridization probes,Roche Diagnostics,Mannheim,Germany,目录号2158825),4mM氯化镁(Nacalai tescque,Tokyo,Japan,目录号7791-18-6),10皮摩尔PCR引物(Sawady Technology,Tokyo,Japan),4皮摩尔荧光杂交探针(Nihon Genome Research Laboratories,Sendai,Japan)(其被设计成在扩增产物链上以头对尾的排列与靶序列杂交),以及2μl模板cDNA组成的反应混合物中、在LightCycler毛细管(Roche Diagnostics,Mannheim,Germany,目录号1909339)中进行PCR扩增。供体探针在3′-端由荧光标记,而受体探针在5′-端由LC-Red640标记并且在3′-端进行磷酸化修饰以阻断延伸。供体探针3′-端与受体探针5′-端间的缺口有1-3个碱基。扩增前,向反应混合物中加入0.16μl TaqStart抗体(Clontech,Palo Alto,USA,目录号5400-1),接着室温下温育10分钟以阻断引物延伸。然后,在95℃温育90秒使抗体失活,扩增在LightCycler中按照95℃温育0秒变性,在57-60℃温育3-10秒退火,以及在72℃温育90秒延伸进行40个循环,其中温度斜率为20℃/秒。通过在每一扩增循环的退火期终止时测量荧光信号来实现实时PCR监测。为使分离的RNA的完整性合格并使靶序列的拷贝数标准化,还利用杂交探针进行了甘油醛-3-磷酸脱氢酶(GAPDH)的动态RT-PCR分析。靶mRNA和GAPDH mRNA的外标物由质粒DNA的10-倍系列稀释物(103到108)制备。每个样品中mRNA的定量通过参考在每个时间点构建的标准曲线根据LightCycler软件自动进行(LightCycler software version 3,RocheDiagnostics,Mannheim,Germany)。
实施例6.鉴定基因集合,其表达能够区分具有早期肝内复发的肝癌患者和不具有早期肝内复发的肝癌患者早期肝内复发往往与原发性肿瘤的数目和TNM阶段相关联,p值分别为0.041和0.006,但是与其它临床病理学因素无关(表1)。外科手术时原发性肿瘤的数目仅在有限的灵敏度和特异性方面将A组和B组区分开来(分别为62%和75%)。TNM分期对于分开A组和B组同样具有有限的灵敏度(67%)和特异性(83%)。因此,显然这些传统的分类法不能够预测早期肝内复发。
统计模式识别中的监控记忆被用来分析高密度寡核苷酸微阵列的数据。评定体系用训练样品设计并用测试样品验证其功效(图1)。为保持训练和测试样品的独立性,采取了交换训练和测试样品的交叉验证法。33个可用样品通过交叉验证法被分成30个训练样品和3个测试样品(图1,步骤1)。根据先验概率,建立了由A组的11个样品和B组的19个样品组成的10组训练样品。结果,建立了10组3个测试样品,由A组的一个样品和B组的两个样品组成。
利用Fisher判据,从所有的检测基因中选择在A组和B组之间具有大于两倍的中值均差的50个基因来建立预测评定体系(图1,步骤2-3),该判据由下列公式(I)给出。
F(i)=(μA(i)-μB(i))2P(A)σA2(i)+P(B)σB2(i)]]>
其中,μA(i)是A组样品均值向量μA的第i个分量,σA2(i)是A组样品协方差矩阵∑A的第i个对角元素,而P(A)是A组的先验概率。
然后,如下所述鉴定用于评定体系的最佳基因子集。
Fisher线性分类程序依下列公式(II)将测试样品x分配到A组。
如果FA(x)<FB(x)其中FA(x)=12(x-μA)TΣW-1(x-μA)-InP(A)]]>∑W=(P(A)∑A+P(B)∑B)在排除一个的方法中,样品均值向量、样品协方差矩阵、以及先验概率是通过利用29个样品作为训练样品估计的。然后,将剩余的样品作为假测试样品对所生成的Fisher线性分类程序进行测试。重复这一操作30次。计算每一种可能的基因子集的错误率。例如,当从50个基因中选择5个时,待检测的子集数目为二百万。
下一步,选择错误率最小化了的侯选基因子集(图1,步骤4)。这个试验独立重复10次(图1,步骤5)。
在这些侯选基因子集中,选择在10次试验中自始至终出现最为频繁的基因子集作为区分两组的最佳基因子集(图1,步骤6)。利用所选择的最佳基因子集,分值T可通过下列公式(III)给出。
T(x)=FA(x)-FB(x)在这个评定体系中,具有负T值的所有HCC被归为A组(早期肝内复发组),而具有正T值的所有HCC被归为B组(无复发组)。
最佳基因数目根据由下列公式(IV)给出的判据J确定(图1,步骤7)。
J=130[Σx∈BT(x)-Σx∈AT(x)]]]>判据J衡量A组和B组的可分性。针对不同基因数目计算10个不同训练集中J值的平均数和95%可信度间隔(图2)。可分性随着基因数目的增加而变得更好。当基因数目达到10和12时,95%可信度间隔变得几乎类似,表明12对于两组的可分性而言是最为适当的基因数目(图2)。
实施例7.12个基因的最佳子集,其表达可指示早期肝内复发根据上述算法,鉴定了区分A组和B组的12个基因的最佳子集。最佳基因子集包括血小板衍生生长因子受体α(PDGFRA)、肿瘤坏死因子α(TNF-α)诱导蛋白A20、溶酶体相关多跨膜蛋白(LAPTm5)、HLA-DRα重链(II类抗原)、rel原癌基因、Staf50、公认的丝氨酸/苏氨酸蛋白激酶、MADS/MEF2-家族转录因子(MEF2C)、来自3p21.3的HUMLUCA19人粘粒克隆LUCA19、DEAD-盒蛋白p72、波形蛋白和KIAK0002的基因(表2)。在所选的12个基因中,有11个的表达在A组中是下调的;A组中这些基因的均差中值比B组的一半还少(图3)。相反,HUMLUCA19基因的表达在A组中是上调的;A组中HUMLUCA19基因的均差中值比B组增加了3倍多(图3)。早期肝内预测分值的准确性是用每组3个测试样品的10组不同集合评估的(图4)。HCC早期复发是通过计算来自HCC患者的12个基因的T值预测的。当T值低于0时,在外科手术后一年之内复发是很有可能的,而当T值大于0时,在外科手术后一年之内复发的可能性很小。这个评定体系在全部10个试验中可以完美地预测3个测试样品的早期肝内复发(图4)。该评定体系不依赖于病毒感染模式,并且比TNM分期系统更加准确(图4)。基于全部33个HCC以及上述12个基因的评定体系(图5)包括下列公式(V)。
公式(V)T(x)=0.053862x1+0.038848x2+0.030176x3+0.001824x4+0.096997x5+0.017259x6+0.015908x7+0.103081x8-0.093746x9+0.024031x10-0.005417x11-0.119177x12-11.046007,其中X1,x2,X3,X4,X5,x6,X7,X8,X9,X10,X11,X12为血小板衍生生长因子受体α(PDGFRA)、肿瘤坏死因子α(TNF-α)诱导蛋白A20、溶酶体相关多跨膜蛋白(LAPTm5)、HLA-DRα重链、rel原癌基因、Staf50、公认的丝氨酸/苏氨酸蛋白激酶、MADS/MEF2-家族转录因子(MEF2C)、来自3p21.3的HUMLUCA19人粘粒克隆LUCA19、DEAD-盒蛋白p72、波形蛋白和KIAK0002基因的mRNAs的校准均差(表2)。
本发明所选择的12个基因参与广范围的生物学过程。其中,免疫应答相关基因例如HLA-DRα重链、肿瘤坏死因子α诱导蛋白A20和Staf50,在具有早期肝内复发的HCC中是下调的。由于HLA-DRα重链被认为在巨噬细胞的抗原递呈中起着重要作用(Tissot,C.& Mechti,N.Molecular cloning ofa new interferon-induced factor that represses human immunodeficiency virustype 1 long terminal repeat expression,J.Biol.Chem.270,14891-14898(1995)),它在肿瘤组织中的下调可能帮助肿瘤细胞逃脱宿主的免疫监视。Rel原癌基因与NF-xB一样参与胞内信号传导途径,它在具有早期肝内复发的HCC中也是下调的。此外,rel/NF-xB的表达据报道与T细胞激活相关(Mora,A等NF-kappa B/Rel participation in the lympholdne-dependent proliferation of Tlymphoid cells,J.Immunol.166,2218-2227(2000))。因此,看起来本发明所选择的用于预测早期肝内复发的许多基因参与削弱宿主抗高转移潜力HCC细胞的免疫应答。
还通过寡核苷酸微阵列分析了其他跟踪期最近达到1年的HCC患者的基因表达模式,并根据上述公式计算了12个基因的表达分值。存活并且外科手术一年多以后没有复发的患者的T值为阳性(正值),而其他在外科手术后一年内具有肝内复发的患者的T值为阴性(负数)。因此,由从6000个基因中获得的12个基因的子集构成的评定体系能够准确地预测早期肝内复发。将统计学模式识别中的监控记忆应用到临床标本上,可以预先提供预防、诊断、以及治疗其它疾病和HCC的关键信息。此外,不仅仅DNA微阵列,而且其它方法例如RT-PCR也可用来测定基因的最佳集合的表达。
表1用于早期肝内复发的HCC临床病理学因素因素 A组(n=12)B组(n=21) P值性别 N.S.
男8 16女4 5年龄 N.S.
≤60 5 7>60 7 14病毒感染 N.S.
HBV 3 4HCV 8 14非-B非-C 1 3原发病灶 0.041单发肿瘤 3 13多发肿瘤 9 8肿瘤大小(cm) N.S.
<2.0 0 52.0-5.0 8 14>5.0 4 2分期*0.006I/II 2 14IIIA/IVA 10 7组织学分级*N.S.
G10 2G29 17G33 2静脉入侵*N.S.
(-) 7 18(+) 5 3非肿瘤性肝 N.S.
非特异性改变 1 1慢性肝炎 2 10肝硬化9 10*,基于UICC的TNM分类进行的评定HBV乙型肝炎病毒,HCV丙型肝炎病毒,非-B非-C既不是HBV也不是HCVA组早期肝内复发(+),B组早期肝内复发(-)N.S.不显著表2预测早期肝内复发的公式和12个基因

GB*基因库登录号
权利要求
1.一种预测癌症复发的评定体系,其使用以具有癌症复发和没有复发的人类癌症患者癌组织中基因和/或蛋白的表达水平或模式为基础由统计分析选择的2个或更多个基因和/或蛋白。
2.根据权利要求1的评定体系,其中由统计分析选择的基因和/或蛋白的数目为4个或更多个。
3.根据权利要求1的评定体系,其中由统计分析选择的基因和/或蛋白的数目为6个或更多个。
4.根据权利要求1的评定体系,其中由统计分析选择的基因和/或蛋白的数目为12个或更多个。
5.根据权利要求1-4的评定体系,其中癌组织是肝癌组织。
6.根据权利要求1-5的评定体系,其中人癌组织中基因和/或蛋白的表达以及具有癌症复发以及没有复发的患者的人原发性癌组织中基因和/或蛋白的表达是通过DNA微阵列、反转录聚合酶链式反应或蛋白阵列检测的。
7.一种实施根据权利要求1-6的评定体系的试剂盒,包含实现DNA微阵列、寡核苷酸微阵列、蛋白阵列、Northern印迹、核糖核酸酶保护分析、Western印迹以及反转录聚合酶链式反应,从而检测根据权利要求1-6的评定体系所选出的基因和/或蛋白的表达所必需的DNA芯片、寡核苷酸芯片、蛋白芯片、探针以及引物。
8.一种预测癌症复发的方法,包含以下步骤(a)检测自患者癌组织制备的样品中的基因和/或蛋白的表达水平或模式,其中所述基因和/或蛋白是由根据权利要求1-6的评定体系选择的;和,(b)通过将步骤(a)中检测的基因和/或蛋白的表达水平或模式应用到根据权利要求1-6的评定体系中,预测患者的癌症复发。
全文摘要
本发明涉及预测癌症复发的评定体系。更具体地,本发明涉及选择基因和/或蛋白,并通过测量人肿瘤组织中基因和/或蛋白的表达,以及对它们的表达模式与具有癌症复发以及没有癌症复发的患者的人原发性肿瘤中基因和/或蛋白的表达模式进行比较,利用所选的基因和/或蛋白产生用于预测癌症复发的公式。本发明还涉及一种用于实施本发明的方法的试剂盒,包含DNA芯片、寡核苷酸芯片、蛋白芯片、肽、抗体、探针和引物,这些是实现DNA微阵列、寡核苷酸微阵列、蛋白阵列、NORTHERN印迹、原位杂交、核糖核酸酶保护分析、蛋白质印迹、反转录聚合酶链式反应(以下称之为RT-PCR),以检测指示癌症复发的至少2个或更多个基因和/或蛋白,优选4个或更多个基因和/或蛋白,更优选6个或更多个基因和/或蛋白,并且最优选12个或更多个基因和/或蛋白的表达所必需的。
文档编号G01N33/574GK1549864SQ01823658
公开日2004年11月24日 申请日期2001年7月23日 优先权日2001年7月23日
发明者冈正朗, 彦, 浜本义彦, 冈部尚文, 文 申请人:霍夫曼-拉罗奇有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1