肝癌预后的制作方法

文档序号:567194阅读:231来源:国知局

专利名称::肝癌预后的制作方法
技术领域
:本发明涉及癌症手术预后,具体地说是肝癌预后,本发明还涉及用于肝癌预后的产品,包括基因芯片和检测试剂盒。背景资料原发性肝癌根治术后5年的复发率约为60%~70%,其中术后1年的复发率所占比例高达51.4%~72.3%,即使是小肝癌获根治性切除后的5年复发率也达30%~40%。因此,术后复发转移已经成为进一步提高肝癌治疗效果的主要障碍。术后灌注化疗等治疗方法有可能降低肝癌患者术后的复发率,但是一些长期研究显示釆用这些术后化疗后患者的生存率反而相对于未行化疗的患者降低。这些现象提示术后具有较高复发转移风险的患者可能会受益于这些术后治疗,但术后复发转移风险较低的患者釆用这些术后治疗可能会适得其反。如果能够通过有效的预测方法预测术后复发风险高的患者,就可以通过一系列的干预预防措施,降低复发率,延长患者的生存期。用临床指标(如TNM分级、肝硬化程度)和单个分子指标(如AFP、MMPs)预测肝癌复发转移的研究已经有较长的历史。但是,由于肝癌的发生和复发转移是一个包含多个基因变化的复杂过程,肿瘤的发生和其转移复发的能力由一系列重要的因素决定,包括癌基因抑癌基因的突变,免疫功能变化,血管生成,肿瘤细胞粘附、细胞外基质降解等方面。单因素或单基因研究无法全面了解整个基因组多个基因的变化情况,不能反映肝癌转移的确切分子生物学特征。并且临床指标或者病理类型相似的患者确有截然不同的临床结局,所以用临床指标或着单独的分子标志来预测或评价患者难以取得满意的效果。1999年Golub等率先利用基因芯片技术对急性白血病进行研究,根据肿瘤的基因表达谱对白血病的进行分型,并根据所建立的模型对新的患者进行肿瘤类型预测,从而为利用基因芯片对肿瘤的分类和预测开创了先例。此后,Alizadeh、和van,tVeer等也利用类似的方法建立了用于弥漫性大B细胞淋巴瘤和乳腺癌分型预测的模型。这些研究结果说明基因芯片技术能够从分子水平对肿瘤进行更准确的分类,并预测肿瘤亚型、预后和对治疗的反应等特性。更为重要的是,van,tVeer等基于70个基因的乳腺癌预后诊断模型和相关诊断用芯片MammaPrint被FDA批准上巿,为我们展示了基于基因表达谱模型来进行疾病分型和预后判断的良好前景。因此,我们希望通过表达谱分析找到能够预测肝癌患者根治术后复发风险的预测模型。
发明内容本发明的目的在于提供一种预测原发性肝癌术后状态的方法,该方法可用于评估原发性肝癌术后复发的可能性。本发明的另一目的在于提供一种用于肝癌预后的产品。本发明方法包括对原发性肝癌初次手术切除肿瘤标本中下述基因表达模式的分析HLA-DQB1(NM_002123)、HLA-DRA(J00194)、RHBDD2(RHBDD2)和CD3D(丽—000732)。作为优选的方案,还进一步包括对对原发性肝癌初次手术切除肿瘤标本中选自下述基因表达模式的分析SAMD9(NM一017654)、LCN1(NM—002297)、0A1(丽—000273)和COS-22(Z27446)。对上述基因的表达分析,可通过测定患者肝癌组织基因产生的RNA量进行,测定方法包括本领域技术人员所熟知的荧光定量PCR(realtimequantitativePCR)和基因芯片。聚合酶链式反应(PolymeraseChainReaction,PCR)是体外酶促合成特异DNA片段的一种方法,为最常用的分子生物学技术之一。典型的PCR由(1)高温变性模板;(2)引物与模板退火;(3)引物沿模板延伸三步反应组成一个循环,通过多次循环反应,使目的DNA得以迅速扩增。所谓实时定量PCR技术,是指在PCR反应体系中加入荧光基团,利用荧光信号累积实时监测整个PCR进程,最后通过标准曲线对未知模板进行定量分析的方法。(参考文献HeidCA,StevensJ,LivakKJ,etal.RealtimequantitativePCR[J].GenomeRes,1996,6(10):9862994.)基因芯片(microarray)又被称为DNA芯片、DNA微阵列,是指以大量人工合成的或应用常规分子生物学技术获得的核酸片段作为探针,按照特定的排列方式和特定的手段固定在硅片、载玻片或塑料片上,由于同时将大量探针固定于支持物上,所以可以一次性对样品大量序列进行检观!l和分析。(BertrandL,AsaphA,MarkS.OverviewofDNAchiptechnology[J].MolecularBreeding,1998,4:277)目前以合成寡核苷酸探针和原位合成探针制备的芯片较为常用。优先地,可以选择包含上述用来预测复发基因的定制芯片进行分析,这种定制芯片不用包含与检测目的无关的基因,但是含有目的基因和必要的用于质控的基因。基因芯片的结构以及制造方法可以参阅CN2457166A、CN1341752A、CN1414112A、CN1616178A、US5445934、US5532128等等公开的方法。HLA-DQB1、HLA-DRA、RHBDD2、CD3D、SAMD9、LCN1、OA1和COS-22八个基因的表达值可以用来预测肝癌术后复发的可能性。这些基因是禾ll用BoandJonassen(GenomeBiology3(4):research0017.1-0017.11,2002)等开发的Greedy-pair方法筛选而出。其中HLA-DQBl、HLA-DRA、RHBDD2、CD3D和COS-22在根治术后三年内不复发的患者中高表达,而SAMD9和LCN1在三年内复发的患者高表达。利用这8个基因在21个患者中的表达水平作为训练数据集(表3),用PAM程序(PredictionAnalysisofMicroarrays)(参考文献EricBairl,RobertTibshirani.PLoSBIOLOGY,April2004,Volume2,Issue4,0511)训练该数据集后,建立的模型可以100%地预测训练集中所有患者的预后。当用这一模型来预测另外11独立样本的术后结局时,正确的预测了其中10个样本。当只用HLA-DQB1、HLA-DRA、RHBDD2和CD3D四个基因来建立预测模型的时候,可以得到同样的预测效果。本发明方法可与用于癌症诊断的其它方法联合使用,对肝癌术后预后。例如TNM分期,CLIP评分系统和血清中游离AFPmRNA等指标。本发明进一步提供基于上述肝癌预后方法的产品,例如基因芯片,所述基因芯片包括可与来自上述基因的mRNA、cRNA和/或cDNA特异杂交的探针,这些探针可以是上述基因的核酸序列、其互补序列、或者是它们的片段;或者是检测试剂盒,其包括对上述基因产生的RNA或表达产物测定的全部或部分试剂,典型地,测定RNA的试剂包括(荧光定量PCR检测试剂盒,原位杂交及原位RT-PCR,Nouthem检测试剂盒)等,测定蛋白表达产物的试剂包括(ELISA试剂盒、抗体芯片)等。综上所述,本发明提供了肝癌预后的解决方案,并提供了可用于肝癌预后的产品。实验表明,本发明方法对肝癌术后三年内是否复发预测的准确率达90%以上。图l是筛选用于肝癌术后预测基因的方法;图2是预测模型的预测表现A:预测模型中包含不同基因数目的时候预测模型的预测表现,可以看到,当模型中包含4个或者8个基因的时候,该模型预测的表现最好。B:模型中包含8个基因时,训练组样本的交叉验证表现。C:模型中包含8个基因时,验证组样本的预测表现。图3是聚类分析结果;图4差异基因和差异通路的重叠分析。具体实施例方式以下实施例进一步说明本发明的内容,但不应理解为对本发明的限制。在不背离本发明精神和实质的情况下,对本发明方法、步骤或条件所作的修改或替换,均属于本发明的范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。实施例1通过对32例具有根治术后不同无瘤生存时间原发性肝癌患者原发肿瘤组织的基因表达谱进行分析比较,成功地构建了一个基于PAM禾呈序(PredictionAnalysisofMicroarrays)(参考文献EricBairl,RobertTibshirani.PLoSBIOLOGY,April2004,Volume2,Issue4,0511)的预测模型。该模型包含了8个基因(见表l)的表达模式,能够准确地根据原发性肝癌患者原发瘤中这8个基因的表达水平判断该患者术后是否会在3年内复发,准确度达90%以上。将32例肝癌患者随机分成两组一组包含21个患者,用来训练预测模型,称之为"训练组";另一组包含ll例患者,用来检验预测模型的准确度,称之为"检测组"。本发明所构建的预测模型成功的判断了训练组中全部21个患者是否在三年内复发,更为重要的是该模型成功地预测了11个训练组患者中10个患者是否复发的结局(图2)。表1:预测模型中的基因GenBank登陆号基因标签功能简介预测模型雨—002123HLA響DQB1抗原递呈4基因模型■94HLA-DRA抗原递呈4基因模型NM—020684RHBDD2在6年内复发的乳腺癌患者中高表达4基因模型NM—000732CD3D免疫相关4基因模型NM—017654SAMD9调节细胞增殖,抑制肿瘤形成4/8基因模型画—002297LCN1抑制半胱氨酸蛋白酶4/8基因模型丽—000273OA1未知4/8基因模型Z27446COS-22免疫球蛋白组分4/8基因模型实验方案7一、样品和芯片分析1.按照规范流程收集HCC患者的组织和血清标本,并规范地随访和管理患者的相关背景资料,通过数年的随访我们选出了在术后一年内复发的患者11例(命名为S组),术后l-3年内复发的患者8例(命名为M组),术后3年内不复发的患者13例(命名为L组)。2.用Trizol(Invitrogen,GaMiersburg,MD,USA)—步法提取肝癌组织总RNA,并进一步釆用NucleoSpinRNAclean-up试剂盒(MACHEREY-NAGEL,Germany)对总RNA进行过柱纯化,最后用分光光度计定量,甲醛变性胶电泳质检。同时,提取10例HCC患者的癌旁组织总RNA,并混合作为芯片分析时的共同对照。3.用22k人类全基因组寡核苷酸芯片分析具有不同术后无瘤生存时间HCC患者的肝癌组织表达谱。本发明釆用CapitalBio公司的人类全基因组寡核苷酸芯片进行分析,该芯片共含有21571条70mer长度的01igoDNA,每条01igoDNA代表了人的一个基因其中21329条OligoDNA是来自于Qiagen公司的HumanGenomeOligoSetVersion2.1;242条OligoDNA为博奥公司合成。同时,该芯片上还包括人的12个看家基因作为阳性对照,12条人工合成的与人基因没有同源性的70merOligoDNA作为阴性对照,酵母的8个基因间序列作为外标,Hex作为点样阳性对照。该芯片为双通道芯片,每张芯片同时与一个来自实验样品的标记RNA以及作为对照的癌旁组织混合标本的标记RNA进行杂交。4.样品RNA进行荧光标记a.双链cDNA合成取5g总RNA,以T7-01igo(,dT)15,(5'-AAACGACGGCCAV-3,V可以是G、C和A,上海博亚生物技术有限公司)为引物,用8cDNASynthesisKit(Promega,USA)合成双链cDNA;双链合成后用PCRNucleoSpinExtractIIKit(MN)纯化。b.体外转录合成cRNA用T7RiboMAXExpressLargeScaleRNAProductionSystem(Promega)将双链cDNA进行体外转录合成cRNA;然后用RNAClean-upKit(MN)纯化。c.随机引物反转录取2gcRNA,用M-MLV反转录酶,200u/pl(Invitrogen),9RandomPrimer进行反转录,反转录产物用PCRNucleoSpinExtractIIKit(MN)纯化。d.cDNA用KLENOW酶标记取2gcRNA反转录产物,以9RandomPrimer为引物进行KLENOW酶(Takara,Japan)标记,标记产物用PCRNucleoSpinExtractIIKit(MN)纯化,纯化后抽干。标记过程中dATP,dGTP,dTTP终浓度为120M,dCTP终浓度为60M,Cy5-dCTP,Cy3-dCTP终浓度为40M。Cy5國dCTP、Cy3-dCTP(AmershamPharmaciaBiotech,Inc.,Piscataway,NJ,USA);dNTP,10mMeach(上海英骏生物技术有限公司);RandomPrimer,9mer(上海英骏生物技术有限公司);5.标记的DNA溶于301杂交液中(3xSSC,0.2%SDS,5xDenhart,s,25%甲酰胺),于42。C杂交过夜。杂交结東后,先在42。C左右含0.2%SDS,2xSSC的液体中洗5min,而后在0.2xSSC中室温洗5min。玻片甩干后即可用于扫描。6.芯片用LuxScan10KA双通道激光扫描仪(Capita旧io公司)进行扫描,分别扫描Cy5和Cy3的单色荧光图进行叠加,然后釆用GenePixPro4.0图像分析软件(AxonInstruments公司)对芯片图像进行分析,把图像信号转化为数字信号;再对芯片上的数据用Lowess方法进行归一化。二、具有不同术后无瘤生存时间肝癌患者的表达谱比较1.实验组患者间的临床指标分析为了比较三个实验组的患者在临床指标上有无差异,我们釆用SPSS11.0对三组患者的性别、年龄、HBV感染等12个指标进行了方差分析。2.非监督聚类分析所有的芯片分析原始数据用R软件包进行Lowess归一化后,选取至少在9各样本中有可监测表达水平的基因进行后续分析。用CLUSTER3.0进行非监督聚类分析,用TREEVIEW软件显示聚类分析的结果。3.各实验组患者间的差异基因分析用斯坦福大学开发的SAM3.0软件进行微阵列显著性分析,选取在各实验组有差异表达的基因。选取的标准为该基因在两个比较组之间的表达的倍数差异大于1.5,SAM分析的Q值小于0.2(即假阳性发现率小于20%)。4.各实验组间的差异生物学通路分析用BioRag.(www.biorag.org)网站中的PathwayMiner将用上述方法选出的差异基因定位到KEGG数据库中的各个生物学通路中,并对这些含有差异基因的生物学通路进行显著性检验,将pO.Ol的通路定义为差异生物学通路。5.差异表达基因的生物学验证'.为了验证芯片分析的结果,我们釆用了qRT-PCR,WesternBlot和免疫组化验证部分差异基因。三、复发预测模型的建立1.患者分组为了建立和评估分类预测模型,用一个随机数发生器从所有参与表达谱分析的32个患者中随机选取21个患者作为选取基因和建立预测模型的"训练组样本",剩佘的11个患者用作评估预测模型的独立"检测组样本"。2.用于预测的基因选取利用BoandJonassen(GenomeBiology3(4):research0017.1-0017.11,2002)等开发的Greedy-pair方法选取基因用于构建复发预测模型,使用BRB-armyTool中整合的程序进行分析。大概的方法如下整个基因选取过程在21个训练组样本中进行,没有检测组样本参与。首先,对所有基因在训练组样本中的S、M组和L组间的表达差异进行独立样本t检验,根据各个基因的t值将所有基因按照差异的显著性进行排序。接下来的程序将要为上述排序中差异最显著的基因Gi找一个配对的Gj,使得这一对基因能够获得最佳的分类判别效果。为此,用Gi与剩佘所有基因组成两个基因的线性分类预测模型,找出预测效果最好的模型,该模型中与Gi配对的基因即为Gj,选出的Gi和Gj即为Greedy-pair法挑出的第一对基因。之后,剔除挑出的两个基因,用剩余的基因重复上一过程n次,即可挑选出预测能力较强的n对基因。结果,一共选取了50对基因用于预测模型构建。3.预测模型构建用上一环节选出的n对基因基于PAM构建复发预测模型。首先用选出的第一对基因基于PAM构建预测模型,用21个训练组样本训练预测模型;用CrossValidation验证该模型对训练组样本的预测效果,同时用该模型预测ll个检测样本的复发结局;最后用训练组样本CrossValidation的准确度和该模型在11个检测样本中的预测表现来评价该预测模型。之后,按顺序每次向该模型中加入一对用Greedy-pair选出的基因并重复上述过程,直至模型中包含全部50对基因为止。按照上述步骤总共建立50个预测模型,根据50个预测模型的预测表现选取预测最好的预测模型,即为我们所构建的用于预测原发性肝癌患者根治术后3年内实验结果1.实验患者临床指标分析和非监督聚类结果各实验组之间的临床指标除TNM外没有明显的差异(见表2),表明原发性肝癌患者即便有类似的临床特征却可以出现截然不同的临床结局。在聚类分析中总共有12660个基因进入了后期分析,利用这些基因对所有的实验样本进行聚类分析发现大部分具有类似术后无瘤生存时间的患者被聚到一起(图3),说明具有类似术后无瘤生存时间肝癌患者的基因表达谱类似,而术后无瘤生存时间不同的患者间原发肿瘤的基因表达谱确明显不同。这一结果提示,利用手术切除的原发肿瘤标本来预测该患者术后的复发是可行的。表2:实验患者的lls床指标分析临床指标Sm户性别(男/女)9/28/010/30.314年龄(年)47.4±14.561.0±6.648.1±11.90.064HBV(+a)9/15/27/10.592AFP(<20ng/mL,or>20ng/mL)5/54/34/40.965ALT(<40U/L,or>40U/L)9/13/45/30.121AST(<40U/L,or>40U/L)8/24/32/60.066总胆红素(um/L)11.6±3.113.1±4.818.8土23.70.54肿瘤直径(cm)5.3±2.86.7±3.78.1±3.20.193tnm分期(i+u/m+iv)3/88/07/6氺+0.004肝硬化(无/有)2/80/63/50.255原发灶(单个/多个)9/14/14/40.163饮酒(否/是)6/42/34/40.7822.差异基因和差异通路研究发现有381个基因在S和M组差异表达,368个基因在M和L组差异表达,63个基因在S和L组差异表达,分别对应7,19和5个差异通路。比较这些差异基因和通路发现S组和M组和L组相比的差异基因有34个相同,差异通路有5个相同;而M组和L组和S组相比的差异基因只有2个相同,没有相同的差异通路(图4)。这一实验结果提示1年内复发的肝癌患者及1-3年内复发的肝癌患者与3年内不复发的肝癌患者相比具有相似的差异表达模式,可能是类似的机制导致了肝癌患者在l年内及l-3年内的复发。因此,需要进一步研究3年内复发与3年内不复发患者的差异表达模式,以探讨导致部分肝癌患者早期复发而部分患者能够长期无瘤生存的机制。经分析发现有271个基因在3年内复发的患者(S、M组)和3年内不复发的患者(L组)间差异表达,其中269个在S、M组高表达;有21个通路在两组患者间差异表达,其中包含了15个在M和L组差异表达的通路以及在S和L组差异表达的全部5个通路(图3)。这一结果也支持类似的机制导致了肝癌患者在1年内及1-3年内的复发。3.差异基因的生物学验证用qRT-PCR验证了HLA-DP,DQ,DR和CIITA四个基因,用westernblot验证了CIITA的表达和用免疫组化验证了HLA-DP,DQ,DR在一组独立肝癌患者肝癌组织中的表达。这些试验结果均与芯片分析结果一致,证明基因芯片分析结果的可靠性。4.复发预测模型发明人构建了50个基于不同基因的预测模型,当该模型包含4或8个基因的时候预测准确度最高(图2)。此时,该模型可以100%的判断出21个训练样本的分组;并正确地预测了11个检测样本中IO例患者是否在根治术后3年内复发。该模型中的8个基因见表1,其中包含了4个免疫相关基因HLA-DQB1和HLA-DRA是抗原递呈途径中的关键分子,CD3D是重要的免疫分子CD3的重要组分,COS-22是免疫球蛋白的组分,提示免疫因素是影响原发性肝癌患者术后复发的重要因素。实施例2从Qiagen公司购买针对人HLA-DQBl、HLA-DRA、RHBDD2、CD3D、SAMD9、LCN1、0A1和COS-22基因序列的特异70-mer寡核苷酸探针。将上述设计的探针交付博奥公司,点制仅含检测上述8种基因的mRNA序列的基因芯片。参照文献(荷兰Agendia公司的MammaPrint。参考文献AnnuskaMGlas,AmoFloore,LeonieJMJDelahayeetal.Convertingabreastcancermicroarraysignatureintoahigh-throughputdiagnostictest.BMCGenomics2006,7:278)公开的方法,对实施例1中所述的ll个检测样本进行检测,将检测结果用实施l建立的模型进行预测,结果如图2c所示,图中以准确度表示预测结果的可信度,本例以0.5为界表示预测结果。结果表明,使用该芯片准确预测11个检测样本中10例患者是否在根治术后3年内复发。具体预测方法如下利用表3中HLA-DQB1、HLA-DRA、RHBDD2、CD3D、SAMD9、LCN1、OA1和COS-22等八个基因在21例肝癌患者中的数据作为训练数据集(trainingset)。其中包含9个3年内不复发的HCC患者和12个3年内复发的HCC患者的初次手术标本中HLA-DQB1、HLA-DRA等8个基因相对于癌旁混合标本的相对表达值以2为底取log后的数值。同时,将有待预测术后复发风险的HCC患者初次手术标本中,HLA-DQB1、HLA-DRA等8个基因相对于癌旁混合标本的相对表达值以2为底取log后的数值,作为预测数据集(testset)(表4)。使用PAM程序(PredictionAnalysisofMicroarrays)(参考文献EricBairl,RobertTibshirani.PLoSBIOLOGY,April2004,Volume2,Issue4,0511。程序和说明书下载网址http:〃www-stat.stanford.edu/~tibs/PAM/)按照程序说明进行模型训练和预测。首先,使用K-Nearest-Neighbor方法,设定10个Neighbor数,对该训练数据集进行训练,训练后设置阈值(Threshold)为0,再预测testset数据集中的HCC患者的术后的复发结局,输出预测结果(是否复发)和预测可能性分布图(PlotTestProbabilities)。表3:预测模型训练数据集<table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table><formula>formulaseeoriginaldocumentpage16</formula>权利要求1、一种基因芯片,其具有针对下述基因产生的RNA进行检测的探针HLA-DQB1、HLA-DRA、RHBDD2和CD3D。2、如权利要求l所述的基因芯片,其还具有针对选自下述基因产生的RNA进行检测的探针WMD9、LCiW、04/和COS-"。3、如权利要求l所述的基因芯片,其具有针对下述基因产生的RNA进行检测的探针//Z^-Z)gi^、//U-Di^、W/7^aD2、CZ)1D、4、如权利要求13任一项所述的基因芯片,其特征在于,所述探针来自下述相应基因的核酸序列、其互补序列,或者它们的片段:肌」-Z),、肌^-D脱i/ffiDZ)2、CA5"、&4MD9、丄C7W、04/或COS-22。5、一种试剂盒,其包括针对下述基因产生的RNA或表达产物测定的试剂ittyM)^57、//ZJ-D/^、W//^DZ)2和CD3D。6、如权利要求5所述的试剂盒,其还包括针对下述基因产生的RNA或表达产物测定的试剂&4MZ)9、丄C7W、047和COS-22。7、如权利要求5所述的试剂盒,其包括针对下述基因产生的RNA或表达产物测定的试剂//丄J-Z)g^、/tt^-DiM、i/^Z)D2、CZ)3"、5^MD9、丄CiW、a4/和cas-22。8、如权利要求57任一项所述的试剂盒,其特征在于,所述的盒为a)检测RNA的试剂盒荧光定量PCR检测试剂盒,原位杂交及原位RT-PCR,Nouthern检测试剂盒;或b)检测表达产物的试剂盒ELISA试剂盒或抗体芯片试剂盒。全文摘要本发明提供了一种肝癌术后预后的方法,包括对HLA-DQB1、HLA-DRA、RHBDD2、CD3D、SAMD9、LCN1、OA1和COS-22基因的差异表达分析。本发明还提供了用于肝癌预后的基因芯片和试剂盒。本发明基因芯片包括上述基因的核酸序列、互补序列或者它们的片段;本发明试剂盒包括对上述基因产生的RNA或表达产物测定的全部或部分试剂。实验表明,本发明提供的基因芯片或试剂盒对肝癌术后三年内是否复发预测的准确率达90%以上。文档编号C12Q1/68GK101457254SQ200810223720公开日2009年6月17日申请日期2008年10月9日优先权日2008年10月9日发明者张恒辉,谢兴旺,陈红松申请人:北京大学人民医院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1