肺癌的多基因预后试验的制作方法

文档序号:469938阅读:485来源:国知局
肺癌的多基因预后试验的制作方法
【专利摘要】本发明提供为肺癌提供预后的方法,该方法利用在肺癌中差别表达的一组八种分子标记物。
【专利说明】肺癌的多基因预后试验
[0001 ] 本申请是国际申请PCT/US2008/065409,国际申请日2008年5月30日,中国国家阶段申请号200880101348.2,名为“肺癌的多基因预后试验”的发明专利申请的分案申请。
[0002]相关申请的交叉引用
[0003]本申请要求2007年6月I日提交的USSN60/941,550的优先权,其通过引用全文纳入本文。
[0004]在联邦资助研发下作出发明的权利的声明
[0005]不适用
[0006]对以光盘提交的“序列表”、表格或计算机程序列表附件的引用
[0007]不适用
[0008]发明背景
[0009]借助临床分期和组织病理学发现来确定肺癌患者的长期死亡率可能性不佳。我们的假设是:多基因定量聚合酶链式反应(PCR)试验可预计肺癌患者的死亡率风险。
[0010]发明概述
[0011]在一方面,本发明提供为对象的肺癌提供预后的方法,该方法包括以下步骤:(a)将该对象的生物学样品与特异性结合一组生物标记物的试剂接触,所述生物标记物包括ctnnbl、wnt3a、tp53、kras、erbb3、mucl、erbb2 和 dusp6,和(b)通过比较该样品与对照非癌性细胞样品来测定所述标记物在该样品中是否差别表达;从而提供肺癌的预后。
[0012]在一个实施方式中,所述试剂是核酸。在另一实施方式中,所述试剂是寡核苷酸。在另一实施方式中,所述试剂是PCR引物组(primer set)。在另一实施方式中,所述试剂是抗体。
[0013]在一个实施方式中,所述样品来自外科手术切除的肿瘤。在另一实施方式中,所述样品来自肺组织或肺肿瘤活检。
[0014]在一方面,本发明提供装有特异性结合一组生物标记物的试剂的试剂盒,所述生物标记物包括 ctnnbl、wnt3a、tp53、kras、erbb3、mucl、erbb2 和 dusp。在一个实施方式中,所述试剂是PCR引物组。
[0015]在另一方面,本发明的特征在于通过定量测定生物学样品中至少两种(例如,至少三种或至少四种)基因的表达水平来确定患肺癌对象的预后的方法,所述基因选自下组:Rnd3、wnt3a、erbb3、lck、sh3bgr、fut3、illl、cdc6、cdk2apl、bagl、emx2、six3 和 brcal。在该方面,所述生物学样品(例如,肿瘤活检、肺活检和血液样品)源自该对象,而所述表达水平是预后的标志。
[0016]在以上任一方面,所述表达水平可以是mRNA表达水平或蛋白质水平,或二者的组合。本发明的特征在于通过,例如定量rtPCR测定mRNA表达水平。本发明的特征在于通过,例如抗体结合试验(例如 ,ELISA试验)测定蛋白质水平。
[0017]在还有另一方面,本发明的特征在于通过检测生物学样品中至少两种(例如,至少三种或至少四种)基因的甲基化水平来确定患肺癌对象的预后的方法,所述基因选自下组:Rnd3、wnt3a、erbb3、Ick、sh3bgr、fut3、illl、cdc6、cdk2apl、bagl、emx2、six3 和 brcal。在该方面,所述生物学样品(例如,肿瘤活检、肺活检和血液样品)源自该对象,而所述甲基化水平是预后的标志。
[0018]在以上任一方面,肺癌可以是肺腺癌,例如I期、II期、III期或IV期。
[0019]在以上任一方面,所述预后还提供长期死亡率的高或低风险评估。
[0020]附图简述
[0021]图1显示肺癌是癌症死亡最常见的原因,并显示对于I期癌症,长期死亡率的预后(5年存活率)是约60%。
[0022]图2显示预后的基因组模型。
[0023]图3描述了 RT PCR分析所用的样品。
[0024]图4描述了进行预后的患者群体。
[0025]图5描述了定量测(RT) PCR的方法。
[0026]图6描述了所 有肺腺癌标记物的训练组的结果。
[0027]图7描述了所有肺腺癌标记物的验证组的结果。
[0028]图8描述了 I期肺腺癌标记物的验证和训练组的结果。
[0029]图9列出了 I期肺腺癌的RT-PCR多基因预后试验所用的8种基因。
[0030]图10显示了包含验证组的分期、肿瘤尺寸和高评分的Cox模型的结果。
[0031]图1la是利用4-基因预后模型比较低-和高-风险患者(所有阶段)总存活率的卡-迈曲线(Kaplan-Meier curve)。
[0032]图1lb是比较低-和高-风险评分患者(所有阶段)无疾病存活率的卡-迈曲线。
[0033]图12a是利用4_基因预后模型比较低_和高_风险评分的I期患者总存活率的卡-迈曲线。
[0034]图12b是比较低-和高-风险评分的I期患者无疾病存活率的卡-迈曲线。
[0035]图13是利用Chen及其同事公布的5_基因预后模型比较低-和高-风险评分的I期患者的卡-迈曲线。
[0036]发明详述
[0037]引言
[0038]本发明的特征在于鉴定到某些组合的基因的表达概况能对早期肺癌的长期死亡率作出精确预后。在一个实施方式中,我们鉴定了 65种基因,这些基因在以前公布的3项微阵列研究和2项基于PCR的研究中鉴定为早期肺癌的长期死亡率预后。从肺腺癌完全切除的连续患者的124份新鲜冷冻的肿瘤样品中提取RNA,所述患者至少临床随访3年。将80份样品随机指定为测试组,将其余样品指定为验证组。采用Taq-man试验对测试组进行65种鉴定基因的实时PCR。米用反向模型选择(backwards model selection),利用标准化基因表达水平的比例危险率模型产生预测模型。利用模型系数和各基因表达水平计算各患者的模型评分。如果模型评分大于中值评分,则患者确定为高风险。
[0039]在所有80位患者中鉴定了充分的实时PCR概况。最终模型包括18种基因。鉴定为闻_风险和低_风险的患者比例分别是是52%和48%。低-风险组中卡-迈(Kaplan-Meier)预计5年存活率是82%,在高-风险组中是5% (P〈0.001,时序检验)。高-风险组中,中值存活是22个月,低-风险组中未获得。在多变量存活分析中,预后评分预计的存活率不依赖于肿瘤阶段和尺寸(P〈0.001)。根据模型log-可能性值,预后评分预计死亡率优于临床分期(p〈0.001)。临床分期可参见,例如Mountain, CliftonF;Herman I Libshitz, Kay E Hermes.A Handbook for Staging, Imaging, and Lymph NodeClassif ication (分期、成像和淋巴结分类手册).CPY 公司(Charles P Young Company),和 Mountain, CF(1997)."Revisions in the international system for staging lungcancer〃(肺癌分期国际体系的修订).Chestlll = 1710-1717。
[0040]在另一实施方式中,本发明的特征在于定量测定作为肺癌所致死亡率的预后指标的以下基因表达:rnd3>wnt3a> erbb3> lck、sh3bgr> fut3> illl、cdc6、cdk2apl、bagl、emx2、six3、和 brcal (例如,wnt3a、rnd3> lck、和 erbb3)(参见以下实施例 2)。
[0041]8 成员的多-基因 RT-PCR 试验(ctnnbl、wnt3a、tp53、kras、erbb3> mucl、erbb2和 dusp6)、13 成员的多-基因 RT-PCR 试验(rnd3、wnt3a、erbb3、lck、sh3bgr、fut3、illl、cdc6、cdk2apl、bagl、emx2、six3、和 brcal)、或包括 wnt3a、rnd3、lck、和 erbb3 的任何多-基因RT-PCR试验有助于预测肺癌患者的长期死亡率。
[0042]本发明还包括多基因诊断试剂盒,其由本文所述可用于提供肺癌患者预后的标记物构成。
[0043]定义
[0044]“肺癌”通常指由恶性细胞的尺寸和外观分类的主要两类肺癌:非小细胞(80%)和小细胞(约20%)肺癌。“非小细胞肺癌”(NSCLC)包括鳞状细胞癌,约占肺癌的29%。肺腺癌是NSCLC的最常见亚型,约占肺癌的32%。肺腺癌的一种亚型是细支气管肺泡癌,其在从不吸烟女性中更常见。大细胞癌约占肺癌的9%。“小细胞肺癌”包括SCLC(也称为“燕麦形细胞癌”),其是不常见的肺癌形式。肺癌的其它类型包括类癌、腺样囊性癌、圆柱瘤、和粘液表皮样癌。在一个实施方式中,按照1-1V期对肺癌分期,其中I是早期,IV是最晚期。
[0045]“预后”指,例如总存活率、长期死亡率和无疾病存活率。在一个实施方式中,长期死亡率指诊断为肺癌后存活5年。在一个实施方式中,长期死亡率的预后是“高风险的”,例如高死亡率风险,或“低风险的”,例如低死亡率风险。癌症的阶段和预后可用于为患者定制治疗以提供较好的后果,例如靶向治疗和外科手术、单用外科手术或单用靶向治疗。
[0046]癌症的其它形式包括癌、肉瘤、腺癌、淋巴瘤、白血病等,包括实体和淋巴癌症、头颈癌,例如口腔癌、咽和舌癌、肾癌、乳腺癌、肾癌、膀胱癌、结肠癌、卵巢癌、前列腺癌、胰腺癌、胃癌、脑癌、头颈癌、皮肤癌、子宫癌、睾丸癌、食道癌、和肝脏癌症,包括肝癌、淋巴瘤,包括非霍奇金淋巴瘤(例如,伯基特、小细胞、和大细胞淋巴瘤)和霍奇金淋巴瘤、白血病、和多发性骨髓瘤。
[0047]术语“标记物”指细胞中表达的、与非癌细胞相比表达在癌细胞表面上或由癌细胞分泌的分子(通常是蛋白质、核酸、碳水化合物或脂质),其可用于诊断癌症、提供预后以及可将药理学制剂优先靶向癌细胞。这些标记物通常是与非癌细胞相比,在肺癌或其它癌症细胞中过表达的分子,例如与正常细胞相比1-倍过表达、2-倍过表达、3-倍或更多倍过表达。此外,标记物可以是与正常细胞表达的分子相比,在癌症细胞中不成比例合成的分子,例如含有缺失、添加或突变的分子。或者,这些生物标记物是与非癌症细胞相比,在癌症细胞中表达不足的分子,例如1-倍低表达、2-倍低表达、3-倍或更多倍低表达。此外,标记物可以是与正常细胞表达的分子相比,在癌症中不成比例合成的分子,例如含有缺失、添加或突变的分子。[0048]技术人员应明白标记物可与任何应用,例如本文公开的癌症预测、诊断或预后的其它标记物或测试联用。
[0049]“生物学样品”包括组织切片,例如活检和尸检样品,以及为组织学目的取得的冷冻切片。这种样品包括血液和血液组分或产物(例如,血清、血小板、红细胞等)、痰、支气管肺泡灌洗液、培养细胞,例如原代培养物、外植块、以及转化细胞、粪便、尿液等。生物学样品一半获自真核生物,最优选哺乳动物,例如灵长类,如黑猩猩或人;牛;狗;猫;啮齿类动物,例如豚鼠、大鼠、小鼠;家兔;或鸟类;爬行类;或鱼类。
[0050]“活检”指为诊断或预后评价而取出组织样品的过程,还指组织样本自身。本领域已知的任何活检技术适用于本发明的诊断和预后方法。所应用的活检技术取决于待评价的组织类型(例如,肺)、肿瘤的尺寸和类型等因素。代表性活检技术包括但不限于:切除活检、切开式活检、针吸活检、手术活检和骨髓活检。“切除活检”指取出整个肿瘤块以及其周围的少量正常组织。“切开式活检”指取出包括肿瘤横断面直径的楔形组织。通过内窥镜检查或荧光镜检作出的诊断或预后可能需要“芯针活检”或“细针抽吸活检”,这些技术通常从革巴组织内得到细胞悬液。例如,Harrison’ s Principles of Internal Medicine(哈里森内科原理),Kasper等编,第16版,2005,第70章,和整个V部分讨论了活检技术。
[0051]术语“过表达”或“过表达的”可互换指代与正常细胞相比,通常在癌细胞中可检测到更高水平的转录或翻译的蛋白质或核酸(RNA)。该术语包括与正常细胞相比,转录、转录后加工、翻译、翻译后加工、细胞定位(例如,细胞器、细胞质、核、细胞表面)和RNA及蛋白质稳定所致的过表达。可采用检测mRNA( 即,RT-PCR、PCR、杂交)或蛋白质(即,ELISA、免疫组化技术)等常规技术检测过表达。与正常细胞相比,过表达可以是10%、20%、30%、40%、50%、60%、70%、80%、90%或更多。在某些情况中,与正常细胞相比,过表达是1_倍、2-倍、3-倍、4-倍或更高水平的转录或翻译。
[0052]术语“低表达 ”、“低表达的”或“下调”可互换指代与正常细胞相比,在癌症细胞中低于可检测水平转录或翻译的蛋白质或核酸。该术语包括与对照相比,转录、转录后加工、翻译、翻译后加工、细胞定位(例如,细胞器、细胞质、核、细胞表面)和RNA及蛋白质稳定所致的低表达。可采用检测mRNA( 即,RT-PCR、PCR、杂交)或蛋白质(即,ELISA、免疫组化技术)等常规技术检测低表达。与对照相比,低表达可以是10%、20%、30%、40%、50%、60%、70%、80%,90%或更低。在某些情况中,与对照相比,低表达是1-倍、2-倍、3-倍、4-倍或更低水平的转录或翻译。
[0053]就本发明而言,术语“差异表达”或“差异调节”通常指与至少一份其它样品相比,一份样品中的蛋白质或核酸过表达(上调)或低表达(下调),通常是在癌症患者中,与没有癌症的患者相比。
[0054]“治疗性治疗”和“癌症治疗”指化疗、激素治疗、放疗、免疫治疗和生物(靶向)治疗。
[0055]本文的“治疗有效量或剂量”或“有效量或剂量”表示产生给药所需作用的剂量。精确的剂量取决于治疗的目的,本领域技术人员采用已知技术可确定(参见,例如Lieberman, Pharmaceutical Dosage Forms (药物剂型)(第 1-3 卷,1992) ; Lloyd, TheArt, Science and Technology of Pharmaceutical Compounding(药物配制的领域、科学和技术)(1999) ;Pickar, Dosage Calculations (剂量计算)(1999);和 Remington:TheScience and Practice of Pharmacy (雷明顿:药学科学与实践),第 20 版,2003,Gennaro编,Lffff 公司(Lippincott, ffilliams&ffilkins))。
[0056]就两条或更多条核酸或多肽序列而言,术语“相同”或“相同性”百分比指利用默认参数如下所示的BLAST或BLAST2.0序列比较算法,或通过手工比对和目测观察(参见,例如NCBI网址ncb1.nlm.nih.gov/BLAST等)测定到两条或更多条序列或子序列相同或具有一定百分比的相同氨基酸残基或核苷酸(即,当在比较窗或指定区域进行最大对应性的比较和比对时,在特定区域上有约60%相同性,优选65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高相同性)。然后称这些序列“基本上相同”。该定义还指或可适用于测试序列的互补序列。该定义还包括具有缺失和/或添加的序列以及具有取代的那些序列。如下所述,优选的算法可解释空位等。优选在至少约25个氨基酸或核苷酸长度,或更优选在50-100个氨基酸或核苷酸长度的区域具有相同性。可用探针检测本文所述的生物标记物,所述探针(例如)在特定区域与登录号所示参比序列有70%以上相同性,或80%以上相同性、或90%以上相同性直至100%相同性。
[0057]对于序列比较,通常将一条序列用作参比序列,将测试序列与其比较。当采用序列比较算法时,将测试和参比序列输入计算机,指定子序列座标(如果需要的话)并指定序列算法程序参数。优选利用默认参数,或者可以指定参数。然后序列比较算法根据程序参数计算测试序列相对于参比序列的序列相同性百分比。
[0058]本文所用的“比较窗”包括参考选自20-600,通常约50-200,更常见约100-150中任一数量的毗连位置的区段,对两个序列进行最优比对后,可将该区段中的序列与相同数量毗连位置的参比序列作比较。比对序列进行比较的方法是本领域熟知的。可通过,例如 Smith 和 Waterman, Adv.Appl.Math.2:482 (1981)的局部同源性算法,Needleman 和ffunsch, J.Mol.Biol.48:443 (1970)的同源性比对算法,通过 Pearson 和 Lipman, Proc.Nat’ 1.Acad.Sc1.USA85:2444 (1988)的相似性搜索法,通过计算机执行这些算法(遗传学计算组(Genetics Comp uter Group)的威斯康星遗传学软件包(Wisconsin GeneticsSoftware Package)中的 GAP、BESTFIT、FASTA 和 TFASTA, 575 科学 Dr.,威斯康星州麦迪逊(Madison,WI)),或通过手工比对和目测(参见例如,《新编分子生物学实验指南》(Current Protocols in Molecular Biology) (Ausubel 等编,1987-2005, WI 公司(WileyInterscience)))进行最优序列比对以便比较。
[0059]适合测定序列相同性和序列相似性百分比的算法的优选例子分别是BLAST和BLAST2.0 算法,参见 Altschul 等,Nuc.Acids Res.25:3389-3402 (1977)和 Altschul 等,J.Mol.Biol.215:403-410(1990)。使用BLAST和BLAST2.0,参数如本文所述来确定本发明核酸和蛋白质的序列相同性百分比。实施BLAST分析的软件通过国家生物技术信息中心(National Center for Biotechnology Information)(http://www.ncb1.nlm.nih.gov/)为公众所得。该算法包括首先通过在查询序列中鉴定长度W的短字来鉴定高评分序列对(HSP),该短字与数据库序列中相同长度的字比对时,匹配或满足一些正值阈值评分T。T称为相邻字评分阈值(Altschul等,同上)。这些初始相邻字命中用作启动搜索发现含有它们的更长的HSP的种子。该字命中在沿各序列的两个方向上延伸,直到累积比对评分可增加。对于核苷酸序列,利用参数M( —对匹配残基的奖励评分;总是>0)和N(错配残基的罚分;总是〈0)计算累积评分。对于氨基酸序列,用评分矩阵计算累积评分。在以下情况时字命中在各个方向上的延伸中止:累积比对评分比最大获得值降低X ;由于一个或多个负评分残基比对的累积,造成累积评分变为零或零以下;或者达到各序列的末端。BLAST算法参数W、T和X决定了比对的灵敏度和速度。BLASTN程序(对核苷酸序列而言)采用的默认值如下:字长(W) 11,期望值(E)10,M=5,N=-4,以及比较两条链。对于氨基酸序列,BLASTP程序使用的默认值为:字长3,期望值(E) 10,BLOSUM62评分矩阵(参见Henikoff和Henikoff,Proc.Natl.Acad.Sc1.USA89:10915 (1989))比对(B) 50,期望值(E) 10,M=5,N=_4,以及比较两条链。
[0060]“核酸”指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸和它们的聚合物及其互补体。该术语包括含有已知核苷酸类似物或修饰主链残基或连接键的核酸,它们是合成、天然产生的和非天然产生的,它们与参比核酸的结合特性类似,并且与参比核苷酸的代谢方式类似。这类类似物的例子包括但不限于:硫代磷酸酯、氨基磷酸酯(phosphoramidates)、膦酸甲酯、手性_膦酸甲酯、2_0_甲基核糖核苷酸、肽_核酸(PNA)。
[0061]除非另有表明,特定核酸序列也隐含包括其保守修饰变体(如,简并密码子取代)和互补序列,以及明确指出的序列。具体地说,可通过产生其中一个或多个选择的(或所有)密码子的第三位被混合碱基和/或脱氧肌苷残基取代的序列而获得简并密码子取代(Batzer 等,Nucleic Acid Res.19:5081 (1991) ;0htsuka 等,J.Biol.Chem.260:2605-2608 (1985) ;Rossolini 等,Mol.Cell.Probes8:91-98 (1994))。术语核酸可与基因、cDNA、mRNA、寡核苷酸和多核苷酸可互换使用。
[0062]特定的核酸序列还隐含包括“剪接变体”和编码截短形式蛋白质的核酸序列。类似地,核酸编码的特定蛋白质隐含包括该核酸的剪接变体或截短形式编码的任何蛋白质。如其名称所暗示的,“剪接变体”是基因的另路剪接产物。转录后,可剪接初始核酸转录物,因而不同的(另路)核酸剪接产物能编码不同多肽。产生剪接变体的机制有所不同,但包括外显子的另路剪接。该定义还包括通过通读转录而源自同一核酸的另路多肽(alternatepolypeptide) 0该定义包括剪接反应的任何产物,包括重组形式的剪接产物。核酸可以在5’端或3’端截短。多肽 可以在N-末端或C-末端截短。截短的核酸或多肽序列可以是天然产生或重组产生的。
[0063]术语“多肽”、“肽”和“蛋白质”在本文可互换使用,指代氨基酸残基的聚合物。这些术语适用于其中一个或多个氨基酸残基是对应于天然产生的氨基酸的人工化学模拟物的氨基酸聚合物,以及天然产生的氨基酸聚合物和非天然产生的氨基酸聚合物。
[0064]术语“氨基酸”指天然产生和合成的氨基酸以及通过与天然产生氨基酸相类似方式起作用的氨基酸类似物和氨基酸模拟物。天然产生的氨基酸是遗传密码编码的那些,以及随后修饰的那些氨基酸,例如羟基脯氨酸、Y-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物指具有与天然产生的氨基酸相同基础化学结构,即,具有结合氢的α碳、羧基、氨基和R基团的化合物,例如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍(methioninemethyl sulfonium)。这种类似物具有修饰的R基团(例如,正亮氨酸)或修饰的肽主链,但保留了与天然产生的氨基酸相同的基础化学结构。氨基酸模拟物指结构与氨基酸的通用化学结构不同,但通过与天然产生氨基酸相类似方式起作用的化合物。
[0065]本文可用IUPAC-1UB生物化学命名委员会(Biochemical NomenclatureCommission)推荐的公知三字母标志或单字母标志指称氨基酸。类似地,可用其一般接受的单字母密码指称核苷酸。
[0066]“保守修饰变体”适用于氨基酸和核酸序列。对于特定的核酸序列,保守修饰变体指编码相同或基本相同的氨基酸序列的核酸,或者当核酸不编码氨基酸序列时,指基本相同的序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定的蛋白质。例如,密码子GCA、GCC、GCG和G⑶都编码丙氨酸。因此,在密码子指定为丙氨酸的每个位置上,可将密码子改变为所述的任何相应密码子而不改变编码多肽。这种核酸变异是“沉默变异”,保守修饰变异的一种。编码多肽的本文各核酸序列也描述该核酸的每种可能的沉默变异。本领域技术人员认识到,可修饰核酸中的各密码子(除了 AUG和TGG,AUG通常是甲硫氨酸的唯一密码子,TGG通常是色氨酸的唯一密码子),以产生功能相同的分子。因此,对于表达产物,所述各序列中暗示了编码多肽的核酸的各沉默变异,但对于实际的探针序列不是这样。
[0067]对于氨基酸序列,本领域技术人员会认识到,核酸、肽、多肽或蛋白质序列的单个取代、缺失或添加以在编码序列中改变、添加或删除一个氨基酸或少部分氨基酸是“保守修饰变体”,其中改变导致用化学上相似的氨基酸取代某氨基酸。提供功能相似氨基酸的保守取代表是本领域熟知的。这种保守修饰的变体应加上且不排除本发明的多态性变体、种间类似物和等位基因。
[0068]以下八组各含有可彼此保守取代的氨基酸:1)丙氨酸(A),甘氨酸(G) ;2)天冬氨酸(D),谷氨酸(E) ;3)天冬酰胺(N),谷胺酰胺(Q) ;4)精氨酸(R),赖氨酸⑷;5)异亮氨酸⑴,亮氨酸(L),甲硫氨酸(M),缬氨酸(V) ;6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W) ;7)丝氨酸(S),苏氨酸(T);和8)半胱氨酸(C),甲硫氨酸(M)。参见例如,Creighton,Proteins(1984)。
[0069]“标记物”或“可检测部分”是能通过分光光度方法、光化学方法、生物化学方法、免疫化学方法、化学方法或其它物理方法检测的组成物。例如,有用的标记物包括32P、荧光染料、电子密度试剂、酶(如经常用于ELISA的)、生物素、地高辛或半抗原以及可通过例如将放射性标记物掺入肽中而可检测或可用于检测与所述肽特异性反应的抗体的蛋白质。
[0070]在述及例如细胞、核酸、蛋白`质或载体时,术语“重组”表示该细胞、核酸、蛋白质或载体已通过引入异源核酸或蛋白质或改变天然核酸或蛋白质作了修饰,或该细胞源自如此修饰的细胞。因此,例如重组细胞表达在天然(未重组)形式的细胞中未发现的基因或表达在其它情况下异常表达、低表达或根本不表达的基因。
[0071]短语“严谨杂交条件”指探针与其靶子序列(通常在核酸的复杂混合物中)杂交,但不与其它序列杂交的条件。严谨条件是序列依赖性的,在不同情况下不同。较长的序列在较高温度下特异性杂交。有关核酸杂交的广泛指南参见Tijssen,《生物化学和分子生物学技术一与核酸探针杂交》(Techniques in Biochemistry and MolecularBiology—Hybridization with Nucleic Probes), “核酸测定的杂交原理和方案概览,,(Overview of principles of hybridization and the strategy of nucleic acidassays) (1993)。通常,选择的严谨条件比特定序列在确定离子强度、pH下的热解链温度(Tffl)低约5-10°C。Tm是50%靶标互补探针与靶序列杂交平衡时的温度(在确定的离子强度、PH和核酸浓度下)(靶序列过量,在1'111时50%探针被平衡地占据)。也可加入去稳定剂,如甲酰胺获得严谨条件。对于选择性或特异性杂交,阳性信号至少是背景杂交信号的两倍,优选10倍。示范性的严谨杂交条件可以如下所示:50%甲酰胺、5x SSC和1%SDS,42°C温育,或者 5x SSC、1%SDS、65°C温育,65°C用 0.2x SSC 和 0.1%SDS 洗涤。
[0072]如果编码的多肽基本相同,那么在严谨条件下不相互杂交的核酸仍然基本相同。例如,用遗传密码所允许的最大密码子简并性产生核酸拷贝时,可能发生这种情况。在这种情况下,核酸一般在中等严谨的杂交条件下杂交。示范性“中等严谨杂交条件”包括37°C,在40%甲酰胺、IM NaCl、l%SDS的缓冲液中杂交,45°C,1X SSC洗涤。阳性杂交至少是背景的两倍。本领域普通技术人员不难认识到,可利用其它杂交和洗涤条件提供类似的严谨性条件。许多参考文献提供了确定杂交参数的其它指导,例如《新编分子生物学实验指南》,Ausubel等编,同上。
[0073]对于PCR,低严谨性扩增的温度通常是约36°C,虽然退火温度可以根据引物长度而介于约32 °C和48 °C之间不等。对于高严谨性PCR扩增,典型的温度是约62 °C,虽然高严谨性退火温度可以根据引物长度和特异性而介于约50°C和约65°C之间不等。高和低严谨性扩增的典型循环条件包括90°C -95°C,30秒-2分钟的变性阶段,持续30秒-2分钟的退火阶段,和约72°C,1-2分钟的延伸阶段。低和高严谨性扩增反应的方案和指导见,例如Innis等,(1990) PCR Protocols, A Guide to Methods and Applications (PCR 方案,方法和应用指南),学术出版社公司(Academic Press, Inc.),纽约)。 [0074]“抗体”指包含免疫球蛋白基因的框架区的多肽,或其特异性结合和识别抗原的片段。公认的免疫球蛋白基因包括K、λ、α、Υ、δ、ε、和μ恒定区基因以及大量免疫球蛋白可变区基因。轻链分类为K或λ。重链分类为Y、μ、α、δ或ε ,进而分别限定了免疫球蛋白类别,IgG, IgM, IgA, IgD和IgE。抗体的抗原结合区对于结合的特异性和亲和力至关重要。抗体可以是多克隆或单克隆的,衍生自血清、杂交瘤或重组克隆的,还可以是嵌合型、灵长类化或人源化的。
[0075]示范性免疫球蛋白(抗体)结构单位包含四聚体。各四聚体由相同两对多肽链构成,各对具有一条“轻链”(约25kDa)和一条“重链”(约50-70kDa)。各链的N-末端限定了主要负责抗原识别的约100-110或更多个氨基酸的可变区。术语可变轻链和可变重链(Vh)分别指这些轻链和重链。
[0076]存在的抗体可以是,例如完整的免疫球蛋白或用各种肽酶消化产生的许多充分表征的片段。因此,例如,胃蛋白酶消化抗体绞链区下的二硫键以产生F(ab)’ 2,即Fab的二聚体,Fab本身是通过二硫键连接于Vh-ChI的轻链。F(ab) ’ 2可在温和条件下还原以打开绞链区的二硫键,从而将F(ab)’ 2 二聚体转化成Fab’单体。Fab’实质上是具有绞链区部分的Fab (参见Fundamental Immunology (基础免疫学)(Paul编,第3版,1993)。虽然根据完整抗体的消化定义了各种抗体片段,技术人员应知道,可通过化学方法或采用重组DNA技术从头合成这种片段。因此,本文所用的术语“抗体”还包括通过修饰完整抗体产生的抗体片段,或采用重组DNA方法从头合成的那些(例如,单链Fv)或利用噬菌体展示文库鉴定的那些(参见,例如 McCafferty 等,Nature348:552-554 (1990))。
[0077]在一个实施方式中,抗体偶联于“效应”部分。效应部分可以是任何数量的分子,包括标记物部分,例如放射性标记物或突光标记物,或者可以是治疗部分。在一方面,抗体调节蛋白质的活性。
[0078]本发明的差别表达基因的核酸或它们编码的多肽指所有形式的核酸(例如,基因、前-mRNA、RNA)或蛋白质、它们的多态变体、等位基因、突变体和种间同源物,所述这些具有以下特点(适用于核酸或蛋白质):(1)具有的氨基酸序列优选在至少约25、50、100、200、500、1000或更多氨基酸的区域上与参比核酸编码的多肽或本文所述氨基酸序列具有高于约 60% 的氨基酸序列相同性,65%、70%、75%、80%、85%、90%、优选 91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;(2)特异性结合抗体,例如用包含参比氨基酸序列的免疫原、其免疫原性片段产生的多克隆抗体及其保守修饰变体;(3)在严谨杂交条件下与编码参比氨基酸序列的核酸及其保守修饰变体特异性杂交;(4)具有的核酸序列优选在至少约25、50、100、200、500、1000或更多核苷酸上与参比核酸序列具有高于约95%,优选高于约96%、97%、98%、99%或更高的的核酸序列相同性。多核苷酸或多肽序列通常来自哺乳动物,包括但不限于:灵长类,例如人;啮齿类,如大鼠、小鼠、仓鼠;牛、猪、马、绵羊或任何哺乳动物。本发明的核酸和蛋白质包括天然产生的或重组分子。该定义包括截短和另路剪接形式的这些抗原。
[0079]述及蛋白质、核酸、抗体或小分子化合物时,短语“特异性(或选择性)结合”指确定蛋白质或核酸的存在的结合反应,例如本发明差别表达的基因,所述蛋白质或核酸通常处于蛋白质或核酸和其它生物物质的异质群体中。以抗体为例,在指定的免疫测定条件下,特定抗体与特定蛋白质的结合至少是背景的两倍,更典型的是背景的10-100倍以上。在这种条件下,与抗体的特异性结合要求选择的抗体对特定蛋白质具有特异性。例如,可选择多克隆抗体从而只获得与所选抗原而不与其它蛋白质发生特异性免疫反应的那些多克隆抗体。可通过排除与其它分子交叉反应的抗体来实施这种选择。可采用各种免疫测定形式来选择与特定蛋白质发生特异性免疫反应的抗体。例如,固相ELISA免疫测定常规用于选择与蛋白质发生特异性免疫反应的抗体(可用于测定特异性免疫反应性的免疫测定的形式和条件可参见,例如Harlow和Lane, Antibodies, A Laboratory Manual (抗体的实验室手册)(1988))。
[0080]就测试能调节标记物蛋白质的化合物的试验而言,短语“功能效应”包括测定间接或直接受本发明生物 标记物影响的参数,例如化学的或表型的。因此,功能效应包括配体结合活性、转录活化或阻遏、细胞增殖的能力、迁移能力,等等。“功能效应”包括体外、体内和离体活性。
[0081]“测定功能效应”表示检验某化合物是否能增加或降低间接或直接受本发明生物标记物影响的参数,例如检测物理和化学或表型效应。可通过本领域技术人员已知的任何方法检测这种功能效应,例如光谱特征(如,荧光、吸光度、折射率)的变化;流体动力学(如,形状)、色谱特征的变化;或蛋白质的溶解特性;配体结合试验,例如与抗体的结合;检测诱导型标记物或标记物的转录活化;检测酶活性的变化;提高或降低细胞增殖、凋亡、细胞周期停滞的能力;检测细胞表面标记物的改变。可通过本领域技术人员已知的任何方法评估功能效应,例如定量或定性检测形态学特征改变的显微术、检测胎盘组织中表达的其它基因在RNA或蛋白质水平上的变化、检测RNA稳定性、鉴定下游或报道基因表达(CAT、萤光素酶、β-gal、GFP,等等),例如通过化学发光、荧光、比色反应、抗体结合、诱导型标记物
坐寸ο
[0082]标记物的“抑制剂”、“活化剂”和“调节剂”用于指代采用癌症生物标记物的体外和体内试验鉴定的活化、抑制或调节性分子。抑制剂是,例如结合、部分或完全阻断活性、降低、阻止、延迟活化、灭活、脱敏或下调癌症生物标记物活性或表达的化合物。“活化剂”是增加、打开、活化、促进、增强、活化、敏化、激动或上调癌症生物标记物活性的化合物,例如激动剂。抑制剂、活化剂或调节剂还包括癌症生物标记物的遗传修饰形式,例如活性改变的形式,以及天然产生和合成的配体、拮抗剂、激动剂、抗体、肽、环肽、核酸、反义分子、核酶、RNAi和siRNA分子、有机小分子等。抑制剂和活化剂的这种试验包括,例如在细胞或细胞提取物中体外表达癌症生物标记物,施加推定的调节化合物,然后测定对活性的功能效应,如上所述。
[0083]将包含癌症生物标记物并用可能的活化剂、抑制剂或调节剂处理的样品或试验与不含抑制剂、活化剂或调节剂的对照样品作比较以检测抑制程度。对照样品(未用抑制剂处理)指定为相对蛋白质活性值为100%。当与对照相比,活性值是约80%、优选50%、更优选25-0%时,获得癌症生物标记物的抑制作用。当与对照(未用活化剂处理)相比,活性值是110%、更优选150%、更优选200-500% (即,与对照相比,两倍或五倍)、更优选1000-3000%时,获得癌症生物标记物的活化作用。
[0084]本文所用的术语“测试化合物”或“候选药物”或“调节剂”或其语法等价体描述了要检验其直接或间接调节癌症生物标记物的能力的天然产生或合成的任何分子,例如蛋白质、寡肽(例如,长约5-约25个氨基酸,优选长约10-20或12-18氨基酸,优选长12、15或18氨基酸)、有机小分子、多糖、肽、环肽、脂质、脂肪酸、siRNA、多核苷酸、寡核苷酸等。测试化合物可以是测试化合物文库的形式,例如提供足够多样性的组合或随机文库。测试化合物任选与融合伴侣,例如靶向化合物、拯救化合物、二聚化化合物、稳定化合物、可寻址化合物和其它功能部分相连。一般可通过鉴定具有某些所需特性或活性,例如抑制活性的测试化合物(称为“前导化合物”)、产生该前导化合物的变体并评估那些变体化合物的特性和活性来产生具有有用特性的新化学实体。这种分析常采用高通量筛选(HTS)方法。
[0085]“有机小分子”指天然产生或合成的有机分子,其分子量大于约50道尔顿并小于约2500道尔顿,优选小于约2000道尔顿,优选介于约100-约1000道尔顿之间,更优选介于约200-约500道尔顿之间。
[0086]预后方法`
[0087]本发明提供通过检测在癌症中差别表达的一组标记物的表达情况而对肺癌作出预测或预后的方法。所述标记物的例子包括以下基因中的一些或全部:ctnnbl、wnt3a、tp53、kras、erbb3> mucl、erbb2 和 dusp6,以下基因中的一些或全部:rnd3、wnt3a、erbb3>lck、sh3bgr> fut3> illl、cdc6、cdk2apl、bagl、emx2、six3、和 brcal (例如,wnt3a、rnd3>lck、和erbb3)。预测和预后包括测定患者或患者样品中的一组肺癌生物标记物多核苷酸或相应多肽的水平,然后将该水平与基线范围作比较。基线水平通常代表未患或不会产生肺癌的健康人中该多核苷酸或核酸的水平,如利用生物学样品,如肺活检或体液样品检测的。本发明多核苷酸或相应多肽的水平偏离基线范围(上调或下调)表明该患者的长期死亡率风险升闻。
[0088]在优选的实施方式中,利用生物学样品,例如肿瘤组织的RNA,采用实时或定量PCR检测检测该组中8种生物标记物的表达。无需显微解剖。可通过本领域技术人员已知的任何方法进行RNA提取,例如采用Trizol和RNeasy。可通过本领域技术人员已知的任何方法进行实时PCR,例如采用应用生物系统公司试验(Applied Biosystem assays)的Taqman实时PCR。相对于正常肺RNA计算基因表达,根据持家基因标准化表达。本领域技术人员可选择合适的寡核苷酸引物。在一个实施方式中,所述试验用于I期、II期、III期或IV期癌症。在一个实施方式中,所述组织样品来自外科手术切除的肿瘤。
[0089]在一个实施方式中,利用核酸结合分子,例如探针、寡核苷酸、寡核苷酸阵列和引物检测RNA生物标记物,从而检查患者样品中RNA的差别表达。在一个实施方式中,按照本领域已知的标准方法利用RT-PCR。在另一实施方式中,可采用定量PCR试验,例如应用生物
系统公司的Taqmanκ试验来检测核酸及其变体。在其它实施方式中,可利用核酸微阵列检
测核酸。可采用常规技术,例如northern分析进行核酸分析,或者本发明还包括基于核酸序列杂交的任何其它方法(例如,狭线印迹杂交),所述核酸序列与标记物编码序列的一部分互补。结合所选核酸生物标记物的试剂可按照本领域技术人员已知的方法制备或商品化购得。
[0090]适用的PCR扩增技术描述于,例如Ausubel等,和Innis等,同上。通用核酸杂交方法描述于Anderson, “Nucleic Acid Hybridization (核酸杂交)”生物科学出版社(BIOS Scientific Publishers),1999。还可从安排在微阵列中的mRNA或cDNA序列进行多个核酸序列(例如,基因组DNA、mRNA或cDNA)的扩增或杂交。微阵列方法通常描述于Hardiman,“Microarrays Methods and Applications:Nuts&Bolts (微阵列方法和应用:螺母与螺栓),,DNA Press, 2003 ;Baldi 等,“DNA Microarrays and Gene Expression:FromExperiments to Data Analysis and Modeling (DNA微阵列和基因表达:从实验到数据分析和建模)”,剑桥大学出版社(Cambridge University Press),2002。
[0091]可采用本领域已知的方法分析核酸标记物,包括但不限于序列分析和电泳分析。序列分析的非限制性例子包括马克西姆-吉尔伯特测序(Maxam-Gi Ibertsequencing)、桑格测序(Sanger sequencing)、毛细管阵列DNA测序、热循环测序(Sears等,Biotechniques, 13:626-633(1992))、固相测序(Zimmerman 等,Methods Mol.Cell Biol.,3:39-42(1992))、质谱学测序,例如衬质辅助激光解吸与电离-飞行质谱法(MALD1-TOF/MS ;Fu 等,Nat.Biotechnol.,16:381-384 (1998))和杂交测序。Chee 等,Science, 274:610-614(1996) ;Drmanac 等,Science, 260:1649-1652 (1993) ;Drmanac 等,Nat.Biotechnol.,16:54-58(1998)。电泳分析的非限制性例子包括平板凝胶电泳,例如琼脂糖或聚丙烯酰胺凝胶电泳、毛细管电泳和变性梯度凝胶电泳。
[0092]在另一实施方式中,可采用本领域技术人员已知的许多免疫测定,在测定中利用抗体试剂来检测本发明蛋白质生物标记物的表达水平。免疫试验技术和方法通常描述与Price 和 Newman, “Principles and Practice of Immunoassay (免疫测定的原理与实践),,,第 2版,格罗夫词典公司(Grove’s Dictionaries),1997; Gosling, “ Immunoassays:A Practical Approach (免疫测定:一种实用方法)”牛津大学出版社(Oxford UniversityPress),2000。可采用各种免疫测定技术,包括竞争性和非竞争性免疫测定。参见,例如Self等,Curr.0pin.Biotechnol., 7:60-65(1996)。术语“免疫测定”包括的技术包括但不限于:酶免疫测定(EIA),例如酶放大免疫分析技术(EMIT)、酶联免疫吸附测定(ELISA)、IgM抗体捕捉ELISA (MAC ELISA)、和微粒酶免疫测定(MEIA);毛细管电泳免疫测定(CEIA);放射性免疫测定(RIA);免疫放射测定(IRMA);荧光极化免疫测定(FPIA);和化学发光测定(CL)。如果需要,这些免疫测定可自动进行。免疫测定还可与激光诱导荧光联用。参见,例如 Schmalzing 等,Electrophoresis, 18:2184-93 (1997) ;Bao, J.Chromatogr.B.Biomed.Sc1.,699:463-80(1997)。脂质体免疫测定,例如流动-注射脂质体免疫测定和脂质体免疫传感器也适用于本发明。参见,例如Rongen等,J.1mmunol.Methods, 204:105-133 (1997)。此外,浊度法试验适用于本发明方法,该试验中蛋白质/抗体复合物的形成导致可转换成峰比率信号(peak rate signal)的光散射增加,而该信号与标记物浓度呈函数关系。浊度法试验可商品化购自加利福尼亚州贝瑞阿市的贝克曼考特尔公司(BeckmanCoulter, Brea, CA;试剂盒编号449430),可利用白令池度计分析仪(Behring NephelometerAnalyzer)进行(Fink 等,J.Clin.Chem.Clin.Biochem., 27:261-276 (1989))。
[0093]可检测部分可用于本文所述试验(直接或间接检测)。可利用各种可检测部分,标记物的选择取决于所需灵敏度、与抗体偶连的便利性、稳定性要求和可用的仪器以及处置规定。合适的可检测部分包括但不限于:放射性核素、荧光染料(例如,荧光素、异硫氰酸荧光素(FITC)、0regon Green?、罗丹明、德克萨斯红、异硫氰酸四罗丹明(TRITC)、Cy3、Cy5等)、荧光素标记物(例如,绿色荧光蛋白(GFP)、藻红蛋白等)、由肿瘤相关蛋白酶活化的自猝灭荧光化合物、酶(例如,萤光素酶、辣根过氧化物酶、碱性磷酸酶等)、纳米颗粒、生物素、洋地黄毒苷、金属等。
[0094]利用核酸的特异性化学发光抗体的化学发光试验适合于灵敏地非放射性检测蛋白质水平。用荧光染料标记物的抗体也合适。荧光染料的例子包括但不限于:DAP1、荧光素、Hoechst33258、R-藻青蛋白、B-藻红蛋白、R-藻红蛋白、罗丹明、德克萨斯红和丽丝胺(Iissamine)。间接标记物包括本领域熟知的各种酶,例如辣根过氧化物酶(HRP)、碱性磷酸酶(ΑΡ)、β-半乳糖苷酶、脲酶等。辣根过氧化物酶检测系统可利用,例如显色底物四甲基联苯胺(TMB),其在有过氧化氢存在下产生可在450nm检测的可溶产物。碱性磷酸酶检测系统可利用,例如显色底物对-硝基苯基磷酸酯,其产生不难在405nm检测的可溶产物。类似地,β -半乳糖苷酶检测系统可利用显色底物邻-硝基苯基-β -D-吡喃半乳糖苷(ONPG),其产生可在410nm检测的可溶产物。脲酶检测系统可利用例如脲-溴甲酚紫等底物(西格玛免疫化学公司(Sigma Immunochemicals);圣路易斯,密苏里州)。
[0095]例如,可利用分光光度计检测显色底物的颜色;利用辐射计数器检测辐射,例如检测125I的Y计数器;或在有某种波长的光存在下利用荧光计检测荧光,来分析直接或间接标记物的信号。对于检测酶连抗体,可按照生产商的使用说明,利用分光光度计,例如加利福尼亚州门洛帕克市分子装置公司(Molecular Devices ;Menlo Park, CA)的EMAX微板读数计作定量分析。如果需要,本发明的试验可以自动进行或由机器人实施,可同时检测多份样品的信号。
[0096]可将抗体固定在各种固体支持物,例如磁性或色谱基质颗粒,试验平板的表面(微量滴定板孔)、多片固体基材或膜上(例如,塑料、尼龙和纸),等等。可通过在固体支持物上的阵列中包被抗体或多种抗体来制备测定条带。然后可将该带浸入测试样品并经洗涤和检测步骤快速处理从而产生可检测信号,例如色斑。
[0097]有用的物理形式包括具有多个离散、可寻址位置的表面,从而能检测多个不同的标记物。这种形式包括微阵列和某些毛细管装置。参见,例如Ng等,J.Cell Mol.Med.,6:329-340(2002);美国专利号6,019,944。在这些实施方式中,各离散表面位置可包含抗体以固定一种或多种标记物以便在各位置检测。或者,表面可包含固定在表面的离散位置处的一个或多个离散颗 粒(例如,微粒或纳米颗粒),这些微粒包含抗体以固定一种或多种标记物进行检测。
[0098]可采用各种物理形式进行分析。例如,可利用微量滴定板或自动设备以促进大量测试样品的处理。或者,可开发单样品形式,从而有助于以及时方式诊断或预后。
[0099]或者,可将本发明的抗体或核酸探针应用于固定在显微镜载玻片上的患者活检切片。可采用本领域已知的各种光学或荧光显微方法目测观察得到的抗体染色或原位杂交模式。
[0100]在另一形式中,本发明的各种标记物还提供了用于体内成像的试剂,例如检测本发明生物标记的核酸或所编码蛋白质的标记试剂的成像。出于体内成像目的,可用合适的标记物,例如荧光标记物标记检测癌症生物标记所编码蛋白质存在与否的试剂,例如抗体。
[0101]报道
[0102]在另一方面,本发明的特征在于表明患癌症对象预后的报道。该报道可以是,例如电子形式或纸件形式。该报道可包括基本患者信息,包括对象标识符(例如,对象的姓名、社保号、医疗保险号或随机产生的号码)、对象的物理特征(例如,年龄、体重或性别)、委托医师(requesting physician)的姓名、进行预后的日期和收集样品的日期。报道的预后可以是关于一定时期存活的可能性、一定时期内对某些治疗(例如,化疗或手术治疗)起反应的可能性、和/或癌症复发的可能性。报道预后的形式可以是一定时期存活的百分比几率、对治疗起良好反应(良好反应可定义为,例如肿瘤缩小或肿瘤生长减缓)、或在限定时期复发(例如,5年存活几率为20%)的百分比几率。或者,报道预后的形式可以是计算的评分。例如,评分较高或较低可表明有利的预后。在另一实施方式中,报道的预后可以是存活、对治疗的反应或一定时期内复发的可能性的总体描述(例如,非常可能、可能或不可能存活5年)。在另 一实施方式中,报道的预后可以是图表的形式。除了基因表达水平,报道的预后还考虑了对象的其它特征(例如,年龄、癌症的阶段、性别、以前的治疗、适合性、心血管健康状况和精神健康状况)。
[0103]除了预后,该报道还可任选包括涉及以下至少两种基因的表达水平的原始数据:Rnd3> wnt3a> erbb3、lck、sh3bgr、fut3> illl、cdc6、cdk2apl、bagl、emx2、six3、和 brcal。
[0104]组合物、试剂盒和集成系统
[0105]本发明提供利用本发明多肽的特异性抗体或对本发明多核苷酸具有特异性的核酸来实施本文所述试验的组合物、试剂盒和集成系统。
[0106]实施本发明诊断试验的试剂盒通常装有探针和检测探针是否存在的标记物,所述探针包含特异性结合本发明多肽或多核苷酸的抗体或核酸序列。所述试剂盒还可装有几种抗体或编码本发明多肽的多核苷酸序列,例如识别本发明生物标记所编码蛋白质的抗体的混合物。
实施例
[0107]提供以下实施例是为了说明,而不是限制本发明。
[0108]实施例1.CTNNBl、WNT3A、TP53、KRAS、ERBB3、MUCl、ERBB2 和 DUSP6
[0109]本发明分析了 105位手术切除肺腺瘤的患者的数据,所述患者具有至少3年随访并可获得高质量组织。对65种基因和持家基因(18S和P0L2RA,也参见表1)进行实时PCR。按照可商品化购得的合并正常肺RNA和18S作为持家基因标准化PCR输出(以周期阈值,CT计)。得到的数值(如表2所示)是与正常肺RNA相比的表达比例。在表2中,基因以行排列并采用缩写。各基因前的数字(例如,7-FZD)是我们用于标识基因的数字,没有其它意义。然后对这些数值取对数(表2中第二组数值)。
[0110]如下所示进行分析。将样品(患者)随机分成两组:训练组(n=70)和验证组(n=35)。对训练组中的各基因进行Cox建模,利用存活率的自由P值阈值为0.2来选择基因。然后我们将所有这些基因一起在训练组上作后向选择(backwards selection),即,根据P值标准为0.2逐一投下(dropping)这些基因,在投下该基因在一个或多个其余基因的系数中产生有意义的变化时终止。最终的模型含有以下8种基因:ctnnbl、wnt3a、tp53、kras、erbb3、mucl、erbb2和dusp6。然后将各样品表达值输入该模型以获得各样品的评分。我们选择将高评分的割点(cutpoint)设置为评分的顶极三分位组(top tertile)。产生所有样品以及只有I期患者的卡-迈曲线。在验证组中重复该操作。为这些其它变量作调整后运行cox模型,包括肿瘤尺寸和肿瘤阶段以及预示较高死亡风险的高评分。
[0111]实施例2.WNT3A, RND3、LCK 和 ERBB3
[0112]预后工具应能理想地提供精确的风险分类,在临床上每日实施是可行的,并且应是节约成本的。这种试验对于外科手术切除了 I期NSCLC的患者特别有利。目前对于I期NSCLC的护理标准是叶切除术和纵隔淋巴结切除,无需辅助化疗。更好地鉴定良好预后的患者亚组可能较少地采用外科手术而具有相同的存活可能性。相反,可选择预后差的I期亚组纳入检验新方法和新疗剂的临床试验。考虑到目前I期疾病化疗的局限性,对于化疗益处有预后和预示作用的生物测定非常有利。最后,I期NSCLC的重要性在将来可能增加。虽然约20%的患者目前诊断为I期NSCLC,该比例可能因通过计算机断层扫描筛选肺癌的最新进展而升闻。
[0113]我们发现Wnt3a、rnd3、lck和erbb3的表达可预后肺癌患者的存活。所研究患者的临床和组织学特征见表3。我们首先分析了整个数据组,随后将分析局限于I期患者。根据年龄、肿瘤尺寸和阶段强迫调整后,交叉验证支持含有按以下顺序选择的4种基因的模型:Wnt3a、rnd3、Ick和erbb3。利用这4种`基因,采用该模型的风险评分(LI收缩系数)来分析总体存活率(OS)。根据年龄、疾病阶段和肿瘤尺寸作调整后,作为连续变量的风险评分的危害比(HR)是 6.7 (95%C1:1.6-28.9,ρ=0.005),如表 4 所示。
[0114]基于4基因模型的二分风险评分的整个研究对象的存活曲线见图1la和lib。70位I期患者中二分风险评分的相应存活曲线见图12a和12b。所有患者的5-年OS是56%,I期患者为65%。在所有患者中,低风险患者中5-年OS为62%,高风险患者中为41% (p=0.0054)。低-风险患者中5-年DFS为60%,高-风险患者中为28%(p=0.0053)。在I期患者中,低风险患者中5-年OS为87%,高风险患者中为38%(p=0.0002),低风险患者中DFS为77%,高风险患者中为35% (p=0.0045)。
[0115]将Chen及其同事的5-基因模型应用于我们的研究组,根据年龄、阶段和肿瘤尺寸调节的 HR为 2.4 (95%C1:1.3-4.3,ρ=0.0047) 13。(Chen 等,N Engl J Med356:11-20 (2007)。在所有患者中,低风险中的5-年OS为65%,高风险患者中的为43%(p=0.045)。在I期患者中,低风险患者中5-年OS为80%,高风险中为47% (p=0.022),图13。
[0116]我们通过定量PCR,根据4种基因的基因表达鉴定了风险评分,可预后完全手术切除肺腺癌的患者的长期存活。这种根据基因表达的评分对存活(调节的HR6.7)和疾病复发的预测优于根据临床阶段和肿瘤尺寸的。我们的模型最好地预示了I期疾病患者中的死亡风险。在我们的交叉验证组中,I期患者中的低-和高-风险评分与5-年总体存活率为87%和38%相关。
[0117]对于模型选择和模型验证,我们采用交叉验证。交叉验证采用反复数据分离而不是将数据分成测试和验证组,从而防止模型过度拟合(over-fitting)并产生模型系数的精确估计值。交叉验证能产生经验证的模型系数,但利用数据比简单的数据分离更有效。
[0118]该预后模型对于诊断和提供肺癌预后有重要的临床意义,例如作为在I期肺腺癌的风险分类患者中进行临床分阶段的补充工具。目前对于I期NSCLC的护理标准是单用外科手术切除,通常是叶切除术。相反,复发风险低的切除后患者最好只进行观察,甚至可以是彻底肺切除不足的候选对象。
[0119]在我们的患者群中,与Chen及其同事(同上)的相比,我们模型的预后值更好。该发现有几种可能的解释。首先,我们模型的候选基因是基于以前公布的基因组-广泛表达微阵列研究,而Chen模型中的基因是选自更有限的定制表达阵列平台。此外,在确定我们的基因模型之前通过RT-PCR评估了较大的一组基因。另外,我们的患者随访时间较长,随访时期至少3年,中值随访为61个月。该因素使得我们能更精确地检测风险组之间存活率的差异。
[0120]方法
[0121]患者
[0122]在1997年I月-2004年9月间,经历完全手术切除肺腺癌并保存了新鲜冷冻组织以供基因组分析的120位患者纳入研究。适格的患者经历医疗意图的手术切除并对纵隔淋巴结进行适当分阶段。接受手术前化疗的患者排除出研究,从而不会混淆纯粹预后工具的开发。13位患者因保存组织不足、RNA质量不够或持家基因表达弱而排除。初级终末点是总存活率。无疾病存活(DFS)定义为从外科手术到疾病复发的X射线照片证据的时间,或者在没有疾病复发时到最后一次记录在案的医师随访的时间。预期患者同意组织样本收集,该项研究由USCF研究检查委员会批准(UCSF institutional review board)(CHR#H8714-28880-0I)。
[0123]基因选择
[0124]在以前公布的早期肺癌预后的微阵列和PCR研究中鉴定的217种基因中(参见,例如 Beer 等,Nat Med8:816 (2002) ; Potti 等,N Engl J Med355:570 (2006) ; Wigle 等,Cancer Res62:3005(2002);Garber 等,Proc Natl Acad Sci USA98:13784(2001);Miura等,Cancer Res62:3244 (2002) ; Schneider 等,Br J Cancer83:473 (2000)),通过愿意的专家或文献查询鉴定了 76种癌症-相关基因。15种基因由于在前导研究中无功能性引物或通过RT-PCR发现在肿瘤组织中表达非常弱而排除。其余61种基因见表5。
[0125]样品制备和分析
[0126]操作时所有组织冷冻在液氮中。将组织大块切割成Icm3切片,并在液氮中研磨。采用加利福尼亚州卡尔斯巴德市英杰公司(Invitrogen, Carlsbad, CA)的TriZol提取方案提取RNA。利用加利福尼亚州福斯特城的应用生物系统公司的Prism7900HT仪器在384-孔平板中对cDNA进行Taqman RT-PCR。各基因的表达进行一式三份的检验。将样品与加利福尼亚州芒廷维尤市克隆技术公司(Clontech, Mountain View, CA)的市售购得合并正常肺RNA作比较,根据应用生物系统公司的18S核糖体rRNA标准化。
[0127]从新鲜肺切片获得约Icm3的肿瘤样本块,立即在液氮中速冻。-80°C保存冷冻的组织。采用英杰公司的TriZol提取方案从131份各肿瘤样品中提取总RNA。利用安捷仑公司(Agilent)的安捷仑2100BioAnalyzer?验证RNA样品的质量,通过纳滴公司(Nanodrop)的Nanodrop ND-1000?测定各样品的RNA-浓度。用3 μ g总RNA作为模板,利用拜尔莱得公司(BioRad)的iScript cDNA合成试剂盒合成第一链cDNA,利用应用生物系统公司的装有自动化配件的ABI PRISM7900HT序列检测系统,通过实时定量PCR检测86种不同基因转录物各自的相应表达水平。一式三份进行的各20 μ L反应包括应用生物系统公司的TaqMan通用PCR主混合物、应用生物系统公司的适当Taqman基因表达测定和每次反应的对应于120ng 总 RNA 的 1.8 μ LcDNA 模板。
[0128]利用应用生物系统公司的序列检测系统(SDS) 2.3软件获得Ct值,将相对基因表达值计算成△ ACt,从而产生根据相对于校准样品(所有样品的参比)的内源性参比基因表达水平作标准化的靶基因相对表达水平。所用的校准样品是有克隆技术公司从正常人肺总RNA合成的cDNA(目录号636524)。为选择内源性参比基因,比较了早期公布的常规使用的大量参比基因在肺癌(肿瘤和正常组织)中的表达水平。选择三种基因-编码18S核糖体RNA亚单位、P0L2RA RNA聚合酶和TBP TATA盒蛋白,比较了肿瘤和正常样品的几种cDNA样本稀释液中它们的表达水平。18S rRNA在肺样品(肿瘤和正常)中显示表达最稳定,因此,按照18S rRNA标准化原始基因表达值。
[0129]统计学分析
[0130]我们数据结构的突出特征是:(i)正确检查的存活终点(死亡)与适度的事件数量(47-构建子集以排除遗漏后);(ii)通过RT-QPCR所得(log)基因表达值(它处所述的Λ-ACt)构成的多种(61)预测因子;和(iii)选择临床和人口统计学共变量(covariate)。鉴于这些特征和量纲,我们利用的基础数据分析工具是LI罚分的Cox相对危险回归法(Llpenalized Cox proportional hazards regression)。该方法将已证明高效的LI罚分固有的同时系数收缩(simultaneous coefficient shrinkage)和预测因子选择拓展至存活数据设置。由微阵列基因表达应用主要推动的早期拓展在计算上受限制或者依赖于近似计算。我们采用交叉验证来确定模型大小,即,所选基因的数量。然后根据模型系数产生各对象的风险评分。将得到的预测风险评分二分(在中值处),显示相应的卡-迈存活曲线并通过时序统计学比较。利用统计学软件包R(版本2.3.1, 2006)进行所有分析。
[0131]应该知道本文所述的实施例和实施方式中只是出于说明的目的,这些实施例和实施方式对本领域技术人员提示了各种改进或改变,这些改进或改变应属于本申请的构思和权限以及随附权利要求书的范围内。本文引用的所有出版物、专利和专利申请出于所有目的通过引用全文纳入本文。
[0132]表1
[0133]Taqman试验列表
[0134]
数量基因代号基因名称 NCBI参比基因试验ID
[0135]
【权利要求】
1.一种为对象的肺癌提供预后的方法,所述方法包括以下步骤: (a)将该对象的生物学样品与各自特异性结合一组生物标记物中一种成员的试剂接触,所述生物标记物包括 ctnnbl、wnt3a、tp53、kras、erbb3、mucl、erbb2 和 dusp6 ;和 (b)测定所述标记物在该样品中是否差别表达;从而提供肺癌的预后。
2.如权利要求1所述的方法,其特征在于,所述试剂是核酸。
3.如权利要求1所述的方法,其特征在于,所述试剂是寡核苷酸。
4.如权利要求1所述的方法,其特征在于,所述试剂是PCR引物组。
5.如权利要求1所述的方法,其特征在于,所述试剂是抗体。
6.如权利要求1所述的方法,其特征在于,所述肺癌是肺腺癌。
7.如权利要求6所述的方法,其特征在于,所述肺腺癌癌是I期。
8.如权利要求6所述的方法,其特征在于,所述肺腺癌是II期。
9.如权利要求6所述的方法,其特征在于,所述肺腺癌是III期。
10.如权利要求6所述的方法,其特征在于,所述肺腺癌是IV期。
11.如权利要求1所述的方法,其特征在于,所述样品来自外科手术切除的肿瘤。
12.如权利要求1所述的方法,其特征在于,所述样品来自肺组织或肺肿瘤活检。
13.如权利要求1所述的方法,其特征在于,所述预后提供长期死亡率的高或低风险评估。
14.一种装有试剂的试剂盒,所述试剂各自特异性结合一组生物标记物中一种成员,所述生物标记物包括 ctnnbl、wnt3a、tp53、kras、erbb3、mucl、erbb2 和 dusp。
15.如权利要求14所述的方法,其特征在于,所述试剂是PCR引物组。
16.一种提供患肺癌对象的预后的方法,包括定量测定生物学样品中至少两种选自下组的生物标记的表达水平:rnd3、wnt3a、erbb3、lck、sh3bgr、fut3、illl、cdc6、cdk2apl、bagl、emx2、six3和brcal,其中,所述生物学样品源自所述对象,而所述表达水平是所述预后的标志。
17.如权利要求16所述的方法,其特征在于,所述表达水平是mRNA表达水平。
18.如权利要求17所述的方法,其特征在于,所述定量测定包括定量rtPCR。
19.如权利要求16所述的方法,其特征在于,所述表达水平是蛋白质表达水平。
20.如权利要求19所述的方法,其特征在于,采用抗体结合试验定量测定所述表达水平。
21.如权利要求20所述的方法,其特征在于,所述抗体结合试验是ELISA。
22.如权利要求16所述的方法,其特征在于,所述方法包括定量测定生物学样品中至少三种生物标记的表达水平。
23.如权利要求16所述的方法,其特 征在于,所述方法包括定量测定生物学样品中至少四种生物标记的表达水平。
24.如权利要求16-23中任一项所述的方法,其特征在于,包括至少四种生物标记,其中所述至少四种生物标记包括erbb3、lck、wnt3a和rdn3。
25.如权利要求16-23中任一项所述的方法,其特征在于,包括至少四种生物标记,其中所述至少四种生物标记包括erbb3、lck、wnt3a和rdn3。
26.如权利要求16-23中任一项所述的方法,其特征在于,所述生物学样品是血液样品O
27.如权利要求16-23中任一项所述的方法,其特征在于,所述生物学样品是肿瘤活检。
28.如权利要求16-23中任一项所述的方法,其特征在于,所述生物学样品是肺活检。
29.如权利要求16所述的方法,其特征在于,所述表达水平是蛋白质表达水平与mRNA表达水平的组合。
30.一种提供患肺癌对象的预后的方法,所述方法包括检测生物学样品中至少两种选自下组的生物标记的甲基化水平:rnd3、wnt3a、erbb3、lck、sh3bgr、fut3、illl、cdc6、cdk2apl、bagl、emx2、six3和brcal ;其中,所述生物学样品源自所述对象,而所述甲基化水平是所述预后的标志。
31.如权利要求30所述的方法,其特征在于,所述方法包括定量测定生物学样品中至少三种生物标记的表达水平。
32.如权利要求30所述的方法,其特征在于,所述方法包括定量测定生物学样品中至少四种生物标记的表达水平。
33.如权利要求32所述的方法,其特征在于,所述至少四种生物标记包括erbb3、lck、wnt3a 和 rdn3。
34.一种包括患肺癌对象的预后的报道,所述预后通过定量测定该对象的生物学样品中至少两种选自下组的生物标记的表达水平来测定:rnd3、wnt3a、erbb3、lck、sh3bgr>fut3> illl、cdc6、cdk2apl、bagl、emx2、six3和brcal ;其中,所述表达水平是所述预后的
O
35.如权利要求34所述的报道,其特征在于,包括定量测定生物学样品中至少三种生物标记的表达水平。
36.如权利要求34所述的报道,其特征在于,包括定量测定生物学样品中至少四种生物标记的表达水平。
37.如权利要求36所述的报道,其特征在于,所述至少四种基因包括erbb3、lck、wnt3a和 rdn3。
38.一种包括生物学样品的基因表达概况的报道,所述生物学样品从患肺腺癌的对象分离,所述基因表达概况包括至少两种选自下组的生物标记的表达水平:rnd3、wnt3a、erbb3、lck、sh3bgr、fut3> illl、cdc6、cdk2apl、bagl、emx2、six3 和 brcal。
39.如权利要求38所述的报道,其特征在于,包括定量测定生物学样品中至少三种生物标记的表达水平。
40.如权利要求38所述 的报道,其特征在于,包括定量测定生物学样品中至少四种生物标记的表达水平。
41.如权利要求40所述的报道,其特征在于,所述至少四种基因包括erbb3、lck、wnt3a和 rdn3。
【文档编号】C12Q1/68GK103834729SQ201410053021
【公开日】2014年6月4日 申请日期:2008年5月30日 优先权日:2007年6月1日
【发明者】D·M·雅布隆斯, D·J·拉兹 申请人:加利福尼亚大学董事会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1