肝细胞癌的基因标签的制作方法

文档序号:510009阅读:204来源:国知局
肝细胞癌的基因标签的制作方法
【专利摘要】本发明提供了基于肝细胞癌患者肿瘤中15种目标免疫基因的组合,或所述免疫基因组合的子集的相对表达水平的测量结果,预测此类患者预后的方法。肿瘤材料可以来自手术切除术或活组织检查。所述的相对基因表达信息可以在算法中联合起来。所述标签可以单独使用或与其它信息例如阶段信息组合使用。
【专利说明】肝细胞癌的基因标签发明领域
[0001]本发明涉及一种利用肿瘤样品中多种免疫基因的表达水平来分析肝细胞癌(HCC)患者的方法,具体来说,涉及预测HCC患者的预后。本发明还涉及鉴定有效治疗HCC的药剂的方法,并且还涉及对HCC进行分级的方法。
[0002]正文中所引用的所有文件(“本文引用的文件”)以及本文引用的文件中所引用或参考的文件都通过引用整体并入,用于所有目的。没有承认本文中所应用的多篇文件中的任何一篇为本发明的现有技术。
[0003]背景
[0004]肝细胞癌为一种扩散性的恶性肿瘤,每年全球范围内有超过600,000人死于肝细胞癌。西方国家HCC的发生率在逐渐上升,这在一定程度上是由于丙型肝炎病毒(HCV)感染的增加。HCC为一种包括不同分子亚群和临床亚群的异质性疾病(heterogeneous disease)[5-6]。这主要是由于不同的HCC病因,包括肝炎、酒精和非酒精引起的肝硬化。地域和种族差异也进一步增加了 HCC的异质性。
[0005] HCC的治疗选择很少,尤其对于晚期患者,治疗非常有限。切除术仍然为很多患者的治疗选择,但是其往往伴随着高复发率和较差的5年存活率。一种最近被批准用于晚期HCC的酪氨酸激酶抑制剂——索拉非尼(Sorafenib),也仅仅能有限提升存活率[3]。更加积极的治疗方法,包括对适合的患者进行肝移植,提升了存活率。然而,鉴定可能从此类方法获益的HCC患者仍然面临着诸多挑战。
[0006]随着公众健康意识的增强,HCC在较早的阶段就能得到医护人员的协助,在该阶段,使用传统组织病理学测量手段,如肿瘤多结节性(multinodularity)和血管浸润情况往往很难确定预后。在过去十年间,数个实验室利用基因表达谱来确定分子特征并鉴定HCC的预后信号[8-12]。然而,这些努力取得的一致性结果很少,这也说明了这种癌症的复杂性和异质性。每一项研究都致力于不同的分子通路,而到目前为止很少有注意力关注肿瘤免疫微环境。
[0007]发明概述
[0008]本发明描述了来源于新加坡HCC患者(n=61,多数处于I期)的切除的HCC肿瘤的用于预测HCC患者的预后或存活的一种免疫基因标签。这种免疫基因标签已被证明能预测来自亚洲另一区域——香港(n=56),以及来自欧洲——瑞士苏瑞士(n=55)的HCC患者的存活,其中香港和苏瑞士群体包括了更为晚期的HCC患者——多数II或III期。
[0009]在至少一些实施方案中,基因标签包括总共15种目的免疫基因中的3至15种(优选5至14种)免疫基因的组合,这15种基因的相对表达优选在分类器(算法)中分析。总的说来,这些基因mRNA表达的增加与更好的预后相关。这15种免疫基因中任意5至14种免疫基因(分类器)组合的预测能力比任何单一基因自身的预测能力更强。
[0010]该免疫标签可以独自用来分析HCC患者,或者与其它信息一起使用,如分期信息。本申请描述了免疫标签的多种用途,尤其在预测HCC患者预后(如〈>5年存活)中的用途。
[0011]本发明的优选实施方案提供了预测肝细胞癌患者预后(〈>5年存活)的方法,该方法基于这类患者肿瘤内15种目的免疫基因中的3至15种免疫基因(优选5至14种免疫基因)的组合的相对表达水平的测量结果。肿瘤材料可以来源于手术切除术或者活组织检查。相对基因表达信息可以任选地在算法中组合。
[0012]术语表
[0013]这一部分意图为以下陈述的单词和词组(及其适当的语法变型)的解释提供指导。对本文所用的某些单词与词组(及其适当的语法变型)解释的其它指导还可参见本说明书的其它部分。
[0014]除非上下文中明确指出并非如此,本文中所使用的单数形式“一种(a)”、“一个(an)”和“所述(the)”包括复数内容。例如:术语“药剂(an agent) ”包括多种药剂,包括它们的混合;且提及“所述核酸序列”时通常包括提及一条或多条核酸序列,以及本领域技术人员已知的其等同项等。
[0015]本文中所使用的术语“包含(comparising) ”意为“包含(including)”。因此,例如,“包含三个基因”的基因标签可以仅由3个基因组成,或者可以包括一个或多个的其它标志物基因。
[0016]本文中所使用的术语“分级”是指根据特定标准将患者描述为或分为更均一的亚群。在一个实施方案中,可以对患者进行分级,以用于不同的治疗方案(例如:更加积极或消极的治疗;手术干预;肝移植;免疫疗法;使用给定药物或药物组合的化学疗法;和/或放射疗法)。还可以将患者分成具有不良或良好预后的患者,或者具有短预期存活或长预期存活的患者。
[0017]本文中所使用的术语“分类”是指根据患者的肿瘤样品概况而将其判定为或分配到特定组群的过程。在至少一些实施方案中,术语“分类”是指将患者划分为具有特定的预后,如不良或良好的预后,或者短或长的预`期存活。
[0018]本文中所使用的术语“预后”是指为HCC的可能过程或结果提供预告或预测。该术语包括提及预测HCC进程(如复发或转移扩散)、存活、耐药性、部分或完全缓解,或者是好或差的结果(分别为良好或不良预后)。该术语也包括预测上述任何一种情况的时限(如多于,少于或等于给定年数,如0.5、1、2、3、4、5、6、7、8、9、10年或更多年)。因此,例如,提供预后可以包括预测患者的存活为多于、少于或等于给定年数。
[0019]如果在本文中结合给定时期描述存活、复发、转移扩散或其它事件,则存活可以任选地从初次诊断、初次治疗、肿瘤切除时,或任何其它方便或合适的时间点开始进行测量。优选地,存活期从肿瘤切除时开始进行测量。
[0020]如果在本文中结合给定时期描述存活、复发、转移扩散或其它事件(如多于、少于、等于给定时期或在给定时期以内等),则给定时期优选是在以下范围之一内的时间点:O到18年、O到17年、O到16年、O到15年、O到14年、O到13年、O到12年、O到11年、O至Ij 10年、O到9年、O到8年、O到7年、O到6年、O到5年、O到4年、O到3年、O到2年、O到I年、I到18年、I到16年、I到14年、I到12年、I到10年、I到9年、I到8年、I到7年、I到6年、I到5年、I到4年、I到3年、I到2年、2到18年、2到16年、2到14年、2到12年、2到10年、2到9年、2到8年、2到7年、2到6年、2到5年、2到4年、2到3年、3至Ij18年、3到17年、3到16年、3到15年、3到14年、3到13年、3到12年、3到11年、3到10年、3到9年、3到8年、3到7年、3到6年、3到5年、3到4年、4到10年、4到9年、4到8年、4到7年、4到6年或者4到5年。前面所述的范围为总括,所以应当理解,例如,范围为4-5年内的时间点应当被理解为包括该范围的两个端点,使得时间点可以,例如为4年或5年(或者落入这些端点之间的任一时间点,如4.5年)。因此,在至少一些实施方案中,提供预后可以包括预测患者的存活为(i)多于、少于或等于4年;或(ii)多于、少于或等于5年。生存期的其它优选的界限包括3年和6年。因此,在本发明的一些实施方案中,方法包括预测患者存活为多于、少于或等于3或6年。
[0021]本文中所使用的术语“不良预后”是指其中为HCC预测到不理想的结果(“不良结果”)。不良结果的例子包括治疗后HCC的再现(任选地,在给定时期内,如1、2、3、4、5、6、
7、8、9、10或更多年内);转移复发(任选地,在给定时期内,如1、2、3、4、5、6、7、8、9、10或更多年内);或者存活少于给定时期,如少于0.5、1、2、3、4、5、6、7、8、9或10年存活。
[0022]在本发明中的一些实施方案中,本文中所使用的术语“不良预后”指的是:(I)预期的存活少于这样的时间点,该时间点落入3-6年或等于3-6年(例如,存活少于3、4、5或6年),其中存活优选从肿瘤切除的时间开始测量);(2)当基因表达谱与不良预后模板的相似度高于良好预后模板时;⑶当基因表达谱与不良预后模板相似,和/或与良好预后模板相异时;或(4)预期的存活低于HCC患者群体存活年数的平均数、众数或中值。
[0023]“患者群体”是指 HCC 患者群,例如,至少 5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、85或95名患者的群体。特定群体的患者在地域上可受限于,例如在初次诊断或切除时的特定城市或国家(参照新加坡训练群体)。
[0024]当使用SVM和/或KNN算法时,术语“不良预后”优选指HCC患者的存活低于5年。优选地,使用NTP算法时,当患者的基因表达谱相比良好预后模板,与不良预后模板更为相似时(两者都通过NTP算法计算),该患者被分类为具有“不良预后”。需要注意的是,NTP不具有存活界线。这在算法3中会有更为详尽的解释。
[0025]本文中所使用的术语“良好预后”是指其中为HCC预测到期望的结果(“良好结果”)。良好结果的实例包括部分或完全缓解;任选地在给定时期内,如0.5、1、2、3、4、5、
6、7、8、9、10、11、12、13、14、15、16、17、18年或更多年内,转移的不再复发;或者存活给定时期,如多于或等于 0.5、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18 年或更多年的存活。
[0026]在本发明的至少一些实施方案中,术语“良好预后”是指:(i)预期的存活多于或等于这样的时间点,该时间点落入或等于3、4、5或6年,优选地,存活从肿瘤切除的时间开始测量;(?)当基因表达谱与良好预后模板相似度高于与不良预后模板的相似度时;
(iii)当基因表达谱与良好预后模板相似,且/或与不良预后模板相异时;或(iv)预期的存活高于HCC患者群体存活年数的平均数、众数或中值。
[0027]当使用SVM和/或KNN算法时,术语“良好预后”优选指HCC患者的存活多于或等于5年。优选地,使用NTP算法时,当患者的基因表达谱相比不良预后模板,与良好预后模板更为相似时(两者都通过NTP算法计算),该患者被分类为具有“良好预后”。需要注意的是,NTP不具有存活界线。这在算法3中会有更为详尽的解释。
[0028]术语“治疗”、“治疗干预”和“疗法”在本文中可以交换使用(除非上下文指出并非如此),并且这些术语是指治疗性处理和预防或防止性措施,其中目的是尝试阻止或减缓(减轻)目标病变情况或病症。在肿瘤治疗中,治疗可以直接减少肿瘤细胞的病变,或使得肿瘤细胞对其它治疗剂(如放射疗法和/或化学疗法)的治疗更为敏感。肿瘤治疗的目标或结果可以包括以下一种或几种:⑴抑制(如减少、减缓或完全阻止)肿瘤的生长;⑵减少或消除症状或肿瘤细胞;(3)减小肿瘤大小;(4)抑制肿瘤细胞到邻近的外周器官和/或组织的侵润;(5)抑制转移;(6)增强抗肿瘤免疫反应,其可以但并非必然导致肿瘤退化或排斥;(7)增加存活时间;以及(8)降低治疗后给定时间点时的死亡率。治疗可能需要使用单一药剂或者使用(多于两种)药剂的组合进行治疗。治疗任选地可以包括治疗的过程。 [0029]本文中所使用的“药剂(agent) ”广泛地指,用于治疗,如放射治疗或外科手术的药物/混合物或其它方式。治疗的例子包括外科手术干预、肝移植、免疫疗法、利用给定药物或药物组合的化学疗法、放射疗法、新辅助治疗、饮食疗法、维生素疗法、激素疗法、基因疗法、细胞疗法、抗体疗法等。术语“治疗”还包括如药物筛选或临床试验过程中的试验处理。
[0030]词组“预测治疗干预的功效”包括预测患者对治疗的响应是有利还是不利,和/或这些响应的程度。
[0031]词组“评估治疗干预的功效”包括评估患者对治疗的响应是有利还是不利,和/或这些响应的程度。
[0032]通过本公开,本发明的许多方面都可以以范围的形式呈现。应该了解,采用范围形式的描述仅仅是为了方便和简洁,而不应当被解释为对发明范围的刚性限制。因此,范围描述应该被认为已具体公开了所有可能的子范围以及该范围中的个体数值。例如,诸如I到6的范围描述应该被认为已具体公开了子范围如I到3、1到4、1到5、2到4、2到6、3到6等,以及该范围中的个体数字,如1、2、3、4、5和6。无论范围的宽度如何,这都适用。
[0033]发明的详细描述
[0034]本发明涉及分析HCC患者的方法。更具体地,本发明提供了包括如下的方法:(a)测定患者来源的肿瘤样品中3种或更多种基因的表达水平,其中所述3种或更多种基因选自表1、2八、28、3、4、14、15和/或16(见下列表格)中所列的基因;和(b)利用基因表达水平信息对患者进行分析,例如用来推断患者的预后信息。“分析患者”包括对患者进行分类或分级、提供患者预后(例如不良或良好;长或短的存活)、监测疾病进程、预测治本文的表
1、2A、2B、3、4、14、15和16中列出的基因称为“本发明的免疫基因”。任选地,可以利用以下的一种或多种来分析基因表达水平信息:至少一种算法、统计学分析或计算机。表1、2A、2B、3、4、14、15和16中的15种免疫基因组合的预测能力比任意一种基因自身的预测能力要强。
[0035]依据预后情况,可以对患者进行分级以采用不同的治疗策略(例如:更加积极或消极的治疗、手术介入、肝移植、免疫疗法、使用给定药物或药物组合的化学疗法、放射疗法、新辅助治疗、基因疗法、细胞疗法、抗体疗法等)。
[0036]术语“治疗”也包括,例如药物筛选或临床试验中的实验处理。为HCC患者提供预后的能力有助于疾病管理,例如有助于挑选预后状况较好的患者用于肝移植。有利的是,本发明的免疫基因预测HCC预后不受患者种族和疾病病因的影响。
[0037]本文中所使用的术语HCC包括所有形式的HCC——包括1、I1、III和IV期HCC。分期可以依照国际上使用的TNM分期系统执行。
[0038]任选地,HCC为:(a) I 期;(b) II 期;(c) I 期或 II 期;(d) II 期或 III 期;(e) I 期、
II期或III期;(f) II期、III期或IV期;(g) I期、II期、III期或IV期。优选地,HCC不为III期。优选地,HCC不为IV期。
[0039]本文中所使用的术语“患者”包括人类患者和其它哺乳类动物,还包括患有或患有过HCC的任何个体,或者希望使用本发明方法进行分析或治疗的任何个体。落入本发明范围内的合适的哺乳类动物包括但不限于:灵长类、家畜(例如绵羊、牛、马、猴、猪)、实验室试验动物(例如兔、小鼠、大鼠、豚鼠、仓鼠)、宠物(例如猫、狗)和圈养野生动物(例如狐狸、鹿、澳洲野狗)。优选地,患者为人类患者。如果分析非人类核酸或蛋白质/多肽,则可以分析表1、2A、2B、3、4、14、15或16中所列基因的同源基因的表达水平,而且提及本发明的免疫基因应当被解释为包括这些同源基因序列。在本发明中,患者可以为雄性或雌性。任选地,患者可以正在接受HCC治疗,例如实验处理。在该背景下,本方法提供了测量治疗功效的替代生物标志物。患者可患有1、I1、III或IV期HCC。任选地,患者可以为:(a) I或II期患者;(b) II或III期患者;或(c) III或IV期患者。
[0040]术语“患者来源的肿瘤样品”可以包括,例如,来源于手术切除术或活组织检查(例如来自患者活组织检查的细胞)的肿瘤材料。本文中所使用的术语“活组织检查”包括指从患者移除的组织。组织可以以任何合适的方法移除,例如穿刺活组织检查、吸引术、刮擦、利用手术切除法切除。合适的样品包含总的肿瘤材料,即肿瘤浸润白细胞(TIL)、基质和肿瘤细胞。任选地,样品可以为切除的肿瘤碎片。样品可以在一个或多个时间点获得。任选地,在通过本发明方法分析材料前,可以利用一种或多种收集后制备或储存技术对样品进行处理(例如:固定、储存、冷冻、裂解、匀浆、DNA或RNA抽提、cDNA转化、超滤、稀释(例如使用盐水、缓冲剂或生理上可接受的稀释剂等进行稀释)、浓缩、蒸发、离心、分离、过滤等)。任选地,本发明方法的步骤(a)和(b)之前可以有从患者获得患者来源的肿瘤样品的步骤。 [0041]在本发明的一实施方案中,表1的3种或更多种基因为表1中所列的至少3、4、5、
6、7、8、9、10、11、12、13、14种和/或所有的基因,和/或以上的任意组合。在本发明的优选方法中,从表1中挑选了 14或15种基因。
[0042]在本发明的一实施方案中,表2A的3种或更多种基因为表2A中所列的至少3、4、5、6种和/或所有的基因,和/或以上的任意组合。
[0043]在本发明的一实施方案中,表2B的3种或更多种基因为表2B中所列的至少3、4、
5、6种和/或所有的基因,和/或以上的任意组合。
[0044]在本发明的一实施方案中,表3的3种或更多种基因为表3中所列的至少3、4、5、
6、7、8、9、10种和/或所有的基因,和/或以上的任意组合。
[0045]在本发明的一实施方案中,表4的3种或更多种基因为表4中所列的至少3、4、5、
6、7、8、9、10、11、12、13种和/或所有的基因,和/或以上的任意组合。
[0046]在本发明的一实施方案中,表14的3种或更多种基因为表14中所列的至少3、4、
5、6、7种和/或所有的基因,和/或以上的任意组合。
[0047]在本发明的一实施方案中,表15的3种或更多种基因为表15中所列的至少3、4种和/或所有的基因,和/或以上的任意组合。
[0048]在本发明的一实施方案中,表16的3种或更多种基因为表16中所列的至少3、4种和/或所有的基因,和/或以上的任意的组合。
[0049]因此,应当理解,本发明可以包括测定如表1、2八、28、3、4、14、15和/或16(见下列表格)中所列的4种或更多种、5种或更多种、6种或更多种基因等的表达水平。
[0050]在本发明的至少一些实施方案中,测定选自表1、2A、2B、3、4、14、15和/或16所列基因中少于15、14、13、12、11、10、9、8、7、6、5或4种基因的表达水平。
[0051]优选地,测定表1、2A、2B、3、4、14、15和/或16所列的基因中3至15、3至14、3至
13、4至 15、4 至 14、4 至 13、5 至 15、5 至 14、5 至 13、6 至 15、6 至 14、6 至 13、7 至 15、7 至
14、7至 13、8 至 15、8 至 14、8 至 13、9 至 15、9 至 14、9 至 13、10 至 15、10 至 14、10 至 13、11至15、11至14、11至13、12至15、12至14或12至13种基因的表达水平。
[0052]优选地,3种或更多种基因包括(以及任选地由以下组成):
[0053](i) IL6 和 TNF ; [0054](i i) CCL2、CCL5 和 CCR2 ;
[0055](i i i) CCL5、CCL2 和 CXCLIO ;
[0056](iv) IFNG、TNF 和 TLR3 ;
[0057](V) CCL5、CCL2、CXCLIO 和 CCR2 ;
[0058](V i) CCL2、CCL5、CCR2 和 IL6 ;
[0059](vii) CCL2、CCL5、CCR2、IL6 和 NCR3 ;
[0060](V i i i) CCL5、CCL2、CXCLIO 和 TLR3 ;
[0061](i X) CCL5、CCL2、CXCLIO、CCR2 和 TLR3 ;
[0062](X) CCL5、CCL2、CXCLlO、IFNG、TNF 和 TLR3 ;
[0063](xi) CCL5、CCL2、CXCLlO、CCR2、IFNG、TNF 和 TLR3 ;
[0064](xii) CXCLlO、TLR3、TNF、IFNG 和 CCL5 ;
[0065](xiii) CCL5、CCR2、CD8A、FCGRlA、IL6、NCR3、TLR3 和 TLR ;
[0066](X i V) CCL2、CD8A、CXCLIO、IL6、LTA、NCR3、TBX21 和 TNF ;
[0067](XV)CCL2、CCL5、CCR2、CD8A、CXCLlO、FCGR1A、IL6、NCR3、TBX21、TLR3、TLR4、IFNG和 TNF ;
[0068](XVi) CCR2、CD8A、IL6、LTA 和 TLR3 ;
[0069](xvii) CD8A、CXCLIO、IL6、TLR3 和 TLR4 ;
[0070](xviii) CCL5、FCGR1A、IFNG、IL6、TLR3、TLR4 和 TNF ;
[0071](xix)CCL5、CCR2、CD8A、FCGR1A、IFNG、IL6 和 NCR3 ;
[0072](XX) CCL2、CCL5、CCR2、CD8A、CXCLlO、FCGR1A、IL6、NCR3、TBX21、TLR3 和 TLR4 ;
[0073](xx i)CCL2、CCR2、TLR3、TLR4、CCL5、IL6、NCR3、TBX21、CXCL10、IFNG、CD8A、FCGRlA、CEACAM8 和 TNF ;
[0074](xxii)表2 (表2A和/或表2B)、表3和表4共有的基因;
[0075](xxiii)表2 (表2A和/或表2B)、表3、表4、表14、表15和表16共有的基因;
[0076](xxiv)以上基因集的任意组合。
[0077]在本发明的步骤(b)中,来源于表1、2A、2B、3、4、14、15和/或16中所列的3种或更多种基因的基因表达水平信息可以单独使用来对患者进行分类、提供预后等,或与其它信息,例如基因型、表型或临床信息组合使用。任选地,来源于表1、2A、2B、3、4、14、15和/或16中所列的3种或更多种基因的基因表达水平可以与以下的一种或多种信息一起使用:来源于表1、2八、28、3、4、14、15和/或16中没有列出的一种或多种其它基因(本文中称为“另外的标志物基因”)的表达水平信息;分期信息(1、I1、III或IV期)以及传统的组织病理学测量结果,例如肿瘤结节和血管浸润。可被考虑进本发明步骤(b)中的其它因素包括以下的一种或多种:性别、年龄、种族、先前的癌症史、遗传因素(家族癌症史)、体重、生活方式类因素如饮食、活动水平、酒精消耗、消遣性毒品使用、患者是否为/曾经为吸烟者和习惯程度、疾病病因、病毒感染如肝炎病毒、肝功能如终末期肝病模型(MELD)系统或Child-Pugh评分(肝硬化分期系统)以及对电离辐射的暴露。
[0078]本领域技术人员已知利用这些额外的信息结合来源于本发明3种或更多种免疫基因的表达水平信息的多种方法。一类这样的方法是拟合多变量模型(例如cox回归模型),该模型涉及将临床参数和标签作为自变量,将死亡作为因变量。然后利用该模型可以将患者划分为“低”风险组和“高”风险组。在一实施方案中,使用多变量模型来获取中值风险比,并将该中值风险比用作分界点,所述多变量模型涉及将临床参数和标签作为自变量,将死亡作为因变量。就其它信息与来源于本发明3种或更多种免疫基因的基因表达水平信息结合使用而言,可参考 Dusan Bogunovis et al.PNAS2009, voll06, n0.48, pp20429-20434,该文档的教导通过引用包含到了本发明中。还可以参见本文中的图5。
[0079] 如果步骤(b)使用来源于一种或多种另外的标志物基因的基因表达水平信息,则步骤(a)除了包括测定表1、2A、2B、3、4、14、15和/或16中所列的3种或更多种基因的表达水平外,还可以任选地包括测定所述一种或多种另外的标志物基因的表达水平。
[0080]在本发明的至少一些实施方案中,没有采用一种或多种另外的标志物基因的表达水平。因此,在本发明的一些实施方案中,步骤(b)采用的基因表达谱由本发明的3种或更多种免疫基因的表达水平信息组成。
[0081]本文中所使用的术语“另外的标志物基因”包括指代这样的基因,其表达水平在提供HCC患者预后方面具有提供信息的作用或具有预测价值。因此,在对患者进行分类或分级、提供患者预后(例如不良或良好;长或短的存活)、监测疾病进程、预测治疗干预的功效、为患者挑选治疗策略或评估治疗干预的功效时,可以将一种或多种另外的标志物基因的表达水平与本发明的3种或更多种免疫基因的表达水平有效结合使用。
[0082]本领域技术人员应当理解,其中一种或多种另外的标志物基因在本发明方法中可使用的方式依赖于标志物基因。例如,可以设想,一些另外的标志物基因的表达将与良好患者结果呈正相关。相反地,可以设想,其它另外的标志物基因的表达可与良好患者结果呈负相关。而且,对于一些标志物基因而言,可能需要对基因表达进行定量(要么涉及由其衍生的多核苷酸(如mRNA),要么涉及由其编码的蛋白质/多肽),而对于其它标志物基因而言,为了使其具有预测价值,可能仅仅需要确定是否存在该标志物基因的表达。
[0083]其表达水平可在本发明步骤(b)有效采用的另外的标志物基因的实例包括免疫相关基因和肿瘤相关基因。以下出版物在鉴别可能的另外的标志物基因中也可能用到:Budhu et al.(2006)Cancer Celll0:99_lll ;Lee et al.(2004)Hepatology40:667-76 ;Hoshida et al.(2008) N Engl J Med359:1995-2004 ;Chen et al.(2002)Mol BiolCelll3:1929-39 ;Lizuka et al.(2003)Lancet361:923-9 ;Breuhahn et al.(2004)CancerRes64:6058-64 ;Ye et al.(2003)Nat Med9:416-23 ;Midorikawa et al.(2004)CancerRes64:7263-70 ;Boyault et al.(2007)Hepatology45:42-52 ;Chiang et al.(2008)Cancer Res68:6779-99 以及Hoshida et al.(2009) Cancer Res69:7385-92。这些出版物也可以对在分析HCC患者中如何采用此类一种或多种另外的标志物基因,例如以提供预后,提供指导。
[0084]可以从与本发明的3种或更多种免疫基因相同的患者来源的肿瘤样品,或者从患者不同的生物样品中测定一种或多种另外的标志物基因的表达水平。用于测定一种或多种另外的标志物基因的表达的样品材料的实例包括:外周血、肿瘤细胞和非肿瘤细胞。试验材料可以任选地为细胞、组织或血清。
[0085]可以从与本发明的3种或更多种免疫基因相同的患者来源的肿瘤样品,或者从患者不同的生物样品中测定一种或多种另外的标志物基因的表达水平。任选地,如果在本发明中采用一种或多种另外的标志物基因的表达水平,则采用至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、80、100、120、150、165、180、200、225、250、275、300、325、350、375、400、425或450种另外的标志物基因的表达水平。
[0086]任选地,如果在本发明中采用一种或多种另外的标志物基因的表达水平,则测定不多于 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、80、100、120、150、165、180、200、225、250、275、300、325、350、375、400、425、450 或 475 种另外的标志物基因的表达水平。
[0087]在本发明的至少一些实施方案中,除了测定表1、2A、2B、3、4、14、15和/或16中所列的3种更多种基因的表达,以及任选地还测定一种或多种另外的标志物基因的表达外,也可以测定一种或多种标准化基因或对照基因的表达水平。这在下文会有进一步的讨论。
[0088]本发明的3种或更多种免疫基因的表达水平(以及若适用,任选地,一种或多种另外的标志物基因的表达水平)可以用来产生表达谱。特定样品的表达谱本质上为该样品状态的“指纹”一虽然两种状态可能具有相似表达的任何特定基因,但很多基因的评估同时允许产生具有细胞或组织状态特征的基因表达谱。因此,“表达谱”可被认为是指给定时间给定条件下特定细胞类群或组织共同的基因表达模式。如果“表达谱”具有预测性,则其可以与术语“基因”标签作为同义词来使用。表达谱的使用允许将正常组织从,例如,癌变组织中区别开来,或者允许将癌症组织(例如活检材料)与来自癌症幸存患者(例如已知具有良好或不良疾病结果的患者)的组织进行比较。比较不同癌症状态下的表达谱可以鉴别出这些状态的每一种状态下的重要的基因(例如上调和下调基因)。分子谱型可以区分当前共同的疾病名称的亚类,例如,不同形式或阶段的癌症。在本发明中,可以使用表达谱来对患者进行分类或分级、提供患者预后(例如不良或良好;长或短的存活)、监测疾病进程、预测治疗干预的功效、为患者挑选治疗策略或者评估治疗干预的功效等,也就是说,表达谱可以用于本发明方法的步骤(b)中。如从上文的讨论中所理解的,表达谱可以在步骤(b)中单独使用或与诸如分期信息、癌症史等其它信息一起使用。
[0089]在本发明中,利用本发明的3种或更多种免疫基因(任选地,以及任何另外的标志物基因)的表达水平来分析HCC患者,例如用来为患者提供预后。优选地,本发明的3种或更多种免疫基因的表达水平(以及若适用,任选地,一种或多种另外的标志物基因的表达水平)被标准化。标准化使得能导致试验间存在结果差异的因素最小化或被校正(归一化)。差异的潜在来源明显依赖于如何测定表达水平,但也可以包括例如:RNA或其它受试材料量或品质的差异、杂交条件的差异、标记物强度或“阅读”效率。在优选的实施方案中,将本发明免疫基因的表达水平(任选地,和任何另外的标志物基因的表达水平)除以标准化基因的表达水平,从而将测量结果标准化。任选地,标准化基因为组成型表达的看家基因,例如ACTB、β-肌动蛋白基因、转铁蛋白受体基因、GAPDH基因或Cypl。标准化基因的其它实例包括RPS13、RPL27、RPS20和0AZ1。至于可以被采用的看家基因的另外的实例也可参考 Plos one2007 中 Hendrik 等人的 Evidence Based selection of Housekeeping gene。可以使用软件来进行表达水平标准化。可以任选性地使用MxPro软件(Stratagene)。在本发明的特别优选的实施方案中,采用MxPio软件(Stratagene)将本发明的免疫基因的表达水平(以及若适用,任选地,那些一种或多种另外的标志物基因的表达水平)相对于ACTB标准化。
[0090]可选择地或者另外地,标准化可以基于每种或所有试验基因或其大子集的平均数或中值进行(总标准化法)。在优选实施方案中,采用依据训练群体(新加坡群体)的每种特定基因的中值进行本发明免疫基因的选择性或其它标准化(至于来自新加坡作为训练群体的每种基因的中值,参见实施例2中的表10)。
[0091]为避免疑义,术语“基因表达水平信息”、“表达水平”和“表达值”以及相似表述包括(除非上下文指出并非如此)提及表达水平自身(即绝对表达水平)或从其得到的数据,例如表达水平值已被转换,例如以提供标准化表达值或相对表达值。通过将表达水平相对于看家基因标准化,接着相对于来源于单个患者群体,例如训练或验证群体的特定基因的中值标准化,可以获得合适的相对表达值(参见例如,表10)。除非上下文指出并非如此,术语“基因表达水平信息”可指本发明的3种或更多种免疫基因的基因表达水平信息,和/或若适用的话,一种或多种另外的标志物基因的基因表达水平信息。如下面所讨论的,基因表达水平信息可以通过对基因编码的肽或多肽,或者来源于该基因的多核苷酸(例如由该基因转录来的RNA,由其产生的任何cDNA或cRNA或者由其得到的任何其它核酸)的表达进行定量来产生。
[0092]本领域技术人员应当了解,基因表达水平信息可以以多种方式用于分析患者,例如用来对患者进行分级或分类,或提供预后等。如上所述,患者可以单独基于表达水平进行分析,或基于其基因表达水平信息与其它信息,如临床信息的组合进行分析。
[0093]在本发明方法的至少一些实施方案中,步骤(b)包括从本发明的3种或更多种免疫基因组合的表达水平(以及若适用,任选地,一种或多种另外的标志物基因的表达水平)中获得数值,并将该数值与阈值进行比较。测定来源于基因组合的数值低于或高于阈值(例如,通过如SVM算法所确定的算法),指示特定的预后(例如良好或不良预后)。优选地,在至少一些实施方案中,测定来源于基因组合的数值低于阈值,指示不良的预后,而测定来源于基因组合的数值高于阈值,指示良好的预后。相反地,在本发明的其它实施方案中,测定来源于基因组合的数值低于阈值指示良好的预后,而测定来源于基因组合的数值高于阈值指示不良的预后。
[0094]在如下所述的SVM(支持向量机)算法(“算法I”)中,阈值为0,且测定来源于基因组合的数值低于由该算法确定的阈值指示不良预后,而高于阈值指示良好预后。利用训练群体从机器学习过程中确定的超平面是将空间分离为两个半空间的一般平面。其划分了O阈值上下的2个种类。采用该算法中给出的公式从任意基因组合的水平中得到一个数值,并将该得到的数值与阈值进行比较。
[0095]支持向量机基于确定决定界线的决定平面概念。决定平面将拥有不同类别成员的一组对象分离开来。关于阈值的使用和支持向量机的使用,可参考Burges.A tutorialon support vector machines for pattern recognition.Data mining and Knowledgediscovery, 2,121-167 (1998),该文的教导通过引用并入了本文中。
[0096]在本发明的至少一些实施方案中,本发明的3种或更多种免疫基因的表达水平(以及若适用,任选地,一种或多种另外的标志物基因的表达水平)采用表达谱的形式。所述表达水平可以,例如是标准化表达水平或相对表达水平等。提供了本发明方法,其中步骤 (b)包括确定表达谱与特定HCC类型或预后(例如良好或不良预后,长或短的存活)的一种或多种模板的相似性,其中所述表达与特定HCC类型或预后的一种模板(或多种模板)的相似性(包括差异性)程度分别指示该患者是否具有特定的HCC类型或预后。相似性适当地指示特定的HCC类型或预后,而差异性指示该患者不具有特定HCC类型或预后。如本文中所讨论的,也可以采用其它信息(例如分期信息)来分析患者,例如用来提供特定的预后或将患者分类/分级到特定的亚型中。
[0097]特定预后的模板适当地包含特定HCC类型或预后特有的(即代表性的)基因表达水平。在本发明的一些实施方案中,模板可以如算法3的步骤I至2或I至3中所述进行确定(任选地,不同的数值被分配给“不良”预后相关基因和“良好”预后相关基因,例如步骤2中使用数值的正或负倍数(I和-1))。在本发明的一些实施方案中,模板中的每个表达水平是确定具有所述特定HCC类型或预后/结果的多个个体(例如,至少2、3、4、5、8、10、12、
15、20、30、40、50、60个个体)中基因表达水平的平均值(均值、众数值或中值)。
[0098]不良预后模板因此包含不良预后患者特有的基因表达值,而良好预后模板因此包含良好预后患者特有的基因表达值。在优选的实施方案中,不良或良好预后模板中的每种基因表达值分别是多个不良或良好结果患者中基因表达水平的平均值(均值、众数值或中值)。
[0099]在一实施方案中,步骤(b)包括确定表达谱与良好预后模板和/或不良预后模板的相似性,并且其中所述患者按如下被归类:(i)如果所述表达谱与良好预后模板相似和/或与不良预后模板相异,则具有良好预后;或(ii)如果所述表达谱与良好预后模板相异,和/或与不良预后模板相似,则具有不良预后。在一实施方案中,如果表达谱与模板间的相似性高于或低于预定的阈值,则所述相似性分别被确定为“相似”或“相异”。在另一实施方案中,如果表达谱与模板间的相似性低于或高于预定的阈值,则所述相似性分别被确定为“相似”或“相异”。
[0100]在一实施方案中,步骤(b)包括确定表达谱与良好预后模板和不良预后模板的相似性,并且其中所述患者按如下被归类:(i)如果所述表达谱与所述良好预后模板的相似性高于其与所述不良预后模板的相似性,则具有良好预后;或(ii)如果所述表达谱与所述不良预后模板的相似性高于其与所述良好预后模板的相似性,则具有不良预后。
[0101]在本发明的至少一些实施方案中,患者表达谱与模板间的距离代表了患者表达谱与模板间的相似性。在一实施方案中,距离低于给定值指示相似性,而距离等于或高于给定值则指示差异性。在一实施方案中,距离是“余弦距离”。计算余弦距离的方法是本领域技术人员已知的,但是余弦距离可以任选地采用算法3步骤4中的公式计算。关于余弦距离的使用,也可参考 P.-N.Tan, M.Steinbach&V.Kumar, "Introduction to Data Mining",Addison-Wesley (2005),ISBN0-321-32136-7,第 8章;500 页,其教导通过引用并如本文中。计算距离的其它方法是本领域技术人员已知的,且包括,例如,欧几里得距离(Euclidean distance)和汉明距离(Hamming distance)。关于欧几里得距离,可参考Elena Deza&Michel Marie Deza(2009)Encyclopedia of Distances, 94 页,Springer,其教导通过引用并如本文中。关于汉明距离,可参考Hamming, Richard W.(1950),"Errordetecting and error correcting codes'Bell System Technical Journal29(2):147 -160,MR0035935,其教导通过引用并如本文中。
[0102]可以采用本领域内已知的任何方式,采用基因表达信息来分析患者(例如归类、提供预后、挑选治疗策略等)。一般来说,采用训练群体的表达值建立数学模型,该模型将基因表达值作为输入并输出预后结果。然后采用该数学模型来分类(例如将不良或良好预后分配给)新患者。
[0103]本发明可以采用的机器学习算法有很多,例如决策树、人工神经网络、遗传算法、贝叶斯网络等,并且因此在本发明的至少一些实施方案中,本发明方法的步骤(b)使用机器学习算法执行。
[0104]在本发明优选的实施方案中,可以使用为执行步骤(b)特别设计或改装的软件来执行步骤(b)。
[0105]优选地,使用至少一种算法来执行本发明方法的步骤(b)。优选地,“至少一种算法”为1、2、3、4或5种算法。优选地,使用2种或更多种算法的组合实现提高的精确性、特异性和/或灵敏性。
[0106]优选地,步骤(b)最好使用SVM算法、KNN算法或SVM和KNN算法组合来执行。通过组合SVM和KNN算法的组合可以实现提高的精确性、特异性和灵敏性。如上所述,可以任选地将信息(例如分期信息)联合起来。
[0107]如果使用SVM算法来执行步骤(b),则优选的实施方案提供:表2A的3种或更多种基因是表2A中所列的至少3、4、5、6种和/或所有的基因和/或以上的任意组合;表2B的3种或更多种基因是表2B中所列的至少3、4、5、6种和/或所有的基因和/或以上的任意组合;表1的3种或更多种基因是表1中所列的至少3、4、5、6、7、8、9、10、11、12、13、14种和/或所有的基因和/或以上的任意组合;表14的3种或更多种基因是表14中所列的至少3、4、5、6、7种和/或所有的基因和/或以上的任意组合;表15的3种或更多种基因是表15中所列的至少3、4种和/或所有的基因和/或以上的任意组合;或表16的3种或更多种基因是表16中所列的至少3、4种和/或所有的基因和/或以上的任意组合。
[0108]在本发明优选的实施方案中,通过应用如算法I中所描述的SVM算法执行步骤
(b),并将患者分类为具有良好或不良预后。
[0109]如果使用KNN算法来执行步骤(b),则优选的实施方案提供:表3的3种或更多种基因是表3中所列的至少3、4、5、6、7、8、9、10种和/或所有的基因和/或以上的任意组合;或表1的3种或更多种基因是表1中所列的至少3、4、5、6、7、8、9、10、11、12、13、14种和/或所有的基因和/或以上的任意组合。
[0110]在本发明优选的实施方案中,通过应用如算法2中所描述的KNN算法执行步骤
(b),并将患者分类为具有良好或不良预后。
[0111]如果使用SVM和K NN算法组合来执行步骤(b),则优选的实施方案提供:所述3种或更多种基因是选自以下的至少3、4、5、6、7、8、9、10、11、12或13种基因:CCL2、CCL5、CCR2、CD8A、CXCLlO, FCGR1A、IL6、NCR3、TBX21、TLR3、TLR4、IFNG 和 TNFA。
[0112]在本发明的一些实施方案中,使用NTP算法执行步骤(b)。优选地,当使用NTP算法执行步骤(b)时,患者为II期或III期HCC患者。NTP-14免疫基因预测法能预测II期和III期HCC患者的存活,其中II期和III期通常具有非常相似的存活概况(p=nS)。如果肿瘤分期不能单独将患者分为良好或不良预后,所述预测方法对II期或III期HCC患者非常有用。
[0113]如果使用NTP算法执行步骤(b),则优选的实施方案提供:表4的3种或更多种基因是表4中所列的至少3、4、5、6、7、8、9、10、11、12、13种和/或所有的基因和/或以上的任意组合,或表1的3种或更多种基因是表1中所列的至少3、4、5、6、7、8、9、10、11、12、13、14种和/或所有的基因和/或以上的任意组合。
[0114]为测定基因的表达水平,可以采用本领域内的任何合适方法。基因表达可以结合该基因编码的蛋白质/多肽进行评估,例如通过免疫组织化学、蛋白免疫印迹(Westernblotting)、质谱测定法、流式细胞术、液相芯片、ELISA、RIA等。可选择地,表达水平可以结合来源于基因的多核苷酸,例如mRNA或由其产生的核酸如cDNA或扩增的DNA加以确定。核酸可以任选地在定量之前或定量过程中进行扩增。核酸扩增技术的实例包括但不限于:聚合酶链式反应(PCR),逆转录聚合酶链式反应(RT-PCR)、转录介导扩增(TMA)、连接酶链反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。本领域普通技术人员应当认识到,某些扩增技术(例如,PCR)需要RNA在扩增前被逆转录为DNA (例如,RT-PCR),而其它的扩增技术直接扩增RNA (例如,TMA和NASBA)。 [0115]为了测定本发明免疫基因的表达水平(以及若适用,任选地,一种或多种另外的标志物基因的表达水平),可以任选地使用RT-PCR、qRT-PCR、qPCR、杂交或测序分析。
[0116]在本发明优选的实施方案中,使用微阵列试剂盒或定量PCR (qPCR)。因此,在本发明方法的至少一些实施方案中,所述方法包括使用微阵列试剂盒或qPCR来测定表1中所列的任一或所有基因的表达水平(以及若适用,任选地,一种或多种另外的标志物基因的表达水平)。优选地,在进行qPCR之前,从患者来源的肿瘤样品中提取RNA并将RNA进行逆转录。从mRNA产生cDNA的方法是本领内熟知的。通常,纯化的mRNA用多聚dT序列或随机引物引发。然后采用逆转录酶来合成与所述mRNA序列互补的DNA。然后进行第二链的合成。
[0117]本发明提供了微阵列供本发明方法使用,其中微阵列包含能与选自以下的所述3种或更多种基因杂交的多种探针:表1所列的基因、表2A或表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因。优选地,提供了其中至少50%、60%、70%、80%、90%或95%的探针是能与选自以下的所述3种或更多种基因杂交的探针的微阵列:表1所列的基因、表2A或表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因。任选地,微阵列可以提供在容器中或与本发明方法说明书一起提供,从而以便提供微阵列试剂盒。
[0118]本发明方法的步骤(b)可以使用计算机执行。因此,在优选的实施方案中,步骤
(b)使用本发明计算机系统或计算机软件产品执行。本发明的计算机软件产品通常包括具有用于执行本发明方法步骤(b)的计算机可执行指令的计算机可读介质。合适的计算机可读介质包括软盘,CD-ROM/DVD/DVD-ROM、硬盘驱动、闪速存储器、ROM/RAM、磁带等。计算机可执行指令可以以合适的计算机语言或数种语言的组合写入。软件可以任选地包括用于计算机系统处理器的指令以接收数据结构,这些数据结构包括本发明3种或更多种免疫基因(以及任选地,一种或多种另外的标志物)的表达水平,以及任选地用于分析的其它信息,例如分期信息、患者年龄、体重等。软件可包括用于数据分析的数学程序。
[0119]本发明还包括程序化用于执行本发明方法步骤(b)的计算机系统。计算机系统包含链接到外部组件的内部组件。典型计算机系统的内部组件包括连通到主存储器的处理器单元。所述的外部组件可包括大容量存储器。其它的外部组件包括用户界面设备(例如监视器)以及输入设备(例如“鼠标”和/或键盘)。通常,计算机系统还连接到网络,例如因特网。该网络连接允许计算机系统与其它计算机系统分享数据和处理任务。
[0120]在此依照本发明的“方面”对本发明进一步加以限定。根据意图,在合适的情况下,本发明以上所述可以用于指导本发明下述方面的解释和执行。
[0121]本发明的第一方面提供了分析HCC患者的方法,所述方法包括:
[0122](a)测定患者来源的肿瘤样品中3种或更多种基因的表达水平,所述3种或更多种基因选自表1中所列的基因、表2A和表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因;以及
[0123](b)将步骤(a)中测定的表达水平用于以下的一项或多项中:对患者进行分级或分类、提供预后、监测疾病进程、预测治疗干预的功效、挑选肿瘤治疗策略或评估治疗干预的功效。
[0124]任选地,当对患者进行分级或分类、提供预后、预测治疗干预的功效、挑选肿瘤治疗策略或评估治疗干预的功效 时,在本发明第一方面的步骤(a)中获得的表达水平信息可以与其它信息(例如分期信息、来源于一种或多种另外的标志物基因的表达水平信息)联合使用。
[0125]任选地,本发明第一方面的步骤(a)还包括确定一种或多种另外的标志物基因的表达水平。
[0126]优选地,表达水平为标准化表达水平。
[0127]依照本发明方法,可以将患者归类或指派为特定的预后(例如不良或良好预后,或者短或长的存活等)。这些预后信息可以任选地用于对患者进行分级或分类、监测疾病进程、预测治疗干预的功效、挑选肿瘤治疗策略或评估治疗干预的功效。
[0128]“3种或更多种基因”包括4、5、6、7、8、9、10、11、12、13、14或15种基因。
[0129]在本发明第一方面的一实施方案中,提供了为HCC人类患者提供良好或不良预后的方法,其中所述方法包括:(a)测定来源于所述患者的肿瘤样品中3种或更多种(并且优选5种或更多种)基因的表达水平,其中肿瘤样品包含总肿瘤材料,其中所述3种或更多种基因选自以下的至少一个基因列表:所述基因选自表1中所列的基因、表2A中所列的基因、表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和表16中所列的基因,并且其中所述表达水平可以任选地为相对表达水平和/或标准化的表达水平;以及(b)使用步骤(a)中测定的表达水平给患者提供所述预后,任选地通过确定包含步骤(a)中测定表达水平的表达谱与包含良好预后患者特有的基因表达水平的良好预后模板和包含不良预后患者特有的基因表达水平的不良预后模板的相似性,其中所述表达谱与所述良好预后模板的较高相似性指示不良预后,而与所述不良预后模板的相似性高于其与所述良好预后模板的相似性指示不良预后。优选地,不良或良好预后模板中的基因表达值的每一个值分别是多个不良或良好结果患者中基因表达水平的平均值(均值、众数值或中值)。
[0130]本发明的第二方面提供了将HCC患者分类为具有不良或良好预后的方法,包括以下步骤:
[0131](a)测定患者来源的肿瘤样品中3种或更多种基因的表达水平,其中所述基因选自表1中所列的基因、表2A或表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因;以及
[0132](b)将步骤(a)中测定的表达水平用于将患者分类为具有不良或良好预后。
[0133]本发明的第三方面提供了将HCC患者分类为具有不良或良好预后的方法,包括以下步骤:
[0134](a)测定患者来源的肿瘤样品中3种或更多种基因的表达水平,其中所述基因选自表1中所列的基因、表2A或表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因;以及
[0135](b)基于步骤(a)中测定的表达水平将患者分类为具有短或长的存活,其中所述患者患有HCC。
[0136]在本发明的至少一些实施方案中,术语“长存活”和“短存活”分别与良好和不良预后以相同的含义使用。在至少一些实施方案中,术语“短存活”指的是少于3、4、5或6年的存活期。在至少一些实施方案中,术语“长存活”指的是多于或等于3、4、5或6年的存活期。
[0137]在本发明的至少一些实施方案中,术语“长存活”指的是基因表达谱与长存活模板的相似性高于其与短存活模板的相似性。
[0138]在本发明的至少一些实施方案中,术语“长存活”指的是基因表达谱与长存活模板相似和/或其与短存活模板相异。
[0139]在本发明的至少一些实施方案中,术语“短存活”指的是基因表达谱与短存活模板的相似性高于其与长存活模板的相似性。
[0140]在本发明的至少一些实施方案中,术语“短存活”指的是基因表达谱与短存活模板相似和/或其与长存活模板相异。
[0141]本发明的第四方面提供了将HCC患者分类为具有不良或良好预后的方法,包括以下步骤:
[0142](a)测定患者来源的肿瘤样品中5种或更多种基因的表达水平,其中所述基因选自表1中所列的基因、表2A或表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因;以及
[0143](b)基于步骤(a)中测定的表达水平将患者分类为具有短或长的存活,其中所述患者患有HCC。
[0144]本发明的第五方面提供了评估治疗干预治疗HCC患者的功效的方法,包括以下步骤:
[0145](a)测定选自以下的3种或更多种基因的表达水平:表1中所列的基因、表2A或2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因;以及
[0146](b)将步骤(a)中测定的表达水平用于评估治疗干预的功效。
[0147]从如上所述可以理解,任选地,当对患者进行分级或分类、提供预后、预测治疗干预的功效、挑选肿瘤治疗策略或评估治疗干预的功效时,本发明第一方面步骤(a)中获得的表达水平信息可以任选地与其它信息(例如分期信息)结合使用。
[0148]步骤(a)可以在一个或多个时间点(优选至少1、2、3、4或5个时间点)进行,例如在治疗干预之前、期间和/或之后。通过这种方法,可以确定治疗干预对基因表达水平的影响,并将此信息用于步骤(b)以能评价治疗干预的功效。任选地,步骤(a)仅在一个时间点进行,例如在治疗之后。如果步骤(a)在治疗之后进行,则可以将表达水平信息与未处理对照组的表达水平信息比较。在本发明第五方面方法的优选实施方案中,比较了步骤(a)中测定的表达水平与未处理对照的表达水平,并将此比较用于评估治疗干预的功效(任选地与其它信息,比如临床信息等结合)。
[0149]在本发明第五方面的至少一些实施方案中,步骤(a)在治疗干预之前和治疗干预之后进行,并任选地也在治疗干预期间进行。
[0150]本发明地第六方面提供了评估治疗干预治疗HCC患者的功效的方法,包括以下步骤:
[0151](a )测定患者来源的肿瘤样品中3种或更多种基因的表达水平,其中所述基因选自表1中所列的基因、表2中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因;以及
[0152](b)将步骤(a)中测定的表达水平用于将患者分类为具有不良或良好预后,其中步骤(b)的对患者的分类在治疗干预之前、治疗干预期间和/或治疗干预之后监测。
[0153]本发明的第七方面提供了评估治疗干预治疗HCC患者的功效的方法,包括以下步骤:
[0154](a)测定患者来源的肿瘤样品中3种或更多种基因的表达水平,其中所述基因选自表1中所列的基因、表2中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因;以及
[0155](b)基于步骤(a)中测定的表达水平将患者分类为具有短或长的存活,其中所述患者患有HCC,且其中步骤(b)的对患者的分类在治疗干预之前、治疗干预期间和/或治疗干预后监测。
[0156]在本发明的第六和第七方面中,步骤(b)的对患者的分类在一个或多个时间点(优选在至少1、2、3、4或5个时间点)监测。步骤(b)的对患者的分类优选在治疗干预之前和治疗干预之后、治疗干预期间、治疗干预之前和治疗干预期间、或治疗干预期间和治疗干预之后监测。在一实施方案中,步骤(b)的对患者的分类在治疗干预之前、治疗干预期间和治疗干预之后监测。
[0157]本发明的免疫标签可以用于鉴别或选择有效治疗HCC的药剂。在这种情况下,本发明3种或更多种免疫基因的表达水平可以充当药物筛选或药物功效的替代生物标志物。在本发明第五方面、第六方面和第七方面的优选实施方案中,所述“治疗干预”为实验治疗。患者可以正接受用一种或多种药剂的治疗,所述药剂正在经受实验或临床试验。[0158]在本发明第五方面、第六方面和第七方面的一实施方案中,步骤(a)在多个时间点(例如治疗前和治疗期间、治疗前和治疗后、周期性地在治疗期间,或治疗前、治疗期间和治疗后)进行。通过这种方法,可以对患者的表达谱进行评估,因为可以确定治疗干预(例如候选药物)的治疗进程和功效(如果存在的话)。
[0159]在本发明第五方面、第六方面和第七方面的优选实施方案中,所述治疗干预为新辅助治疗。
[0160]在本发明方法中,基因表达水平信息可以用于为患者挑选治疗策略。因此,在本发明的至少一些实施方案中,将患者进行分级或分类以用于特定的治疗,或者使用预后为患者挑选治疗策略。任选地,本发明的方法可以包括鉴别患者具有特定预后(例如不良或良好预后,长或短的存活),并选择患者用于治疗或跟踪的另一步骤。例如,在一实施方案中,选择具有良好预后或长存活的患者用于免疫疗法和/或肝移植。
[0161]依据本发明第一至第七方面任何一个方面的方法,本发明的第八方面提供了治疗特征为具有良好或不良预后的患者的方法,其中所述患者被给予肝细胞癌免疫疗法或任何其它其它可供选择的治疗策略。
[0162]依据本发明第一至第七方面任何一个方面的方法,本发明的第九方面提供了免疫疗法或任何其它可供选择的用于肝细胞癌的治疗策略在制备用于治疗特征为具有良好或不良预后的患者的药物中的用途。
[0163]“可供选择的治疗策略”包括,例如,手术干预、肝移植、采用给定药物或药物组合的化学疗法、放射疗法、细胞疗法、抗体疗法、基因疗法和新辅助治疗。
[0164]本发明的第十方面提供了用于本发明第一至第七方面任何一个方面中的试剂盒,其中所述试剂盒包含用于测 定选自以下的所述3种或更多种基因(或在本发明第四方面的情况下,5种或更多种基因)的表达的试剂:表1中所列的基因、表2A或表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因,且其中所述试剂盒还任选地包含使用说明书。所述试剂盒可以作为进行本发明方法的单元加以推广、散布或出售。
[0165]优选地,所述试剂盒包含一套探针和/或引物,所述探针和/或引物包含能够与选自以下的所述3种或更多种基因杂交的多种寡核苷酸:表1中所列的基因、表2A或表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因。
[0166]优选地,所述试剂盒包含用于扩增选自以下的所述3种或更多种基因的引物;表1中所列的基因、表2A或表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因。
[0167]在一实施方案中,所述试剂盒包含微阵列(见上面微阵列相关讨论)从而提供微阵列试剂盒。
[0168]本发明第十方面的试剂盒可包含进行本发明方法需要的任何和所有成分。
[0169]在本发明第十方面的一实施方案中,所述试剂盒包含软件,其中本发明方法的步骤(b)可以使用本软件进行。
[0170]如上所述,本发明方法可以任选地采用下述算法中的一种或多种。
[0171]算法I[0172]患者样品输入向量X的SVM(支持向量机)决策函数为
[0173]D(X)=W.X+b,
[0174]其中W= Σ a kykXk,且 b=<yk _ ff.Xk>,
[0175]权向量W为训练模式Xk的线性组合,
[0176]yk编码类二进制值+1或-1,
[0177]ak为估计参数,
[0178]X代表表1基因的表达水平。
[0179]如果D(X)>0=>X 为(+)类;
[0180]如果D(X)〈0=>X 为(-)类;或
[0181]如果D (X)=0,判定边界。
[0182]测定基因组合低于由SVM算法确定的阈值,指示不良预后。测定基因组合高于由SVM算法确定的阈值,指示良好预后。
[0183]算法2
[0184]KNN (K-最近邻)
[0185]K最近邻算法对来自训练集的受试集进行分类。对于所述受试集中的每一个患者样品,找到训练集中的k个最近(采用欧几里得距离)患者样品,通过多数投票、同数随机中断来确定分类。如果对第k个最近邻居为同数,则在投票中包括所有的候选者。
[0186]两个患者之间的欧几里得距离通过如下方法给定:
【权利要求】
1.分析肝细胞癌(HCC)患者的方法,其中所述方法包括: (a)测定患者来源的肿瘤样品中3种或更多种基因的表达水平,其中所述3种或更多种基因选自:表1中所列的基因;表2八或表2B中所列的基因;表3中所列的基因;表4中所列的基因,表14中所列的基因,表15中所列的基因,和/或表16中所列的基因;以及 (b)将步骤(a)中测定的表达水平用于以下的一项或多项中:对患者进行分级或分类、提供预后、监测疾病进程、预测治疗干预的功效、挑选肿瘤治疗策略或评估治疗干预的功效。
2.如权利要求1所述的方法,其中所述方法为将HCC患者分类为具有不良或良好预后的方法,包括以下步骤: (a)测定患者来源的肿瘤样品中3种或更多种基因(优选5种或更多种基因)的表达水平,其中所述基因选自:表1中所列的基因;表2八或表2B中所列的基因;表3中所列的基因;表4中所列的基因,表14中所列的基因,表15中所列的基因,和/或表16中所列的基因;以及 (b)基于步骤(a)中测定的表达水平将患者分类为具有短或长的存活期,其中所述患者患有HCC。
3.如权利要求1所述的方法,其中所述方法为评估治疗干预治疗HCC患者的功效的方法,包括以下步骤: (a)测定患者来源的肿瘤样品中3种或更多种基因的表达水平,其中所述基因选自:表I中所列的基因;表2中所列的基因;表3中所列的基因;表4中所列的基因,表14中所列的基因,表15中所列的基因,和/或表16中所列的基因;和以及 (b)基于步骤(a)中测定的表·达水平将患者分类为具有短或长的存活期,其中所述患者患有HCC,且其中步骤(b)的对患者的分类在治疗干预之前、期间和/或之后监测。
4.如权利要求1、2或3中任一项所述的方法,其中: (i)表1的3种或更多种基因为表1中所列的至少3、4、5、6、7、8、9、10、11、12、13、14种和/或所有的基因和/或以上的任意组合; (?)表2A的3种或更多种基因是表2A中所列的至少3、4、5、6种和/或所有的基因和/或以上的任意组合; (iii)表2B的3种或更多种基因是表2B中所列的至少3、4、5、6种和/或所有的基因和/或以上的任意组合; (iv)表3的3种或更多种基因是表3中所列的至少3、4、5、6、7、8、9、10种和/或所有的基因和/或以上的任意组合; (V)表4的3种或更多种基因是表4中所列的至少3、4、5、6、7、8、9、10、11、12、13种和/或所有的基因和/或以上的任意组合; (vi)表14的3种或更多种基因是表14中所列的至少3、4、5、6、7种和/或所有的基因和/或以上的任意组合; (vii)表15的3种或更多种基因是表15中所列的至少3、4种和/或所有的基因和/或以上的任意组合; (viii)表16的3种或更多种基因是表16中所列的至少3、4种和/或所有的基因和/或以上的任意组合。(ix)其中14种基因选自表1 ; (X)表1的3种或更多种基因为来自表1的4至15种基因、4至14种基因、5至15种基因或5至14种基因;或 (xi)表 I 的 3 种或更多种基因包括:CCL2、CCL5 和 CCR2 ;CCL5、CCL2 和 CXCLlO ;*CCL5、CCL2、CXCLlO 和 CCR2。
5.如权利要求1所述的方法,其中步骤(b)在对患者进行分级或分类、提供预后、监测疾病进程、预测治疗干预的功效、挑选肿瘤治疗策略或评估治疗干预的功效中使用其它的信息,且其中这类其它的信息任选地为分级信息和/或没有存在于表1、2A、2B、3、4、14、15或16中的一种或多种另外的标志物基因的表达(存在或缺失,或水平),且其中所述一种或多种另外的标志物基因对HCC预后具有预测价值。
6.如前述权利要求中任一项所述的方法,其中以下的一项或多项适用:(a)所述表达水平为标准化的表达水平和/或相对表达水平;(b)所述患者来源的肿瘤样品包含肿瘤浸润白细胞(TIL)、基质和肿瘤细胞;(c)所述患者为人。
7.如前述权利要求中任一项所述的方法,其中步骤(b)包括从表1、2A、2B、3、4、14、15或16所列的3种或更多种基因的表达水平(并且任选地还从可以采用的另外的标志物基因中的任何一种或多种基因的表达水平)中获得数值,并将该数值与阈值进行比较,其中测定获得的数值低于或高于所述阈值表明特定的预后(例如良好或不良预后), 且任选地,其中:(i)不良预后是预测存活少于3、4、5或6年,且良好预后是预测存活多于或等于3、4、5或6年;或(ii)不良预后少于给定群体的中值存活年数,且良好预后多于给定群体的中值存活年数。
8.如权利要求1至6中任一项所述的方法,其中表达谱包括表1、2A、2B、3、4、14、15或16所列的所述3种或更多种基因的表达水平,且其中步骤(b)包括确定所述表达谱与良好预后模板和/或不良预后模板的相似性,其中与良好预后模板和/或不良预后模板的相似性程度指示患者是否具有良好预后或不良预后。
9.如权利要求8所述的方法,其中步骤(b)包括确定所述表达谱与良好预后模板和/或不良预后模板的相似性,且其中所述患者按如下被归类:(i)如果所述表达谱与良好预后模板相似和/或与不良预后模板相异,则具有良好预后;或(?)如果所述表达谱与良好预后模板相异和/或与不良预后模板相似,则具有不良预后,其中依据所述相似性是高于还是低于预定的阈值,将所述表达谱确定为与模板相似或相异。
10.如权利要求8所述的方法,其中步骤(b)包括确定所述表达谱与良好预后模板和/或不良预后模板的相似性,且其中所述患者按如下被归类:(i)如果所述表达谱与所述良好预后模板的相似性高于其与所述不良预后模板的相似性,则具有良好预后;或(ii)如果所述表达谱与所述不良预后模板的相似性高于其与所述良好预后模板的相似性,则具有不良预后。
11.如前述权利要求中任一项所述的方法,其中步骤(b)采用至少一种算法和/或计算机进行。
12.如权利要求11所述的方法,其中步骤(b)采用SVM算法、KNN算法或SVM和KNN算法的组合进行,且任选地,其中: (i)表2A的3种或更多种基因是表2A中所列的至少3、4、5、6种和/或所有的基因和/或以上的任意组合;或表2B的3种或更多种基因是表2B中所列的至少3、4、5、6种和/或所有的基因和/或以上的任意组合;或表1的3种或更多种基因是表1中所列的至少3、4、.5、6、7、8、9、10、11、12、13、14种和/或所有的基因和/或以上的任意组合;或表14的3种或更多种基因是表14中所列的至少3、4、5、6、7种和/或所有的基因;或表15的3种或更多种基因是表15中所列的至少3、4种和/或所有的基因;或表16的3种或更多种基因是表15中所列的至少3、4种和/或所有的基因,且步骤(b)采用SVM算法进行;或 (ii)表3的3种或更多种基因是表3中所列的至少3、4、5、6、7、8、9、10种和/或所有的基因和/或以上的任意组合;或表1的3种或更多种基因是表1中所列的至少3、4、5、6、.7、8、9、10、11、12、13、14种和/或所有的基因和/或以上的任意组合,且其中步骤(b)采用KNN算法进行。
13.如权利要求11所述的方法,其中步骤(b)采用NTP算法进行,且任选地,其中表4的3种或更多种基因是表4中所列的至少3、4、5、6、7、8、9、10、11、12、13种和/或所有的基因和/或以上的任意组合,或者表1的3种或更多种基因是表1中所列的至少3、4、5、6、7、.8、9、10、11、12、13、14种和/或所有的基因和/或以上的任意组合。
14.如权利要求11或12所述的方法,其中步骤(b)通过以下进行:⑴应用算法I中描述的SVM算法,将患者分类为具有良好或不良预后;或(ii)应用算法2中描述的KNN算法,将患者分类为具有良好或不良预后。
15.如权利要求11或13所述的方法,其中步骤(b)通过应用算法3中描述的NTP算法将患者分类为具有良好或不良预后来进行。
16.如权利要求1所述的方法,其中所述方法是评估治疗干预治疗HCC患者的功效的方法,且其中所述治疗干预为候选药剂。
17.如权利要求1或2中所述的的方法,其还包括基于具有良好或不良预后的患者挑选患者用于治疗或随访。
18.如权利要求1或3所述的方法,其中所述治疗干预为新辅助治疗。
19.如前述权利要求中任一项所述的方法,其包括使用微阵列试剂盒或定量PCR来测定表1、表2A、表2B、表3、表4、表14、表15或表16中所列的任何基因或所有基因的表达水平。
20.如前述权利要求中任一项所述的方法,其中所述HCC为I期或II期。
21.治疗患者的方法,其中所述患者是根据前述权利要求中任一项所述被表征为具有良好或不良预后的患者,其中所述患者被给予肝细胞癌免疫疗法或任何其它可供选择的治疗策略。
22.免疫疗法或任何其它可供选择的肝细胞癌的治疗策略在制备用于治疗患者的药物中的用途,其中所述患者根据权利要求1或2所述的方法被表征为具有良好或不良预后。
23.在权利要求1至20或26任一项中使用的试剂盒,其中所述试剂盒包含用于测定选自以下的所述3种或更多种基因的表达的试剂:表1中所列的基因、表2A或2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表16中所列的基因,且其中所述试剂盒还任选地包含使用说明书。
24.执行权利要求1至20或26中任一项所述方法的步骤(b)的计算机程序或计算机软件产品,或程序化来执行权利要求1至24中任一项所述的方法的计算机系统。
25.在权利要求1至20或26任一项所述的方法中使用的微阵列,其中所述微阵列包含能与选自以下的所述3种或更多种基因杂交的多种探针:表1中所列的基因、表2A或表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因和/或表14中所列的基因。
26.为HCC人类患者提供良好或不良预后的方法,其中所述方法包括: (a)测定来源于所述患者的肿瘤样品中5种或更多种基因的表达水平,其中所述肿瘤样品包含总肿瘤材料,其中所述5种或更多种基因选自以下的至少一个基因列表:表1中所列的基因、表2A中所列的基因、表2B中所列的基因、表3中所列的基因、表4中所列的基因、表14中所列的基因、表15中所列的基因、表16中所列的基因,且其中所述表达水平可以任选地为相对表达水平和/或标准化表达水平;以及 (b)确定包含步骤(a)中测定的表达水平的表达谱与包含良好预后患者特有的基因表达水平的良好预后模板和包含不良预后患者特有的基因表达水平的不良预后模板的相似性,其中所述表达谱与所述良好预后模板的相似性更高指示不良预后,且与所述不良预后模板的相似性高于其与所述良好预后模板的相似性指示不良预后, 且其中不良预后少于给定群体的中值存活年数,且良好预后多于给定群体的中值存活年数。
【文档编号】C12Q1/68GK103547682SQ201280010855
【公开日】2014年1月29日 申请日期:2012年1月13日 优先权日:2011年1月14日
【发明者】周淑萍, 阿莱桑德拉·纳丁, 让-皮埃尔·阿巴斯塔多, 陈金妙, 杨鹤 申请人:新加坡科技研究局
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1