用于肿瘤特征和标记物组鉴定,肿瘤分级的方法和用于癌的标记物组的制作方法

文档序号:9447820阅读:436来源:国知局
用于肿瘤特征和标记物组鉴定,肿瘤分级的方法和用于癌的标记物组的制作方法
【专利说明】用于肿瘤特征和标记物组鉴定,肿瘤分级的方法和用于癌 的标记物组
[0001] 本申请是2010年4月16日提交的同名发明专利申请201080020971. 2的分案申 请。 【技术领域】
[0002] 本发明设及癌生物标记物领域,及它们的鉴定及使用方法。 【【背景技术】】
[0003] 对癌知道越多,可更有效对其进行治疗。例如,多数癌患者进行手术。但是,对于 一些患者,用额外的治疗可能得到额外的受益。目前无满意的方法测定哪些患癌患者会受 益于手术后额外治疗(例如化学治疗)。可用于预后目的的特异于癌细胞的基因和蛋白的 鉴定被认为有帮助。鉴定与用于恢复的差预后关联的肿瘤的运些基因/蛋白,如果仅通过 手术处理之后是一般标准的护理,称为差预后生物标记。运些生物标记可用作有价值的工 具,其用于预测癌诊断后存活,鉴定复发的风险足够低的患者,在缺失手术后化学治疗和/ 或放射治疗下或仅一般标准的手术后护理治疗下患者可能同样进展或更佳,及用于向导肿 瘤科医生应如何处理癌,膜获得最佳结果。
[0004] 类似地,有癌中表达的基因,其在药物应答中起作用。当临床决定时,其会具有对 于预测的药物应答有用的信息。
[0005] 为了提供具有临床目标的足够的精确度的筛选工具,优选对于一类癌考虑多标记 物。单基因标记物不提供足够的水平的特异性和灵敏度。例如,微阵列技术,其可同时测量 多于25, 000基因,提供发现多-标记物的有用的工具。
[0006] 本发明的目的是提供用于鉴定目标肿瘤特征的一组标记物及它们的鉴定及使用 方法。
[0007] 【发明概述】
[0008] 本发明在一实施方式中教导利用基因表达谱基于几组基因来区别'良性'和'恶 性'肿瘤。如本文所用当说道预估及患者存活时,术语"良性肿瘤"指可能通过手术和仅一 般标准的护理治愈的,无需化学治疗或放射治疗(即便运是一般标准的护理的一部分)的 肿瘤。如本文所用,术语"恶性肿瘤"指不可能通过手术和仅一般标准的护理(包括化学治 疗或放射治疗)治愈的肿瘤。如本文所用,如果患者在手术后5或10年内不经历的肿瘤复 发(或其转移),则认为肿瘤被"治愈"。
[0009] 可能鉴定表达谱能区别'良性'和'恶性'肿瘤的几组基因。现有技术公开5种该 基因表达信号组,且运些被开发为用于乳腺癌样品的生物标记物。各基因表达信号组源于 一组乳腺肿瘤样品。但是,运5种生物标记物组不可交叉-使用。特别是,现有技术所谓的 "乳腺癌生物标记物"尚未发现当用于另一组乳腺肿瘤样品时可一致地预测预后。用于其他 类型的癌的生物标记物具有相同的问题。癌是高度异源性的。常对于一类癌,可发现几个 亚型。之前公开的标记物组对于运些亚型不足够通用。
[0010] 为了克服运些问题和数据组(样品)利用度的限制,开发了新方法来发现及使用 组生物标记物。
[0011] 在本发明的一实施方式中,从公开的癌数据组产生随机练习(training)数据组, 其中包括患者的基因表达谱和临床信息,W发现稳健的生物标记物组。随机练习数据组的 基因表达谱与患者存活状态和筛选生物标记物相关。
[0012] 在本发明的一实施方式中提供了鉴定生物标记物的方法,所述方法包括:
[0013]-自目前可有用的数据组(肿瘤微阵列表征+癌患者的临床信息)产生随机练习 数据组
[0014]-针对随机练习数据组筛选基因表达信号组,W鉴定对预后具有预测力的基因表 达信号组
[0015]-基于它们在基因表达信号组中出现的频度排序基因,其具有良好的预测力(经 筛选,最后步骤)和由此建造生物标记物组
[0016]-组合使用利用用于预测的3~6个生物标记物组(即,样品A被全部3个生物 标记物组预测为"良性肿瘤",我们会说样品A是"良性肿瘤"(低-风险),如果全部说其 是"恶性"的,我们会说其是"恶性"(高-风险),另外,我们说其是中等-风险)
[0017]-使用其他独立数据组确证标记物
[001引"基因表达信号"是基因(例如mRNA或蛋白)表达的有形的指示物。
[0019] 在本发明的实施方式中提供了用于鉴定肿瘤特征的方法,所述方法包括W下步 骤:
[0020] (1)获得各预测目标特征的3个不同标记物组;
[0021] 似自肿瘤细胞提取基因表达信号;
[0022] (3)将提取的基因表达信号与3个不同标记物组关联;
[0023] (4)根据W下顺序将值分配给提取的基因表达信号:
[0024] (a)如果全部3个预测性基因表达信号组的关联预测其具有关注的特征,将其指 定为恶性肿瘤;
[00巧]化)如果全部3个预测性基因表达信号组的关联预测其缺乏关注的特征,将其指 定为良性肿瘤;
[0026](C)如果全部3个预测性基因表达信号组的关联不提供相同的预测的临床结果, 将所述肿瘤指定为"中等"。
[0027] 在一些情况中,关注的特征设及下列之一种或多种:转移,发炎,细胞周期,免疫学 应答基因,药物抗性基因,及多-药物抗性基因。在一些情况中,肿瘤特征负责特定治疗或 治疗的组合。
[0028] 在一些情况中,肿瘤特征是导致差患者手术后存活的趋势。
[0029] 在一些情况中,肿瘤特征与患者存活相关,且W上方法的步骤4包括根据W下顺 序将值分配给提取的基因表达信号:
[0030] (a)如果全部3个预测性基因表达信号组的关联预测其为恶性肿瘤,将其指定为 恶性肿瘤,并将建议超过一般标准的护理的更攻击性的治疗;
[0031] 化)如果全部3个预测性基因表达信号组的关联预测其为良性肿瘤,不建议超过 护理标准的治疗,且不建议手术后化学治疗或放射治疗;
[0032] (c)如果全部3个预测性基因表达信号组的关联不提供相同的预后,将所述肿瘤 指定为"中等",并建议完全一般标准的护理治疗,包括化学治疗和/或放射治疗。
[0033] 当癌具有多于一种亚型时,其可期望包括预先步骤:
[0034] (a)鉴定待检查的肿瘤亚型;
[0035] 化)选择特异于所述肿瘤亚型的标记物组。
[0036] 在一些情况中,目标肿瘤特征是肿瘤响应特定治疗,例如化学治疗剂或放射的趋 势。在该情况中,基因表达信号在开发练习组的方法中与肿瘤药物应答相关。需知,对于特 定药物的"良性"肿瘤应答在治疗后会低于-平均肿瘤存活,而"恶性"应答在治疗后会高 于平均肿瘤存活。使用此方法,及依赖于可在用于开发练习组的原肿瘤和临床数据中有用 的细节,开发不仅用于应答个体药物或治疗,而且治疗的组合的标记物是可能的(其中原 始来源中有足够的数据W允许此)。
[0037] 在本发明的实施方式中提供了测定上述方法中有用的类型的预测性基因表达信 号组的方法,包括W下步骤:
[003引(1)获得对于目标癌的已知的肿瘤群的目标特征的基因表达信号信息和患者临床 信息;
[0039] (2)将基因表达信号与有关目标特征的临床患者信息关联,W鉴定哪些基因具有 对于临床结果的预测力;
[0040] (3)创建至少30个自步骤1的随机练习数据组;
[0041] (4)比较步骤3的鉴定的基因表达信号与一列已知的在癌中活跃的基因;
[0042] (5)选择对应于已知的癌基因列表上的那些的鉴定的基因表达信号;
[0043] (6)根据它们在生物学过程中的作用将选择的鉴定的基因表达信号分组;
[0044] (7)自步骤6的选择的基因表达信号组产生至少25个基因的随机基因表达信号 组;
[0045] (8)将随机基因表达信号组与步骤3的随机练习数据组关联;
[0046] (9)自对于步骤7的各基因表达信号组的关联获得用于存活筛选的P值;
[0047] (10)如果对于多于90 %的随机练习数据组,用于基因表达信号组的P值小于 0. 05,则保持所述基因表达信号组;
[004引 (11)基于组中基因出现的频度排序步骤10中保持的随机基因表达信号组;
[0049] (12)选择排在前面的至少26个基因作为潜在候选标记物;
[0050] (蝴重复步骤7~12,并产生至少26个基因的另一,独立,排序组;
[0051] (14)比较自步骤12及步骤13的排在前面的基因;
[0052] (15)如果多于25个基因相同,将所述排在前面的基因保持为标记物组;
[005引 (16)重复两次步骤7~15,W获得3个不同标记物组;
[0054] 在本发明的一实施方式中提供了鉴定相比一般标准的护理需求或多或少攻击性 的治疗的患者的方法,所述方法包括:
[0055] ?"基因表达信号"是基因表达(例如mRNA)的有形的指示物(理论上,如果技 术上可行,会代之一测量蛋白表达?或者其他?)。
[0056] 1.个别研究包含肿瘤和临床患者信息的信息源。将全部报道的细胞内的基因表达 信号与患者存活巧和10年)关联,W便鉴定哪些基因在该个体信息源之内具有对于预后 的预测力。鉴定发现与患者存活显著关联的那些基因表达信号用于进一步检查。
[0057] 2.将步骤1中鉴定的基因表达信号与一列已知的癌基因比较,并选择对应于已知 的基因的已知在癌中具有作用的那些基因表达信号用于进一步分析。(此会通常产生一列 几百到几千个基因表达信号)
[0058] 3.从步骤1的信息源产生至少30 ( -般30和40之间)个随机练习数据组。可在 多个随机练习数据组中出现相同的个体基因表达信号。
[0059] 4.将步骤2中选择的基因表达信号根据它们在生物学过程中的作用(例如细胞周 期基因,细胞死亡基因,免疫学应答基因,发炎基因等)来分组,GO分析
[0060] 5.产生随机基因表达信号组(一般约百万个),各含有约30个基因,自在步骤3 中产生的单组随机选择。
[0061] 6.针对各随机练习数据组得到步骤4的各随机基因表达信号组的用于存活筛选 的P值,你能对此关联进行更详细的描述?
[006引7.对于多于90%的随机数据组,如果P值小于0. 05,则保持随机基因组
[0063] 8.基于它们中基因出现的频度排序自步骤7保持的随机基因表达信号组
[0064] 9.选择具有最高预测值(如在步骤8中测定)的排在前面的30个基因(步骤8 中排序的)作为潜在候选体。
[0065] 10.步骤5~9重复,开始于自在步骤3中形成的各组产生随机基因表达信号组, 及产生是潜在候选体的排在前面的30个基因的另一,独立,排序的组。
[0066] 11.将步骤10中产生的排在前面的30个基因与自步骤9的排在前面的30个基因 比较。如果30个中25或更多相同,称其为"稳定的标记",且在筛选患者样品中有用。如 果少于25/30相同,除去该数据(从两组潜在候选体)。需要至少25个,由此可使用第1或 第2组潜在候选体。
[0067] 12.再重复两次步骤5~11,用于其他2组(步骤3的)基因表达信号。由此,会 有3组稳定的标记,各设及自步骤3的不同组。
[006引13.检查自患者的癌细胞,W评定它们的基因表达活性及其与3个稳定的标记中 的基因表达信号的关联。一般而言,稳定的标记会指示转移的似然性,因此匹配该标记的高 患者表达会指示"恶性"肿瘤。但是也可能稳定的标记可指示表达的保护性基因,例如调 亡基因,在该情况中,对于该标记,那些基因表达标记的高患者表达会指示"良性"肿瘤。在 任意情况中,将各稳定的标记与患者样品比较,及通过各稳定的标记个别预测"良性"或" 恶性"肿瘤。自单稳定的标记指
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1