用于肿瘤特征和标记物组鉴定，肿瘤分级的方法和用于癌的标记物组的制作方法_2

文档序号：9447820阅读：来源：国知局

示"恶性"或"良性"的阔值是什么？Eg。是否样品中超过 50%的见于标记的基因表达，就是"恶性"？是否超过50%的见于标记的基因表达在对应的非-癌性组织中的正常基础水平W上，就是"恶性"？
[0069] 14.组合各3组基因表达信号的预测作为患者样品考虑，及如下将值分配给肿瘤： (a)如果全部3基因表达信号组（标记）预测其为恶性肿瘤，将其指定为恶性肿瘤，且患者应提供超过一般标准的护理的更攻击性的治疗；化）如果全部3数据组预测其为良性肿瘤，患者不应接收超过标准护理的治疗，且不应使经历手术后化学治疗或放射治疗；(C)如果全部3组基因表达产物不提供相同的预后，将所述肿瘤指定为"中等"，且患者应接收完全一般标准的护理治疗，包括化学治疗和/或放射治疗。
[0070] 在一些情况中，为此方法，期望根据它们在生物学过程中的作用使用基因本体论分析将选择的鉴定的基因表达信号分组。
[0071] 优选创建30和50之间个随机练习组。更优选地，创建30和40之间个练习组。
[0072] 有时期望选择已知在癌中活跃的基因，其选自：负责转移，细胞增殖，肿瘤血管化及药物应答的基因。
[0073] 在本发明的一些实施方式中设及上述方法，在步骤7中，产生约750, 000和 1，250, 000之间，或约900, 000和1，100, 000之间或约百万个随机基因表达信号组。
[0074] 在本发明的一些实施方式中，如在W上描述的方法中，在步骤7中，产生的随机基因表达信号组含有约25和50之间，或28~32或约30个基因。
[0075] 在本发明的实施方式中，如W上描述的方法中，在步骤12中，选择排在前面的 26~50,或28~32或约30个基因。
[0076] 在一些情况中，当考虑设及患者存活的肿瘤特征时，期望采用选自基本上由W下构成的列表的至少一种癌生物标记物组：NRC-1，NRC-2,NRC-3,NRC-4,NRC-5,NRC-6,NRC-7， NRC-8 和NRC-9。
[0077] 在本发明的实施方式中提供了试剂盒，其包含至少3个标记物组，及用于进行上述方法的使用说明，W便鉴定目标肿瘤特征。在一些情况中，试剂盒包含列于表1A或1B的至少10个基因表达信号。在一些情况中，试剂盒包含根据上述方法鉴定的至少30个核酸生物标记物。
[0078] 在本发明的实施方式中提供了表1A或1B中的任何基因表达信号用于鉴定一种或更多目标肿瘤特征的用途。在一些情况中，至少不同3个标记物组在一些情况中用于至少 1，2或3个标记物组，包括见于表1A或1B的至少1，5，10,20或25个基因表达信号。在一些情况中，各标记物组含有见于表1A或1B的至少1，5,10, 20或25个基因表达信号。
[0079] 在本发明的实施方式中，癌生物标记物是乳腺癌生物标记物，且样品的第1亚型是ER+样品。
[0080] 在本发明的实施方式中，在上述方法中，随机练习组如下产生：随机挑选样品，同时维持与选出它们的组相同的"良性"和"恶性"肿瘤比。
[0081] 在一些情况中，目标肿瘤特征会设及患者存活（例如，手术和一般标准的护理后），且在该情况中，方法可用于鉴定相比一般标准的护理需求或多或少攻击性的治疗的患者。（化学治疗和放射治疗对本人是危险的。由此，最好避免将该治疗提供给不需要它们的患者）。
[0082] 在一些情况中，期望通过提取基因表达信号（例如mRNA，蛋白）及使用特异于目标基因表达信号的报告子检定目标基因表达信号的存在（及在一些情况中，水平）来研究患者的肿瘤组织。此可W允许基本上同时检查多基因表达信号的微-阵列形式进行。报告子可为结合目标核酸序列，目标抗体特异于蛋白，或任何其他该类物质的探针（本领域中已知及常规使用许多该报告子）。报告子实现样品中的变化，允许评定目标基因表达信号。在一些情况中，实现的变化可为样品光学方面的变化，在其他情况中，变化可为样品的另一可检定的方面，例如其放射性或巧光性质的变化。
[0083] 在特定类型的癌具有多于一种亚型的情况中（例如ER+和ER-乳腺癌），可优选起初通过亚型分类患者的癌，然后使用关于该亚型开发的标记物。
[0084] 在一些情况中，目标肿瘤特征会设及对特定治疗的肿瘤应答，并在该情况中，方法可用于鉴定对于患肿瘤的患者的有前途的治疗方法（一种或更多化学治疗剂或治疗的组合）。
[0085] 如本文所用，"肿瘤"包括期望在患者中破坏或中和的任何癌细胞。例如，其可包括见于实体瘤，骨髓瘤，淋己瘤和白血病的癌细胞。
[0086] 肿瘤通常是哺乳动物或鸟肿瘤，且可为下列之肿瘤：人，猿，猫，狗，猪，牛，绵羊，山羊，兔，小鼠，大鼠，豚鼠，仓鼠，沙鼠，鸡，鸭或碟。
[0087] 显而易见的是，3个独立组基因表达信号的组合的使用不限于根据本文所述的方法产生的基因表达信号，也可应用于市售的或文献中报道的癌生物标记物数据组。（尽管最终筛选结果的可靠性会某种程度依赖于使用的组的稳健性，因此建议使用稳健的癌生物标记物数据组）。在一些实例中，期望选择包含设及不同生物学过程的基因的癌生物标记物数据组（例如一种数据组可设及发炎，另一种设及细胞周期，而第3种设及转移）。
[0088] 方法是通用的，且可将其应用于任何类型的癌。例如其关于列于表4的那些癌类型有用。
[0089] 在本发明的实施方式中，将处理应用于测定手术后应如何攻击性地治疗乳腺癌患者。
[0090] W下提供方法的一实施方式，平行于实施例1的描述：
[0091]-步骤1 :使用肿瘤患者的癌细胞基因微阵列数据和存活信息开发自动存活筛选方法（作为非限制性例，由JM01细胞系的微阵列数据（小鼠乳腺癌细胞系，室内细胞系和数据）鉴定表面及分泌的蛋白），W筛选公共乳腺癌数据组（295个样品，化ang等人，PNAS102:3738, 2005)。术语"存活筛选"定义为通过进行的Kaplan-Meier分析通过实施Cox-Mantel时间等级测试的各单基因表达值和患者存活状态（"良性"或"恶性"）之间的关联的统计学意义的检查（化ietal.,MolecularSystemsBiology, 3:152, 2007)。由此筛选，得到7种蛋白，其可个别区别'良性'和'恶性'肿瘤。例如，在实施例1的一部分，选择蛋白（MMP9)，在原细胞系中W实验方式确认。当将MMP9抗体应用于细胞系时，癌进展中的上皮到间叶转变被阻断。此结果指示，方法适于发现转移相关的基因。
[0092]-步骤2:进行表达值与乳腺癌患者存活相关的基因的基因组-范围的存活筛选（在实施例1中，使用2个练习数据组，定义为数据组1(78个样品，van'tVeer等人，化Uire, 2002)和数据组2 (286个样品，Wang等人，Lancet, 365:671，2005))。得到的基因表达信号列表分别称为S1及S2。运2个列表的总基因称为St基因表达信号列（St= S1+S2)〇
[0093]-步骤3:当目标癌具有多于一种亚-类型时，产生用于第1亚-类型的标记物。 (例如，在实施例1中，产生邸+和ER-标记物）。在实施例1中，通过自W上数据组提取全部ER+样品产生ER+肿瘤标记物，并分别定义为Sl-ER+(提取自数据组1)和S2-ER+ 组（提取自数据组2)。通过自S2-ER+组随机挑选N样品（N= 60)来产生35个随机-练习-组。"良性"和"恶性"肿瘤比保存与S2-ER+组基本上相同。通过将S1-ER+添加到上述35个随机-练习-组来得到36个练习-组。
[0094]-步骤4:通过基因组-范围的存活筛选获得基因表达信号列（在实施例1 中，St-ER+基因表达信号列表），其设及重复步骤2,但对于第1肿瘤亚型使用子集，例如数据组，在实施例1中的S1-ER+和S2-ER+组。使用St-ER+基因表达信号列表，进行基因本体论（GO)分析（使用GO注释软件，David,http: //david.油cc.ncifc:rf.gov/)，仅将已知与癌相关的属于GO术语的基因，例如细胞周期，细胞死亡等用于进一步标记物筛选。
[0095]-步骤5 :通过从一个GO术语标注的基因随机挑选30个基因来从各选择的GO术语标注的基因（正常每GO术语约60-80基因）产生1百万个不同随机-基因-组（各随机-基因-组含有30个基因）。
[0096]-步骤6和7 :优选使用针对全部第1肿瘤亚型练习组（例如，在实施例1中，36个 ER+练习组）的1百万随机-基因-组（在步骤3中产生的）进行进一步存活筛选。对于各练习组，检查各随机-基因-组（30个基因）的表达值和患者存活状态（"良性"或"恶性"）之间的关联的统计学意义，例如通过进行的Kaplan-Meier分析通过实施Cox-Mantel 时间等级测试。如果对于使用针对一个练习组的一个随机-基因-组的存活筛选，P值小于0. 05,表示，该随机-基因-组通过该练习组。
[0097] 步骤7:当全部第1亚型（例如36个ER+)练习组具有多于2, 000个通过的随机-基因-组时，或对于多于90%的随机练习数据组得到大于0. 05的P值，则保持运些通过的随机-基因-组。
[0098] 步骤8 :基于通过的随机-基因-组中出现的频度将步骤7的保持的随机-基因-组中的基因排序。
[0099] 步骤9:选择排在前面的30个基因（定义为潜在标记物组）作为潜在-标记物-组。需知，当优选30个基因时，可使用20和40之间个，更优选25和35之间个或更优选27~33个。在一些实例中，用于筛选目的使用的各组中期望25~30个体基因表达信号，由此，各输入数可用于产生此输出。
[0100] 步骤10 :使用在步骤5中起初使用的相同的GO术语重复步骤5,并产生另外1百万个不同的随机-基因-组，其用于重复步骤6和7。
[0101] 步骤11 :如果对于排在前面的30个的基因成员与潜在-标记物-组中的那些（步骤9)基本上相同，其是指潜在-标记物-组稳定，并可用作真实癌生物标记物组。此潜在-标记物-组指定为标记物组（此现在可用于患者），如果对于2个潜在标记物组的基因表达信号不是基本上相同，运指示，运些GO术语基因对于发现生物标记物组不合适，并丢弃所述潜在标记物组而不进一步分析。在一些情况中，期望在指定为标记物组之前，在2个潜在标记物组中具有30个基因表达信号中的至少25个相同。在一些情况中，在2个潜在标记物组中期望具有26, 27, 28, 29或30个基因表达信号相同。
[0102] 步骤12 :对于2个其他组（步骤3)的基因表达信号再重复两次步骤5~11。由此，会有3组稳定的标记，各设及自步骤3的不同组。
[0103] 在实施例1中，得到3组标记物（分别称为NRC-1，-2和-3,各组含有30个基因，见表1)，并在邸+练习组（S1-ER+和S2-ER+)中测试。阐释测试过程。各练习组中的样品可分为3组：低-风险，中等-风险和高-风险组。
[0104] 任选的步骤12b:作为任选的步骤，其在实施例1中进行，其可用于进一步分析生物标记物组，W进一步将高-风险组分级。此步骤设及自高-风险组取样品（其在实施例 1中通过练习组S2-ER+的NRC-1，-2和-3分级），并重复步骤3,4, 5,6, 7和8。
[0105] 在实施例1中，分别得到另外3组标记物（称为NRC-4, -5和-6)。各组含有30个基因（见表1)。运些组祀向通过NRC-1，-2和-3分级的高-风险组。
[0106] -步骤12c:作为任选的步骤，在实验1中进行的，w获得用于肿瘤的第2亚-类型的生物标记物（在实施例1中，ER-肿瘤），提取数据组1和2中

完整全部详细技术资料下载

当前第2页1 2 3 4 5