用于辅助诊断和/或监测乳腺癌进展的方法和组合物的制作方法

文档序号:392793阅读:258来源:国知局
专利名称:用于辅助诊断和/或监测乳腺癌进展的方法和组合物的制作方法
技术领域
本发明涉及基于对给定样品进行差异性DNA甲基化模式分析而辅助诊断乳腺癌和/或监测乳腺癌 进展的方法。更具体地,所述方法涉及鉴定使用多种统计学方法产生的一或多种表观遗传学标记物(epigenetic markers),以便指出一或多个基因组基因座处的甲基化状态差异的预后意义,并预测所分析的样品在治疗后具有好的预后还是差的预后。
背景技术
DNA甲基化见于包括原核生物和真核生物在内的各种生物体的基因组。在原核生物中,DNA甲基化发生于胞嘧啶和腺嘌呤碱基,并包括一部分宿主限制系统(hostrestriction system)。但在多细胞真核生物中,甲基化似乎限于胞喃唳碱基,并与抑制型染色质状态和基因表达抑制相关联(综述參见例如Wilson,G.G. and Murray, N. E. (1991)Annu. Rev. Genet. 25,585-627)。在哺乳动物细胞中,DNA甲基化主要出现于CpG 二核苷酸,CpG 二核苷酸在基因组中的分布不均衡且代表性不足。通常非甲基化的CpG簇(也称为CpG岛)见于许多启动子区域(综述參见例如Li,E. (2002)Nat. Rev. Genet. 3,662-673)。已经在一些人类癌症例如结直肠癌和前列腺癌中证明有导致异常基因沉默的DNA甲基化的改变(综述參见例如Robertson, K. D. and ffolffe, A. P. (2000)Nat. Rev. Genet. 1,11-19)。曾证明启动子的超甲基化是导致肿瘤抑制基因失活的常见机制。另ー方面,启动子低甲基化通常与DNA断裂和基因组不稳定有关,且因此与某些癌症的严重程度有关(Bird,A. P. (2002) Genes Dev. 16,
6-21)。已有多种方法用于实验性确定各个基因的差异性甲基化(综述參见例如Rein,T.et al. (1998)Nucleic Acids Res. 26,2255-2264)。这些技术包括例如亚硫酸氢盐测序、甲基化特异性PCR(MSP)、Methylight和焦磷酸测序。乳腺癌在全球累及120万人,是女性中最重要的致死原因之一,在美国和西欧每年有大约400,000个新诊断的病例。因此,乳腺癌诊断剂仍然具有广阔的市场。已经发现ー些靶基因的差异性甲基化模式与乳腺癌的转归相关联(參见例如Zrihan-Licht, S. et al. (1995)Int. J. Cancer 62,245-251 ;Mancini, D. N. et al. (1998)Oncogene 16,1161-1169)。不过,临床上存在多种不同类型的乳腺癌,其中ー些在分子水平根本没有被很好地表征。此外,已有的用于分析乳腺癌的诊断法也有不足,它们通常都是基于对单一分子标记物的分析,这可能影响检测的可靠性和/或准确性。此外,単一标记物不能提供有关潜伏分期、肿瘤进展等等的详细预測。因此,仍然需要鉴定能够克服上述局限性的用于辅助诊断乳腺癌和/或监测乳腺癌进展的替代性分子标记物和測定方法。从临床角度看,最有用的生物学标记物是能够在诊断确立时预测出对任何治疗方案的反应的预测性标记物。能够鉴定乳腺癌患者在手术后的复发风险的预后标记物也是有用的,如果它们能够鉴定出哪些患者具有较低的复发风险且因此可免于进行高毒性化疗,将更加有用。

发明内容
本发明的目的在于提供基于差异性DNA甲基化模式分析而辅助诊断乳腺癌和/或监测乳腺癌进展的新方法。更具体地,本发明的目的在于提供使用多种统计学方法产生的表观遗传学标记物组,以便指出所分析的一或多个基因组基因座处的甲基化状态差异的意义,并由此使得能够预测给定样品在治疗后具有好的预后还是差的预后。
此外,本发明的目的在于提供诊断方法,其使得能够不依赖于除甲基化状态以外的其他病理学參数而可靠准确地判断乳腺癌的预后。随后的描述将使得这些以及其他的目的变得显而易见,并且这些以及其他的目的是通过本申请的独立权利要求的主题实现的。本发明的ー些优选实施方式由从属权利要求的主题定义。在ー个方面,本发明涉及辅助诊断乳腺癌和/或监测乳腺癌进展的方法,包括(a)确定待分析的给定样品中所含DNA的一或多个基因组基因座的甲基化状态;(b)鉴定DNA甲基化状态表现出差异的ー或多个基因组基因座;(c)针对步骤(b)获得的一或多个差异性甲基化的基因组基因座中的每ー个进行统计学存活分析;(d)确定步骤(C)获得的数据的统计学显著性;和(e)基于步骤(d)获得的数据选定DNA甲基化状态表现出统计学显著性差异的ー或多个基因组基因座,其中所选定的一或多个基因组基因座对辅助诊断乳腺癌和/或监测乳腺癌进展具有预后价值。在所述方法的具体实施方式
中,乳腺癌是雌激素受体阳性乳腺癌。在优选的实施方式中,所述方法用于在患者中辅助诊断乳腺癌和/或监测乳腺癌进展,并进ー步包括提供来自待分析的患者的基因组DNA样品,其中所述方法在体外进行。在另一具体实施方式
中,所述方法进ー步包括在进行步骤(C)之前,依据其甲基化状态,将所述ー或多个基因组基因座分类为非甲基化、部分甲基化和甲基化。在优选的实施方式中,步骤(C)进行的统计学存活分析包括针对所述ー或多个基因组基因座中的每ー个的相应的甲基化状态(即,属于相应的甲基化状态的样品)产生卡普兰-迈耶(Kaplan-Meier)存活估计值,并计算针对每一所述基因座产生的卡普兰-迈耶存活估计值之间的差异。在进ー步优选的实施方式中,确定从存活分析中所获得的数据的统计学显著性包括实施时序检验(log-rank test)或曼特尔_亨塞尔(Mantel-Haenszel test)检验。特别优选地,确定统计学显著性还包括置换检验(permutation testing)方法。在另一具体实施方式
中,所述方法进ー步包括确定所选定的一或多个基因组基因座的预后价值是否依赖于除甲基化状态以外的其他病理学參数。特别优选地,采用计算装置进行所述方法。在另一方面,本发明涉及用于在患者中辅助诊断乳腺癌和/或监测乳腺癌进展的遗传学标记物组,其中所述组包括表I所列的任何一或多种遗传学标记物、或优选地表I所列的全部遗传学标记物。在另一方面,本发明涉及用于在患者中辅助诊断雌激素受体阳性乳腺癌和/或监测雌激素受体阳性乳腺癌进展的遗传学标记物组,其中所述组包括表2所列的任何一或多种遗传学标记物、或优选地表2所列的全部遗传学标记物。优选地,提供本申请所定义的方法确定所述遗传学标记物组。在另一方面,本发明涉及本申请所定义的所述遗传学标记物组用于在患者中辅助诊断乳腺癌和/或监测乳腺癌进展的用途。在优选的实施方式中,监测乳腺癌进展包括将乳腺癌患者归类为预后良好组或预后不良组。特别优选地,监测乳腺癌进展包括预测诊断后第5年的无复发存活。


图I示意性显示了本发明中所使用的进行全基因组差异性甲基化基因座检测的甲基化寡核苷酸微阵列分析(MOMA)測定法的设计过程。简言之,以具有富CG识别序列的限制性内切核酸酶(MspI)消化基因组DNA,随后连接适体,用于下一歩降低基因组的复杂性。将一半的连接有适体的样品以甲基化特异性内切核酸酶McrBC消化以清除其甲基化序列,对另一半进行假处理。使用仔细平衡的PCR条件以根据大小选择MspI片段并降低总体的基因组复杂性。比较McrBC处理组的表示与假处理样品,该假处理样品用作在具有367K个特征的寡核苷酸铺瓦式阵列(tiling array)上进行比较杂交的參照,该阵列覆盖27,801个已注释的CpG岛中的26,219个。图2是本发明方法的示意性说明,所述方法用于鉴定给定样品中代表辅助诊断乳腺癌和/或监测乳腺癌进展的预后性差异性甲基化基因组基因座。鉴定到一或多个表现出甲基化行为參照差异的基因组基因座(未显示)之后,采用统计学存活模型评价各基因座的甲基化状态的变化的显著性,这涉及分别针对三种甲基化状态,即非甲基化、部分甲基化和甲基化,产生卡普兰-迈耶估计量(estimator)。如果针对ー个特定基因座获得的卡普兰-迈耶估计量之间的差异具有统计学显著性,则保留该基因座进行进一歩分析,否则该基因座被废弃。图3示意性显示了本发明的用于分析给定样品中所鉴定到的预后性基因组基因座的统计学显著性的一般过程。通过采用时序检验或曼特尔-亨塞尔检验为每ー比较产生卡方值,由此确定这三种卡普兰-迈耶估计值的统计学显著性差异。可通过置换检验方法估计这些差异的统计学显著性,这涉及置换临床数据并针对所有基因座重新计算卡方指数。这ー步骤重复进行1000次,以获得卡方值的背景分布。然后将来自原始临床数据的针对各基因座的卡方值与背景分布相比较,经Benjamini-Hochberg多重检验校正之后,任何达到O. 05或更低的统计学显著性的基因座均可能是用于将患者归类为预后良好组或预后不良组的良好生物学标记物。
发明详述
本发明基于以下出乎意料的发现,将对样品的差异性DNA甲基化分析与用于指出甲基化状态差异的显著性的多种统计学和机器学习方法相组合,导致鉴定到对辅助诊断乳腺癌和/或监测乳腺癌进展具有独立预后价值的表观遗传学标记物组。可以在缺少本文中没有具体描述的任何一或多个元素、一或多个限定的情况下合适地实施下文中所举例阐述的本发明。将结合具体的实施方式并參照特定的附图来描述本发明,但本发明并不限于这些具体的描述,而是由权利要求书限定。所描述的附图仅是示意性的,且应被理解为是非限制性的。当说明书和权利要求书中使用"包含"ー词时,其不排除其他元素或步骤。就本
发明而言,术语"由......组成"被认为是术语"包含"的优选实施方式。如果下文中的
一个组被定义为包含至少给定数目的实施方式,这也应理解为公开了ー个组,其优选地由这些实施方式組成。当使用不定冠词或定冠词(例如“一”或“ー个”或“所迷”)来描述单数名词时,其也包括该名词的复数情况,除非另有具体说明。在本发明中,术语"大约"表示准确性的区间,本领域人员能够理解该区间仍能保证所提及的特征的技术效果。该术语通常代表与指定数值具有±10%、且优选地±5%的差异。此外,在说明书和权利要求书中,术语第一、第二、第三、(a)、(b)、(C)等等,是用来区分相似的元素,其不一定是在描述ー种次序或时间顺序。应该理解,这些术语在合适的情况中可以互换使用,并且本文中所描述的本发明的实施方式能够以不同于在此举例说明的顺序的其他顺序实施。下文中将结合前后文给出术语进ー步的定义。以下术语或定义仅用于帮助理解本发明。这些定义的范围不应被理解为小于本领域普通技术人员所理解的范围。在ー个方面,本发明涉及辅助诊断乳腺癌和/或监测乳腺癌进展的方法,包括(a)确定待分析的给定样品中所含DNA的一或多个基因组基因座的甲基化状态;(b)鉴定DNA甲基化状态表现出差异的ー或多个基因组基因座;(C)针对步骤(b)获得的一或多个差异性甲基化的基因组基因座中的每ー个进行统计学存活分析;(d)确定步骤(C)获得的数据的统计学显著性;和(e)基于步骤(d)获得的数据选定DNA甲基化状态表现出统计学显著性差异的ー或多个基因组基因座,其中所选定的一或多个基因组基因座对辅助诊断乳腺癌和/或监测乳腺癌进展具有预后价值。在本申请中,术语“癌症”通常指任何类型的恶性肿瘤,即与未受累的(健康)野生型对照细胞相比表现出癌症特征或具有出现癌症特征的倾向的靶细胞的任何(基于遗传学重新编程的)形态学和/或生理学改变。此类改变的实例可涉及例如细胞大小和形状(増大或縮小)、细胞増殖(细胞数量増加)、细胞分化(生理学状态改变)、凋亡(程序化细胞死亡)或细胞存活。因此,术语"乳腺癌"指的是乳腺组织的癌性生长。在本发明方法的一个实施方式中,乳腺癌是雌激素受体阳性乳腺癌。、
在优选的实施方式中,所述方法用于在患者中辅助诊断乳腺癌和/或监测乳腺癌进展,并进ー步包括-提供来自待分析患者的基因组DNA样品,其中所述方法在体外进行。在本申请中,术语"体外"是指使用来自待分析的患者的分离的DNA样品来进行所述方法,即ー或多种细胞、细胞提取物、组织活检物等等。在本申请中,术语"样品"(或"基因组样品")是指包含准备对其差异性甲基化状态进行分析的一或多种基因组DNA分子的任何样品。样品中所包含的DNA分子可以是天然存在的或合成的化合物(例如,通过重组DNA技术或通过化学合成产生的),并可以是单链的或双链的。DNA分子可具有任何长度。典型地,其长度在IObp至IOOOOObp之间,优选地在IOObp至IOOOObp之间,特别优选地在500bp至5000bp之间。样品中所包含的DNA分子可以纯化的形式存在(例如,在本领域已知的合适的缓冲液(例如TE或PBS)中提供)或是容纳于未纯化样品溶液、部分纯化样品溶液或富集样品溶液中。此类未纯化样品的实例包括细胞裂解物、体液(例如,血液、血清、唾液和尿液)、溶解的组织等等。在一些实施方式中,本发明的方法还包括对存在于这种未纯化样品中的DNA进行纯化。用于纯化DNA的方法和相应的装置(任选地作为自动化系统或工作平台的ー个集成部分)是本领域已知的,并可从商业途径获得。可采用本领域已知的任何检测方法确定样品中所含DNA的甲基化状态,例如,包括亚硫酸氢盐测序、甲基化敏感性单链构象分析(MS-SSCA)、甲基化敏感性单核苷酸引物延伸(MS-SnuPE)、应用甲基化敏感性微阵列结合亚硫酸氢盐限制性分析(COBRA)、甲基化敏感性实时PCR,等等。在优选的实施方式中,使用甲基化寡核苷酸微阵列分析(MOMA)測定法(參见图I)以全基因组形式分析DNA甲基化模式。在本发明中,通过采用期望最大化算法(expectation maximization algorithm)确定每一甲基化谱,将特定样品中的每一基因座归类为以下三种不同的甲基化状态之一——非甲基化、部分甲基化和甲基化。随后,本发明的方法包括鉴定其DNA甲基化状态显示出差异的ー或多个基因组基因座,也就是说,所述基因组基因座例如在非肿瘤样品中非甲基化的,而在肿瘤进展过程中变为(至少部分)甲基化的,或反过来,在非肿瘤样品中是(至少部分)甲基化的,而在肿瘤进展过程中变为非甲基化的。在一些实施方式中,将差异性甲基化分析的结果与參考值比较,所述參考值例如是使用来自健康对象的DNA样品获得的甲基化模式,或与来自文献的数据比较,以便鉴定差异性甲基化。在具体的实施方式中,根据其甲基化状态将ー或多个差异性甲基化的基因组基因座分类为非甲基化、部分甲基化和甲基化,然后进行统计学存活分析。下一歩,对所获得的甲基化数据进行统计学存活分析,以便鉴定乳腺肿瘤样品中 的特定基因组基因座的甲基化状态是否能够将患者分类为预后良好或预后不良,也就是说,所观察到的甲基化行为的变化是否有意义。本领域已知多种统计学存活模型。可采用这些模型中的任何一种来实施本发明的方法。
但优选地,本发明方法的步骤(C)中进行的统计学存活分析包括针对每一所述ー或多个基因组基因座的相应的甲基化状态(即,为属于相应的甲基化状态的样品)产生卡普兰-迈耶存活估计值,并计算针对每一所述基因座(即,为属于每一所述基因座的样品)产生的卡普兰-迈耶存活估计值之间的差异。存活函数的卡普兰-迈耶估计量是本领域已知的(Hosmer, D. ff. , et al. (2008)Applied Survival Analysis-Regress ion Modeling of Time-to—Event Data. 2nded. Wiley Series in Probability and Statistics. Hoboken, New Jersey John Wiley &Sons, Inc.),并利用距离系统性复发的时间为所有入选研究的患者计算出在给定时间点不出现系统性复发的概率。由于通常会有ー些患者在一段时间后会退出研究,卡普兰-迈耶估计量会考虑因缺乏随诊而造成的不同时间点处的患者丢失。这在存活分析中称为“删改问题(censoring problem) ”,并且已经在卡普兰-迈耶估计量中被考虑进去。在本发明中,计算了在最初诊断后的10年期间的无系统性复发的概率。不过,其他的时间段(例如,1,3,5,15或20年)也是可以的。分别为非甲基化、部分甲基化和甲基化这三种甲基化状态产生卡普兰-迈耶估计量。如果针对一特定基因座所获得的卡普兰-迈耶估计量之间的差异具有显著性,则保留该基因座用于进一歩分析,否则就放弃该基因座。图2中示意性给出了进行统计学存活分析的总体过程。为了选择那些其差异性甲基化模式对于乳腺癌的诊断具有独立预后评估价值的基因组基因座,在下一歩中,确定在存活分析中所获得的数据的统计学显著性。同样,有多种已知的统计学手段可用于进行此类检验。本领域人员熟知如何选择合适的方法。在所述方法的优选实施方式中,确定从存活分析中所获得的数据的统计学显著性包括实施本领域熟知的时序检验或曼特尔-亨塞尔检验(Hosmer, D. ff. , et al. (2008),见上)。该检验为每ー比较输出卡方值,其是卡普兰-迈耶曲线中的差异量的度量。可通过置换检验方法进ー步验证这些差异的统计学显著性,置换检验方法例如涉及置換所分析的样品的现有临床数据并为所有基因座重新计算卡方指数。因此,在本发明方法的一个进ー步优选的实施方式中,确定存活分析中所获得的数据的统计学显著性进ー步包括置换检验方法。将该方法重复进行多次(例如,2、5、10、50、100、200、500、1000、2000次等等)以对于所有基因座获得卡方值的背景分布。在本发明中,置换检验方法优选地重复1000次。然后,将从原始临床数据中获得的针对各基因座的卡方值与所述背景分布相比较。经多重检验校正后(例如经 Benjamini-Hochberg 校正(Benjamini, Y. and Hochberg,Y. (1995) J. Royal Stat. Soc. Series B57,289-300)后),任何达到 0. 05 或更低的统计学显著性的基因座均被认为是用于将患者分类为预后良好组和预后不良组的好的生物学标记物。图3示意性描绘了进行统计学显著性分析的总体过程。最后,在一些实施方式中,本发明的方法包括确定所选定的一或多个基因组基因座的预后价值是否依赖于除甲基化状态以外的其他病理学參数,也就是说,针对可能与临床參数(例如被分析患者的年龄、肿瘤分级、辅助或激素治疗等等)有关联的任何不确定性,对所获得的结果进行校正。为了估计癌症复发率与给定基因座的甲基化状态相关联的程度,可采用已知的Cox回归分析,但同样可以采用其他模型。选择具有统计学显著性Cox系数的基因座(通过正态近似检验(Wald test)确定)用于进一歩分析。可联合使用显著性基因座的甲基化状态与例如年龄(例如< 55相对于> 55)、肿瘤分级(I或II级相对于III级)以及诸如p53(阳性相对于阴性)、雌激素受体(ER)(阳性相对于阴性)和ERBB2(阳性相对于阴性)等一些标记物蛋白质的状态进行多变量Cox回归分析。在多变量Cox回归模型中具有统计学显著性Cox系数的基因座被认为能为辅助诊断乳腺癌和/或监测乳腺癌进展提供独立于其他临床因素的预后信息。特别优选地,使用计算装置进行本发明的方法。此类装置是本领域已知的并可以多种方式设置。例如,这样的计算装置可被设计为接收有关给定样品中所含的DNA的一或多个基因组基因座的DNA甲基化状态的数据集,处理这一数据集以鉴定其DNA甲基化状态显示出差异的ー或多个基因组基因座,采用合适的算法对所鉴定的差异性甲基化的一或多 个基因组基因座进行统计学存活分析,将所获得的数据集与与所测试样品有关的其他临床參数相关联,并基于所述关联数据产生显示出对辅助诊断乳腺癌和/或监测乳腺癌进展具有统计学显著性独立预后价值的ー或多个基因组基因座的(分级的)列表。在另一方面,本发明涉及用于在患者中辅助诊断乳腺癌和/或监测乳腺癌进展的遗传学(更具体地为表观遗传学)标记物组,其中所述组包括表I所列的任何一或多个或优选地所有241种遗传学标记物。所有这些标记物均基于差异性DNA甲基化模式。在另一方面,本发明涉及用于在患者中辅助诊断雌激素受体阳性乳腺癌和/或监测雌激素受体阳性乳腺癌进展的遗传学(更具体地为表观遗传学)标记物组,其中所述组包括表2所列的任何一或多个或优选地所有105种遗传学标记物。所有这些标记物均基于差异性DNA甲基化模式。优选地,通过本申请所述的方法确定上述遗传学标记物组。在本申请中,术语“任何一或多个”涉及分别在表I和2中公开的相应的遗传学标记物基因中的任何ー种、或任何两种或更多种(即任何两种、任何三种、任何四种、任何五种、任何六种、任何七种、任何八种、任何九种、任何十种等等)的任何亚组、或全部。优选地,用于辅助诊断乳腺癌的表观遗传学标记物组包括表I所列的全部241种标记物,而用于辅助诊断雌激素受体阳性乳腺癌的表观遗传学标记物组包括表2所列的全部105种标记物。表I和2所列标记物均通过它们的染色体定位(即人染色体的编号以及相应染色体片段的起点和終点)而清楚地定义。在另一方面,本发明涉及本申请所定义的所述遗传学标记物组用于在患者中辅助诊断乳腺癌和/或监测乳腺癌进展的用途。所述遗传学标记物组可用于根据肿瘤的类型或肿瘤的分级对乳腺癌患者进行分类。在优选的实施方式中,监测乳腺癌进展包括将乳腺癌患者归类为预后良好组或预后不良组(例如,基干与本申请所述的统计学多变量模型相关的相应P-值;另參见表I和2)。特别优选地,监测乳腺癌进展包括预测在诊断后第5年(或例如第10年)的无复发存活。通过附图和以下实施例进ー步描述本发明,这些附图和实施例仅用于举例说明本发明的具体实施方式
,而无意于以任何方式限制本发明的范围。实施例实施例I :设计用于进行差异性甲基化分析的DNA阵列如下设计本发明所使用的用于在全基因组中检测差异性甲基化基因座的甲基化寡核苷酸微阵列分析(MOMA)阵列。以具有富CG识别序列的限制性内切核酸酶(MspI)消化基因组DNA,随后连接适体,用于下一歩降低基因组的复杂性。将一半的连接有适体的样品以甲基化特异性内切核酸酶McrBC消化以清除其甲基化序列,对另一半进行假处理。使用仔细平衡的PCR条件以根据大小选择MspI片段并降低总体的基因组复杂性。比较McrBC处理组的表示与假处理样品,该假处理样品用作在具有367K个特征的寡核苷酸铺瓦式阵列(tiling array)上进行比较杂交的參照,该阵列覆盖27,801个已注释的CpG岛中的26,219个。图I示意性显示了该过程。实施例2 :乳腺癌样品对121份人类乳腺癌肿瘤样品进行DNA甲基化分析,其中108份具有相关的临床-病理学注释,包括长达10年的复发和存活数据。在一个实施方式中,仅分析雌激素受体阳性的肿瘤,共70份肿瘤样品。采用期望最大化算法确定每一祥品的甲基化谱,将各基因座分为以下三种不同状态之ー——非甲基化、部分甲基化和甲基化。根据已知的标准方法从肿瘤样品中分离基因组DNA并确定DNA甲基化模式。实施例3 :统计学存活模型选择用于评价给定时间量内无系统性复发的概率的统计学模型是存活方程的卡普兰-迈耶估计量。卡普兰-迈耶估计量利用距离系统性复发的时间为所有入选研究的患者计算出在给定时间点不出现系统性复发的概率。由于通常会有ー些患者在一段时间后会退出研究,卡普兰-迈耶估计量会考虑因缺乏随诊而造成的不同时间点处的患者丢失。这在存活分析中称为“删改问題”,并且已经在卡普兰-迈耶估计量中被考虑进去。使用卡普兰-迈耶估计量分析了在最初诊断后的10年期间的无系统性复发的概率。图2示意性给出了鉴定在诊断和/或监测乳腺癌方面具有潜在预后价值的基因组基因座的过程。实施例4 :鉴定具有独立预后价值的基因组基因座采用上述方法捜索了数据集中的159,436个基因组基因座中具有预后能力的基因座。倘若任一基因座有三种可能的甲基化状态(即非甲基化、部分甲基化和甲基化),则使用落入该基因座的给定甲基化状态的所有患者,以卡普兰-迈耶估计量来估计至少10年无系统性复发的概率。采用时序检验或曼特尔-亨塞尔检验来评价这三种卡普兰-迈耶估计值的统计学显著性差异。该检验为每ー比较产生卡方值,其是卡普兰-迈耶曲线中的差异量的度量。可通过置换检验方法评估这些差异的统计学显著性,置换检验方法涉及置换临床数据并为所有基因座重新计算卡方指数。这ー步骤重复进行1000次,以获得卡方值的背景分布。然后将来自原始临床数据的针对各基因座的卡方值与背景分布相比较,经Benjamini-Hochberg多重检验校正之后,任何达到O. 05或更低的统计学显著性的基因座均被认为是用于将患者归类为预后良好组或预后不良组的合适的生物学标记物。图3示意性概括了这ー过程。在一个实验中,将所有121份乳腺肿瘤样品納入分析。基于前述方法,将潜在的预后性基因组基因座的数量缩小至2,559个。然后确定了这些基因座是否提供独立于其他临床变量(例如ER/PR状态、ERBB2状态、肿瘤分级以及辅助或激素治疗)的预后信息。采用Cox回归分析估计癌症复发率与给定基因座的甲基化状态相关联的程度。选择具有统计学显著性Cox系数的基因座(通过正态近似检验确定)用于进一歩分析。联合使用显著性基因座的甲基化状态与年龄(く 55相对于> 55)、肿瘤分级(I或II级相对于III级)、P53状态(阳性相对于阴性)、ER状态(阳性相对于阴性)和ERBB2状态(阳性 相对于阴性)进行多变量Cox回归分析。在多变量Cox回归模型中具有统计学显著性Cox系数的基因座被认为能提供独立于其他临床因素的预后信息。最后得以鉴定了具有独立于其他临床因素的预后价值的总共241个基因座。将这些基因座(均通过它们在染色体上的位置而明确表征)归纳入表I。在另ー实验中,仅对70份雌激素受体阳性乳腺癌样品进行分析。在清除所有不提供独立于其他临床因素的预后信息的基因座之后,得以将总共105个基因座鉴定为雌激素受体阳性肿瘤的独立预后因素。表2列出了这些基因座。可在缺乏任何未在此具体公开的ー或多种元素、一或多种限定的情况下合适地实施在此举例描述的本发明。因此,诸如“包含”、“包括”、“含有”等术语的含义是开放性的而非限制。此外,本申请所使用的术语和表述是描述性术语而非限制性术语,且此类术语和表述的使用无意于排除所显示和描述的特征的任何等价物或其部分,相反,应认识到可以在本发明的范围内进行各种改动。因此应该理解,尽管已经通过具体实施方式
和任选的特征具体公开了本发明,但本领域人员可以对其中具体实施的发明进行改动和变化,而这些改动和变化也落入本发明的范围。本申请宽泛概括地描述了本发明。落入上位概念中的每一具体概念和下位概念组也构成本发明的一部分。这包括以先决条件或否定限定自上位概念中排除一些主题的上位描述,而无论所去除的内容是否在本申请中具体记载。其他的实施方式落入所附权利要求书。此外,如果本发明的特征或方面是以马库什组的形式描述的,则本领域人员能够理解本发明也是以所述马库什组的任ー单个成员或成员亚组的形式描述的。表I :对辅助诊断和/或监测乳腺癌进展具有预后价值的差异性甲基化的独立基因组基因座Λ. c ττ.染色体LLJH片段系数 UD存活差异
MSpFragID 编号片段起点、片段终点(Fragcoef)HRP值
MspFragl2449I220928782220928852-1,6150948535,0283648567,28E-07
MspFragl 57734231349554351349554891,5651847274,7835585051,39Ε-06
MspFragl51940224080039040800450-1,6212781285,0595529443,13E-06
MspFragl 059241538550795385509311,490007394,4371283115;40E-06
MspFrag2280222196746012196746531,5173666614,5602008157,63E-06
MspFrag90914122198623021986315-1,4527216024,2747328198,41E-06
MspFragl441322030635304306353741,5661477114,788167217l,01E-05
MspFragl 485892144583759445856931,4960107034,463845896l;05E-05
MspFrag75113101243183012431927-1,4160009814,120609054l,29E-05
MspFrag3646841470402691470403591,4509954424,267360311l,40E-05
MspFragl45054204387458943874738-1,3767940313,962178623l,59E-05
MspFragl554172347274997472766081,3522660333,8661764961.92E-05
MspFrag383065106280410630001,3956355034,0375396252,01E-05
MspFrag8611I113645376113645473-1,3643416163,9131458522,09E-05
MspFragI0298I157045379157045911-1,5278837374,6084138812,36E-05
MspFragl44777203909143339091534-1,339699323,8178953682J3E-05
MspFragl31356197869087877701,4964168044,4656590362J5E-05
MspFrag3468I2185522221855381-1,3803426743,9762639553,46E-05
MspFrag56306772I7I559721718061,3212981643,7482841093,80E-05
MspFragl414481960572535605725831,3582353683,8893240174.49E-05
MspFrag4495251792078591792111651,307770583,6979202974,53E-05
MspFragl097761599147210991474691,4085029294,0898280564,65E-05
MspFrag74I2591375242881375243371,4199243974,1368076744J8E-05
MspFragl715I619360461936592,36375212410,630764665.28E-05
MspFrag2647434846319448463299-1,3636277513,9103533895,83E-05
MspFrag336I106431310644551,335766413,8029094186,04E-05
MspFrag2627I346593412465935301,3993872724,0527159936,38E-05
MspFragl31504199470759471641,3198358023,7428067656.51E-05
MspFrag8995712161002216100741,2934650833,6453962976,69E-05
MspFrag6966398699306686993159-1,387063774,0030788216J5E-05
MspFragI485202144377738443777871,5348886784,6408088766,93E-05
MspFrag328874668266866828021,2872127853,6226752957.03E-05
MspFrag2626034601223746012342-1,2642090773,5402915317,28E-05 MspFrag201662128359264128359351-1,3057438453,6904331827,28E-05
MspFrag6696881456694751456709771,3100618753,706403047,9 IE-05
MspFragl 170011686300161863003391,812590696,1262982310,00010052

权利要求
1.辅助诊断乳腺癌和/或监测乳腺癌进展的方法,包括 (a)确定待分析的给定样品中所含DNA的一或多个基因组基因座的甲基化状态; (b)鉴定DNA甲基化状态表现出差异的一或多个基因组基因座; (c)针对步骤(b)获得的一或多个差异性甲基化的基因组基因座中的每一个进行统计学存活分析; (d)确定步骤(C)获得的数据的统计学显著性;和 (e)基于步骤(d)获得的数据选定DNA甲基化状态表现出统计学显著性差异的一或多个基因组基因座,其中所选定的一或多个基因组基因座对辅助诊断乳腺癌和/或监测乳腺癌进展具有预后价值。
2.权利要求I的方法,其中所述乳腺癌是雌激素受体阳性乳腺癌。
3.权利要求I或2的方法,用于在患者中辅助诊断乳腺癌和/或监测乳腺癌进展,进一步包括 提供来自所述患者的待分析基因组DNA样品, 其中所述方法在体外进行。
4.权利要求I至3中任一项的方法,进一步包括 在进行步骤(c)之前,依据其甲基化状态,将所述一或多个基因组基因座分类为非甲基化、部分甲基化和甲基化。
5.权利要求I至4中任一项的方法,其中步骤(c)进行的所述统计学存活分析包括针对所述一或多个基因组基因座中的每一个的相应的甲基化状态产生卡普兰-迈耶存活估计值,并计算针对每一所述基因座产生的卡普兰-迈耶存活估计值之间的差异。
6.权利要求I至5中任一项的方法,其中确定从存活分析中所获得的数据的统计学显著性包括实施时序检验或曼特尔-亨塞尔检验。
7.权利要求6的方法,其中确定统计学显著性还包括置换检验方法。
8.权利要求I至7中任一项的方法,进一步包括 确定所选定的一或多个基因组基因座的预后价值是否依赖于除甲基化状态以外的其他病理学参数。
9.权利要求I至8中任一项的方法,其中使用计算装置进行所述方法。
10.用于在患者中辅助诊断乳腺癌和/或监测乳腺癌进展的遗传学标记物组,其中所述组包括表I所列的任何一或多种遗传学标记物、或优选地表I所列的全部遗传学标记物。
11.用于在患者中辅助诊断雌激素受体阳性乳腺癌和/或监测雌激素受体阳性乳腺癌进展的遗传学标记物组,其中所述组包括表2所列的任何一或多种遗传学标记物、或优选地表2所列的全部遗传学标记物。
12.权利要求10或11的遗传学标记物组,其中所述组是通过权利要求I至9中任一项的方法确定的。
13.权利要求10至12中任一项的遗传学标记物组用于在患者中辅助诊断乳腺癌和/或监测乳腺癌进展的用途。
14.权利要求13的用途,其中监测乳腺癌进展包括将乳腺癌患者归类为预后良好组或预后不良组。
15.权利要求13或14的用途,其中监测乳腺癌进展包括预测诊断后第5年的无复发存活。
全文摘要
本发明涉及基于对给定样品进行差异性DNA甲基化模式分析而辅助诊断乳腺癌和/或监测乳腺癌进展的方法。更具体地,所述方法涉及鉴定使用多种统计学方法产生的一或多种表观遗传学标记物,以便指出一或多个基因组基因座处的甲基化状态差异的预后意义,并预测所分析的样品在治疗后具有好的预后还是差的预后。
文档编号C12Q1/68GK102666876SQ201080042287
公开日2012年9月12日 申请日期2010年9月15日 优先权日2009年9月22日
发明者J·B·希克斯, S·卡玛拉卡兰, V·瓦拉达恩 申请人:冷泉港实验室, 皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1