用于诊断、预后和监测乳腺癌的方法及其所用的试剂与流程

文档序号:14186347阅读:521来源:国知局

本公开总体上涉及用于诊断、预后或监测雌激素受体1(esr1)阳性乳腺癌,例如响应于内分泌疗法的esr1阳性乳腺癌和/或内分泌疗法难以治疗的esr1阳性乳腺癌的方法和试剂。本公开还总体上涉及esr1阳性乳腺癌的治疗管理。

背景

癌症是全球疾病的主要原因。乳腺癌是最常见的癌症形式之一,影响到全球的女性和男性。已基于多种因素(包括肿瘤的组织病理学类型、肿瘤的分级、肿瘤的分期以及乳腺癌的特定亚型特有的基因的表达)区分了各种亚型的乳腺癌。确定患者的癌症的特定亚型在确定患者的最适当治疗过程方面通常是至关重要的。

雌激素受体(er)阴性(er-ve)乳腺癌和er阳性(er+ve)乳腺癌是两种公认的乳腺癌亚型,由雌激素受体基因表达的存在或不存在定义。类固醇激素雌激素激活雌激素受体(esr1)以介导对于多种组织(包括乳腺组织)的正常发育和维持至关重要的多种功能。乳房上皮细胞中esr1信号传导网络的不适当激活引发致瘤性转化并驱动esr1阳性乳腺癌。患有此病的患者通常接受辅助内分泌疗法,该疗法用于抑制esr1信号传导。尽管内分泌疗法降低了疾病复发和乳腺癌相关死亡率的风险,但1/3的esr1阳性乳腺癌患者获得了耐药性并且经历了疾病复发。目前还没有可以确定地预测对内分泌疗法的抗性的测试。因此,需要确定可籍以根据其对内分泌疗法的响应性或抗性将esr1阳性乳腺癌患者进行分级的可靠方法,以使得能够更好地进行明智的疾病管理。

先前对早期乳腺癌预后进行分级的努力主要集中在多基因表达标签(multi-geneexpressionsignatures)上。除了多基因表达测定以外,dna甲基化标签正在被评估为癌症的潜在分子生物标志物。尽管人们越来越关注乳腺癌中dna甲基化的预后意义,但还没有专门调查人esr1阳性乳腺癌的dna甲基化谱及其与响应于治疗的疾病结果的关联性的研究。

本领域需要用于诊断乳腺癌以及用于诊断乳腺癌的特定亚型(包括响应于内分泌疗法的esr1阳性乳腺癌和对内分泌疗法具有抗性的esr1阳性乳腺癌)的改进方法。在诊断为患有乳腺癌和正在接受治疗的患者中,也需要预后和预测对治疗的响应性的方法。

概述

本发明人进行了esr1阳性内分泌疗法敏感性乳腺癌细胞和esr1阳性内分泌抗性细胞的全基因组dna甲基化谱式分析。由此,本发明人鉴定了高甲基化的探针在esr1阳性内分泌抗性细胞相较于esr1阳性内分泌疗法敏感性乳腺癌细胞的基因组的增强子区域中显著富集。本发明人还鉴定了856个esr1结合位点的亚组,所述esr1结合位点与esr1阳性内分泌抗性细胞中含有高甲基化的基因座的增强子区域重叠,其中617个被鉴定为是基因内的。此外,使用源自tcga乳腺癌组群的rna-seq和hm450甲基化数据,本发明人鉴定出在与所鉴定的增强子区域重叠的856个esr1结合位点中,那些位点中的328个位点的高甲基化与和它们最紧密相关的基因的表达下降相关,从而代表291个独特的基因。已经证明这些标志物在对内分泌疗法具有抗性或响应于内分泌疗法(即,esr1阳性癌症是否处于内分泌响应状态)的esr1阳性乳腺癌的诊断和预后方面具有重大价值,包括确定受试者在治疗esr1阳性乳腺癌期间是否已获得对内分泌疗法的抗性。本发明人还显示了在856个esr1结合位点处的甲基化谱指示了esr1阳性乳腺癌的特定亚型(例如,luminala型乳腺癌亚型或luminalb型乳腺癌亚型)。

被鉴定为在esr1阳性乳腺癌(所述乳腺癌对内分泌疗法具有抗性或可能具有抗性,或者响应或能响应于内分泌疗法)的诊断和/或预后方面具有重大价值的包含cpg二核苷酸序列的本公开的增强子区域的具体实例包括位于daxx、msi2、ncor2、rxra、c8orf46、gata3、itpk1、esr1和get4内的那些增强子区域。

因此,本公开提供了用于预测患有雌激素受体1(esr1)阳性乳腺癌的受试者的对内分泌疗法的响应的方法,所述方法包括:

(i)测定受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态;和

(ii)鉴定受试者中的所述一个或多个cpg二核苷酸序列相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化;

其中受试者中所述一个或多个cpg二核苷酸序列相对于参考水平的差异甲基化指示所述受试者可能响应于内分泌疗法。

例如,一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处相对于参考水平的甲基化增加指示所述esr1阳性乳腺癌是内分泌疗法难以治疗的。

本公开还提供了用于诊断患有esr1阳性乳腺癌的受试者的内分泌疗法难以治疗的雌激素受体1(esr1)阳性乳腺癌的方法,所述方法包括:

(i)测定受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态;和

(ii)鉴定受试者中的所述一个或多个cpg二核苷酸序列相对于对应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,

其中受试者中的所述一个或多个cpg二核苷酸序列相对于参考水平的差异甲基化指示所述受试者患有内分泌疗法难以治疗的乳腺癌。

本公开还提供了用于预测接受或即将接受内分泌疗法的受试者中的雌激素受体1(esr1)阳性乳腺癌的治疗结果和/或监测其进展的方法,所述方法包括:

(i)测定受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态;和

(ii)鉴定受试者中的所述一个或多个cpg二核苷酸序列相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化;

其中在(ii)中鉴定的差异甲基化指示esr1阳性乳腺癌的可能治疗结果和/或进展。

例如,一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处相对于参考水平的甲基化增加指示esr1阳性乳腺癌是内分泌疗法难以治疗的和/或受试者不响应于内分泌疗法。

在一个实例中,所述方法包括确定esr1阳性乳腺癌是luminala型乳腺癌亚型还是luminalb型乳腺癌亚型。

本公开还提供了用于检测患有雌激素受体1(esr1)阳性乳腺癌的患者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的差异甲基化的方法,所述方法包括:

(i)对来自受试者的样品进行测定,所述测定被配置来测定所述受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化状态;和

(ii)检测受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。

在一个实例中,在(ii)中检测一个或多个cpg二核苷酸序列处的差异甲基化包括:将在(i)中测定的一个或多个cpg二核苷酸序列处的甲基化水平与相应的一个或多个cpg二核苷酸序列的参考甲基化水平相比较,并测定受试者中的一个或多个cpg二核苷酸序列处的甲基化是否与相应的参考甲基化水平不同。

在本文公开的任何方法中,可以测定一个或多个esr1结合位点内的一个或多个cpg二核苷酸序列的甲基化状态。在一个实例中,一个或多个cpg二核苷酸序列在如表1中定义的一个或多个esr1-结合位点内。在另一个实例中,一个或多个cpg二核苷酸序列在如表2中定义的一个或多个esr1-结合位点内。在另一个实例中,一个或多个cpg二核苷酸序列在如表3中定义的一个或多个esr1-结合位点内。

在本文公开的方法的一个实例中,测定选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化状态。例如,可测定在选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化状态。可根据本公开的方法测定其甲基化状态的示例性cpg二核苷酸序列选自在表1的第57行、第111-113行、第256-258行、第288-289行、第469-470行、第805行、第821-822行和第824-826行中定义的那些cpg二核苷酸序列。

在本文公开的方法的另一个实例中,测定选自daxx、rxra、ncor2、msi2和/或c8orf46的基因的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化状态。例如,可测定选自daxx、rxra、ncor2、msi2和/或c8orf46的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化状态。

在本文公开的方法的另一个实例中,测定选自foxa1,esr1和/或gata3的基因的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化状态。

在本文公开的任何方法中,一个或多个cpg二核苷酸序列的甲基化状态可根据本领域已知的任何合适的方法来测定。例如,一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态可通过选自由以下组成的组的一种或多种技术来测定:核酸扩增、聚合酶链式反应(pcr)、甲基化特异性pcr、亚硫酸氢盐焦磷酸测序、单链构象多态性(sscp)分析、限制性分析、微阵列技术和蛋白质组学。例如,受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态由以下一个或多个步骤来测定:

(i)对来自受试者的dna进行甲基化敏感性内切核酸酶消化;

(ii)用一定量的化合物处理来自所述受试者的核酸,所述化合物在足以诱导核酸中的非甲基化的胞嘧啶残基的诱变的条件下选择性地使其突变并产生突变核酸,并使用至少一种与所述突变核酸选择性杂交的引物扩增所述突变核酸;

(iii)用一定量的化合物处理来自受试者的核酸,所述化合物在足以诱导核酸中的非甲基化的胞嘧啶残基的诱变的条件下选择性地使其突变并产生突变核酸,将能够与所述突变核酸特异性杂交的核酸探针或引物杂交并检测杂交的探针或引物;

(iv)用一定量的化合物处理来自受试者的核酸,所述化合物在足以诱导核酸中的非甲基化的胞嘧啶残基的诱变的条件下选择性地使其突变并产生突变核酸,用启动子-标记的引物扩增所述突变核酸,体外转录所述突变核酸以产生转录物,使转录物经历酶促碱基特异性切割,并诸如通过maldi-tof质谱法测定由突变的半胱氨酸残基产生的任何切割片段的质量和/或大小的差异;

(v)用一定量的化合物处理来自受试者的核酸,所述化合物在足以诱导核酸中的非甲基化的胞嘧啶残基的诱变的条件下选择性地使其突变,由此产生突变核酸,并测定所述突变核酸的核苷酸序列酸;以及

(vi)对来自受试者的dna进行甲基化dna捕获或免疫沉淀以检测和/或捕获来自所述受试者的甲基化dna,并任选地测定所检测和/或捕获的dna片段的核苷酸序列。

用于甲基化dna捕获或免疫沉淀的方法可以是甲基化dna免疫沉淀(medip)或基于甲基-cpg结合结构(mbd)的蛋白(mbdcap)对甲基化dna的捕获。

选择性地使非甲基化的胞嘧啶残基突变的化合物可以是适用于该目的的任何化合物,包括例如亚硫酸氢盐。

可对取自受试者的任何测试样品进行本文公开的方法。例如,可测定在来自受试者的测试样品中一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态,所述测试样品包括含有或疑似含有乳腺癌细胞或乳腺癌细胞的组分的组织和/或体液。样品可包括取自乳腺或淋巴结的组织、细胞和/或其提取物。当样品包括体液时,体液可选自由以下组成的组:全血、血液的级分诸如血清或血浆、尿液、唾液、母乳、胸膜液、汗液、泪液及其混合物。

在本文公开的任何方法中,参考甲基化水平是针对选自由以下组成的组的样品的相应雌激素应答性增强子内的一个或多个cpg二核苷酸序列测定的甲基化水平:

(i)来自正常或健康组织的样品;

(ii)包括非癌性细胞的样品;

(iii)包括不同于被表征为是esr1阴性亚型的乳腺癌细胞的癌性细胞的样品;

(iv)包括不同于被表征为是内分泌疗法难以治疗的esr1阳性亚型的乳腺癌细胞的癌性细胞的样品;

(v)包括表征为是内分泌疗法难以治疗的esr1阳性亚型的乳腺癌细胞的样品;

(vi)包括被表征为响应于内分泌疗法的esr1阳性亚型的乳腺癌细胞的样品;

(vii)(i)至(vi)中任一项的提取物;

(viii)数据集,其包含正常或健康个体或正常或健康个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(ix)数据集,其包含患有不同于esr1阴性乳腺癌亚型的癌症的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(x)数据集,其包含患有不同于内分泌疗法难以治疗的esr1阳性乳腺癌亚型的癌症的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(xi)数据集,其包含患有被表征为是内分泌疗法难以治疗的esr1阳性乳腺癌亚型的乳腺癌的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(xii)数据集,其包含患有被表征为响应于内分泌疗法的esr1阳性乳腺癌亚型的乳腺癌的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;和

(xiii)数据集,其包含所测试的受治疗者中的相应雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平,其中测定了具有正常细胞的匹配样品的甲基化水平。

上述(iii)和/或(iv)中的癌性细胞可以是例如乳腺癌细胞。可选地或另外,上述(ix)和/或(x)中的癌症可以是例如乳腺癌。

在本文公开的任何方法中,所述方法可以额外地提供例如在执行本文公开的诊断或预后方法之后治疗esr1阳性乳腺癌的步骤。这样,本公开的方法可包括例如使用本文所述的任一个或多个实例中描述的本公开的方法诊断esr1阳性乳腺癌,并且基于受试者是被确定为响应于内分泌疗法还是对内分泌疗法具有抗性,施用合适的治疗性化合物或进行手术或推荐利用合适的治疗性化合物的治疗或推荐进行手术。例如,如果在执行本公开的诊断或预后的方法之后,受试者被确定为响应于内分泌疗法,则该方法可包括开始内分泌疗法,例如通过施用适于内分泌疗法的治疗性化合物,或者推荐受试者开始内分泌疗法。在另一个实例中,如果在执行本公开的诊断或预后的方法之后,受试者被确定为对内分泌疗法具有抗性/内分泌疗法难治,则该方法可包括开始不同于内分泌疗法的治疗,例如化学疗法或放射疗法,和/或进行手术,或推荐受试者开始不同于内分泌疗法的治疗,例如化学疗法或放射疗法,和/或推荐手术。

适用于内分泌疗法的药物是本领域所熟知的,并且包括例如阿那曲唑、依西美坦、氟维司群、戈舍瑞林、来曲唑、亮丙瑞林、醋酸亮丙瑞林、甲地孕酮、帕博西尼、他莫昔芬和托瑞米芬。

适用于治疗乳腺癌的化学治疗药物是本领域已知的,但可包括例如多西他赛、紫杉醇、铂剂(顺铂、卡铂)、长春瑞滨、卡培他滨、多柔比星脂质体、吉西他滨、米托蒽醌、伊沙匹隆、白蛋白结合的紫杉醇和艾日布林。

本公开还提供了治疗患有雌激素受体1(esr1)阳性乳腺癌的受试者的方法,其中基于受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的差异甲基化(如相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平测定的)将所述受试者诊断为是内分泌疗法难以治疗的,所述方法包括向所述受试者施用化学疗法和/或放射疗法,和/或对所述受试者进行手术以除去癌症或其部分。

在一个实例中,基于一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的增加,已将受试者诊断为是内分泌疗法难以治疗的。

根据其中受试者已经被诊断为是内分泌疗法难以治疗的的实例,参考甲基化水平是针对选自由以下组成的的样品的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列测定的甲基化水平:

(i)来自正常或健康组织的样品;

(ii)包括非癌性细胞的样品;

(iii)包括不同于被表征为是esr1阴性亚型的乳腺癌细胞的癌性细胞的样品;

(iv)包括不同于被表征为是内分泌疗法难以治疗的esr1阳性亚型的乳腺癌细胞的癌性细胞的样品;

(v)包括被表征为响应分泌疗法的esr1阳性亚型的乳腺癌细胞的样品;

(vi)(i)至(v)中任一项的提取物;

(vii)数据集,其包含正常或健康个体或正常或健康个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(viii)数据集,其包含患有不同于esr1阴性乳腺癌亚型的癌症的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(ix)数据集,其包含患有不同于内分泌疗法难以治疗的esr1阳性乳腺癌亚型的癌症的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(x)数据集,其包含患有响应于内分泌疗法的esr1阳性乳腺癌亚型的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;和

(xi)数据集,其包含所测试的受治疗者中的相应雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平,其中测定了具有正常细胞的匹配样品的甲基化水平。

上述(iii)和/或(iv)中的癌性细胞可以是例如乳腺癌细胞。可选地者或另外,上述(viii)和/或(ix)中的癌症可以是例如乳腺癌。

在一个实例中,所述方法包括向已被诊断为内分泌疗法难以治疗的受试者施用化学疗法。可选地或另外,所述方法包括向已被诊断为内分泌疗法难以治疗的受试者施用放射疗法。可选地或另外,所述方法包括进行手术以从已经被诊断为内分泌疗法难以治疗的受试者中去除癌症或其一部分。例如,受试者可以接受化学疗法和放射疗法,或化学疗法和手术,或放射疗法和手术,或化学疗法,放射疗法和手术。根据其中对被诊断为内分泌疗法难以治疗的受试者进行化疗、放疗和手术的不止一种治疗的实例,可以以任何特定顺序进行各个治疗。

适用于治疗乳腺癌的化学治疗药物在本领域中是已知的并描述于本文中。

本公开还提供了治疗患有雌激素受体1(esr1)阳性乳腺癌的受试者的方法,其中基于受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,所述受试者已被诊断为响应于内分泌疗法,所述方法包括向所述受试者施用内分泌疗法。

在一个实例中,基于一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的降低的甲基化水平,所述受试者被诊断为响应于内分泌疗法,其中参考甲基化水平是针对选自由以下组成的组的样品的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列测定的甲基化水平:

(i)包括被表征为是内分泌疗法难以治疗的esr1阳性亚型的乳腺癌细胞的样品;

(ii)(i)的提取物;和

(iii)数据集,其包含患有内分泌疗法难以治疗的esr1阳性乳腺癌亚型的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平。

在一个实例中,基于对应于或等同于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化水平,所述受试者已被诊断为是响应于内分泌疗法的,其中所述参考甲基化水平是针对选自由以下组成的组的样品的相应雌激素应答性增强子内的一个或多个cpg二核苷酸序列测定的甲基化水平:

(i)包括被表征为是响应于内分泌疗法的esr1阳性亚型的乳腺癌细胞的样品;

(ii)(i)的提取物;和

(iii)数据集,其包含患有响应于内分泌疗法的esr1阳性乳腺癌亚型的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平。

适用于内分泌疗法的药物在本领域中是公知的并且描述于本文中。

在本文公开的任何治疗方法中,所述一个或多个cpg二核苷酸序列在如表1中定义的一个或多个esr1结合位点内。在另一个实例中,所述一个或多个cpg二核苷酸序列在如表2中定义的一个或多个esr1结合位点内。在另一个实例中,所述一个或多个cpg二核苷酸序列在如表3中定义的一个或多个esr1结合位点内。

在本文公开的方法的一个实例中,基于选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的差异甲基化,所述受试者已被诊断为是内分泌疗法难以治疗的或响应于内分泌疗法的。例如,基于选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的差异甲基化,所述受试者被诊断为是内分泌疗法难以治疗的或响应于内分泌疗法的。在一个具体实例中,基于选自表1的第57行、第111-113行、第256-258行、第288-289行、第469-470行、第805行、第821-822行和第824-826行中定义的那些序列的一个或多个cpg二核苷酸序列处的差异甲基化,所述受试者被诊断为是内分泌疗法难以治疗的或是响应于内分泌疗法的。

在本文所公开的方法的另一实例中,基于选自daxx、rxra、ncor2、msi2和/或c8orf46的基因的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的差异甲基化,所述受试者已被诊断为是内分泌疗法难以治疗的或响应于内分泌疗法的。例如,基于选自daxx、rxra、ncor2、msi2和/或c8orf46的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的差异甲基化,所述受试者被诊断为是内分泌疗法难以治疗的或响应于内分泌疗法的。

在本文公开的方法的又一个实例中,基于选自foxa1、esr1和/或gata3的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的差异甲基化,所述受试者已被诊断为是内分泌疗法难以治疗的或响应于内分泌疗法的。

本公开还提供了用于预测患有雌激素受体1(esr1)阳性乳腺癌的受试者的对内分泌疗法的响应的试剂盒,所述试剂盒包含:

(i)一种或多种试剂,其被配置来测定受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态;和

(ii)参考材料,其提供相应的一个或多个cpg二核苷酸序列的参考甲基化水平。

本公开还提供了用于预测接受或即将接受内分泌疗法的受试者中的雌激素受体1(esr1)阳性乳腺癌的治疗结果和/或监测其进展的试剂盒,所述试剂盒包含:

(i)一种或多种试剂,其被配置来测定受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态;和

(ii)参考材料,其提供相应的一个或多个cpg二核苷酸序列的参考甲基化水平。

在本文公开的任何试剂盒中,一种或多种试剂被配置来测定如表1中定义的一个或多个esr1结合位点内的一个或多个cpg二核苷酸序列的甲基化状态。在另一个实例中,一种或多种试剂被配置来测定如表2中定义的一个或多个esr1结合位点内的一个或多个cpg二核苷酸序列的甲基化状态。在另一个实例中,一种或多种试剂被配置来测定如表3中定义的一个或多个esr1结合位点内的一个或多个cpg二核苷酸序列的甲基化状态。

在本公开的试剂盒中可以是特别有用的试剂可以是被配置来测定选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因的雌激素响应性增强内的一个或多个cpg二核苷酸序列的甲基化状态的那些试剂。例如,所述试剂盒可以包含一种或多种试剂,所述试剂被配置来测定选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态。用于包含在本公开的试剂盒中的示例性试剂包括被配置来测定选自表1的第57行、第111-113行、第256-258行、第288-289行、第469-470行、第805行、第821-822行和第824-826行中定义的那些基因组区域的一个或多个基因组区域内的一个或多个cpg二核苷酸序列的甲基化状态的试剂。

在另一个实例中,本公开的试剂盒可以包含一种或多种试剂,所述试剂被配置来测定选自daxx、rxra、ncor2、msi2和/或c8orf46的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态,例如诸如被配置来测定选自daxx、rxra、ncor2、msi2和/或c8orf46的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态的试剂。

在另一个实例中,本公开的试剂盒可包含一种或多种试剂,所述试剂被配置来测定选自foxa1、esr1和/或gata3的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态。

在本文公开的任何试剂盒中,参考甲基化水平是针对选自由以下组成的组的样品的相应基因组区域内的一个或多个cpg二核苷酸序列测定的甲基化水平:

(i)来自正常或健康组织的样品;

(ii)包括非癌性细胞的样品;

(iii)包括不同于被表征为是esr1阴性亚型的乳腺癌细胞的癌性细胞的样品;

(iv)包括不同于被表征为是内分泌疗法难以治疗的esr1阳性亚型的乳腺癌细胞的癌性细胞的样品;

(v)(i)至(iv)中任一项的提取物;

(vi)数据集,其包含正常或健康个体或正常或健康个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(vii)数据集,其包含患有不同于esr1阴性乳腺癌亚型的癌症的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(viii)数据集,其包含患有不同于内分泌疗法难以治疗的esr1阳性乳腺癌亚型外的癌症的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;和

(ix)数据集,其包含所述测试的受试者中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平,其中测定具有正常细胞的匹配样品的甲基化水平。

上述(iii)和/或(iv)中的癌性细胞可以是例如乳腺癌细胞。可选地或另外,上述(vii)和/或(viii)中的癌症可以是例如乳腺癌。

本公开还提供了当用于本文公开的任何一种或多种方法时,本文公开的任何一种试剂盒。

另外,本公开提供了一种或多种试剂在制备药剂中的用途,所述药剂用于预测患有雌激素受体1(esr1)阳性乳腺癌的受试者的对内分泌疗法的响应,其中所述一种或多种试剂被配置来测定受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态。

本公开还提供了一种或多种试剂在制备药剂中的用途,所述药剂用于预测接受或即将接受内分泌疗法的受试者中的雌激素受体1(esr1)阳性乳腺癌的治疗结果和/或监测其进展,其中所述一种或多种试剂被配置来测定所述受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态。

在一个实例中,一种或多种试剂被配置来测定如表1中定义的一个或多个esr1结合位点内的一个或多个cpg二核苷酸序列的甲基化状态。在另一个实例中,一种或多种试剂被配置来测定如表2中定义的一个或多个esr1结合位点内的一个或多个cpg二核苷酸序列的甲基化状态。在另一个实例中,一种或多种试剂被配置来测定如表3中定义的一个或多个esr1结合位点内的一个或多个cpg二核苷酸序列的甲基化状态。

可在制备如本文所公开的药剂中特别有用的试剂可以是被配置来测定选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态的那些试剂。例如,所述药剂可包含一种或多种试剂,所述试剂被配置来测定选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态。用于包含在如本文所述的药剂中的示例性试剂包括被配置来测定选自如表1的第57行、第111-113行、第256-258行、第288-289行、第469-470行、第805行、第821-822行和第824-826行中定义的那些基因组区域的一个或多个基因组区域内的一个或多个cpg二核苷酸序列的甲基化状态的那些试剂。

在另一个实例中,在制备如本文所公开的药剂中特别有用的试剂包括被配置来测定选自daxx、rxra、ncor2、msi2和/或c8orf46的基因的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态的那些试剂,诸如被配置来测定选自daxx、rxra、ncor2、msi2和/或c8orf46的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化状态的试剂。

在另一个实例中,在制备如本文所公开的药剂中特别有用的试剂包括被配置来测定选自foxa1、esr1和/或gata3的基因内的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态的那些试剂。

另外,本文公开的任何方法还可包括向受试者施用治疗性治疗的步骤。例如,esr1阳性乳腺癌的特定亚型(例如,响应于内分泌疗法的esr1阳性乳腺癌或对内分泌疗法具有抗性的esr1阳性乳腺癌)的存在的确定可导致向该受试者施用特定的治疗性治疗,所述治疗性治疗被特别地定制来针对该特定的乳腺癌亚型。

本公开的任何特定方面或实施方案或实施例的每个特征可被加以必要的修改以适用于本公开的任何其他方面或实施方案或实施例。

附图简述

以下附图形成本说明书的一部分,并被包括来进一步说明本公开的某些方面。通过参考这些附图中的一个或多个,结合本文给出的具体实施方案的详细描述,可以更好地理解本公开。

图1.内分泌抗性mcf7细胞模型的全基因组dna甲基化图谱分析。(a-c)显示内分泌抗性mcf7x(a)、tamr(b)和fasr(c)细胞与亲本(内分泌敏感性)mcf7细胞的hm450甲基化谱之间的相关性的比色密度图(colorimetricdensityplot)。该图显示尽管内分泌抗性细胞系的甲基化谱与亲本mcf7细胞强相关(mcf7x,r2=0.895;tamr,r2=0.91;fasr,r2=0.848;皮尔逊系数(pearson’scoefficient)),mcf7x和tamr细胞均大部分获得dna甲基化,然而fasr细胞显示出相对于亲本mcf7细胞的高甲基化和低甲基化事件。(d)显示与亲本mcf7细胞相比(fdr<0.01),在多个内分泌抗性细胞中甲基化程度更高的hm450甲基化的探针的重叠的维恩图。(e)条形图,其显示对于所有内分泌抗性细胞系(与亲本mcf7细胞相比)是共有的跨越如由mcf7chromhmm注释13确定的基因组的功能/调控区的差异甲基化的hm450探针的关联性。条的高度表示富集的水平,其被测量为与功能元件重叠的高甲基化(深蓝色)或低甲基化(浅蓝色)的探针的频率与当此类重叠在基因组中随机发生时预期的频率之间的比率。统计学显著的富集(p值<<0.0001;超几何检验)用星号标记。位于每个特定区域内的常见超/低甲基化的探针的数目示于相应列中。

图2.在内分泌抗性细胞模型中通常被高甲基化的增强子位点的esr1调控。(a)条形图,其显示在内分泌抗性细胞模型中甲基化程度更高的(与mcf7细胞相比)并且还在mcf7细胞中特别位于增强子区域中,跨越esr1、foxa1和gata3结合位点的hm450探针的关联性。条的高度表示富集,其被测量为在增强子中与转录因子结合位点重叠的高甲基化的探针的频率与当此类重叠在整个基因组中随机发生时预期的频率之间的比率(*p值<<0.0001;超几何检验)。位于每个特定区域内的常见高/低甲基化的探针的数目呈现在列中。(b)维恩图,其显示在多个内分泌抗性细胞模型中甲基化程度更高的(与mcf7细胞相比)跨越esr1、foxa1和gata3结合位点的增强子特异性hm450甲基化的探针的重叠。(c)箱线图,其显示与亲本mcf7细胞相比,在tamr细胞中,在包含至少一个通常高甲基化的探针的esr1-增强子位点(黄色框)处和与hm450探针重叠的所有其它esr1增强子位点(灰色框)处的esr1结合信号的对数倍数变化(logfc)。高甲基化er-增强子位点处esr1结合的平均logfc是-2.29,并且所有其他esr1-增强子位点的平均logfc是-0.52(*p<<0.0001;t检验)。(箱线图的须延伸至最极端的数据点,其离框不超过1.5xiqr)。(d)igv屏幕截图,其说明与亲本mcf7细胞相比,在tamr细胞中与甲基化探针重叠的增强子中的esr1结合丧失,所述甲基化探针在内分泌抗性细胞模型中的甲基化程度更高。mcf7chromhmm区域的颜色编码如下:蓝色=增强子,黄色=转录的区域,绿色=启动子,浅蓝色=ctcf,勃艮第酒红(burgundy)=转录的区域。显示mcf7(绿色)、mcf7x(勃艮第酒红)、tamr(橙色)和fasr细胞(红色)的hm450β值,hm450β值代表生物学重复。对于mcf7和tamr细胞,esr1chip数据(蓝色)以一式两份呈现。蓝色方框突出显示了与内分泌抗性特异性高甲基化的区域重叠的esr1增强子。

图3.在人乳腺癌中其表达受esr1增强子高甲基化负面影响的基因的表征。(a)msigdbc2数据库中的在人乳腺癌(n=291)中其表达受esr1增强子高甲基化负面影响的基因的超几何检验。条的高度表示富集的水平,其被测量为与msigdbc2基因集合重叠的基因的数目与当此类重叠在基因组中随机发生时的期望频率之间的比率(p值<<0.0001;超几何检验)。(b)在esr1阳性(红色)(n=174)和esr1阴性(n=588)乳腺癌患者(tgca获得)中其表达与esr1增强子甲基化(n=291)呈负相关的基因集合的无监督聚类(获自tgca乳腺组群的rna-seq数据)。

图4.图5中显示的技术重复之间的相关性的图示。散点图显示图5中所示的多重亚硫酸氢盐-pcr重测序数据的技术重复之间的相关性(r=皮尔逊相关性)。

图5.esr1增强子甲基化与乳腺癌亚型之间的关联性。(a)箱形图,其显示在正常乳腺组织(绿色)(n=97)、luminala(浅蓝色)(n=301)、luminalb(深蓝)(n=52)和esr1阴性(红色)(n=105)乳腺癌(数据获自tcga乳腺癌组群)中,与增强子区域、esr1结合位点重叠并且在内分泌抗性细胞对比亲本mcf7细胞中显示高甲基化的所有hm450探针(n=801个探针)的中位甲基化(*p<0.05,**p<<0.0001;mann-whitneyu检验)。(箱形图的须延伸至最极端的数据点,离框中不超过1.5xiqr)。(b)热图,其显示在正常乳腺组织(绿色)(n=97)、luminala(浅蓝色)(n=301)、luminalb(深蓝色)(n=52)和esr1阴性(红色)(n=105)乳腺癌中,在内分泌抗性细胞对比亲本mcf7细胞中甲基化程度更高的801个esr1-增强子特异性hm450探针的甲基化谱。列是患者样品,行是hm450探针。甲基化水平以色标表示-蓝色表示低水平的甲基化,并且红色表示高水平的甲基化。(c)箱形图,其显示在正常乳腺样品(n=97)(绿色)、luminala(浅蓝色)(n=301)、luminalb(深蓝色)(n=52)和esr1-阴性(红色)(n=105)乳腺癌样品中,甲基化β值在跨越位于daxx增强子内的esr1结合位点(chr6:33288112-33288670)(左图)和daxx启动子区域(转录起始位点上游1000bp和下游100bp)(chr6:33290693-33291793)(右图)重叠的hm450探针的分布。(箱形图的须延伸至最极端的数据点,其离框不超过1.5xiqr)。

图6.人乳腺癌中的获得性内分泌抗性中的esr1-增强子dna高甲基化。(a-d)(左图)散点图,其显示在来自接受辅助内分泌疗法并经历无复发生存(rfs)(绿色)的患者的3个原发性luminala乳腺癌、来自在辅助内分泌疗法后复发(n/rfs)(蓝色)以及其匹配的局部复发(红色)的患者的3个原发性luminala乳腺癌中,跨越目标esr1增强子区域(a-gata3–chr10:8103616-8103673;b-itpk1-chr14:93412603-93412703;c-esr1-chr6:152124782-152125008;d-get4-chr7:922042-922114)的个体cpg位点的甲基化。每个点表示单个患者的个体cpg位点处的甲基化百分数,线表示原发性rfs(绿色)、原发性n/rfs(蓝色)和匹配的复发性肿瘤(红色)中该区域的平均甲基化。(右图)箱形图,其显示在左图中针对rfs(绿色)、预后/rfs(蓝色)和匹配的复发性肿瘤(红色)描述的跨越esr1增强子区域的甲基化值的分布;p值对应于rfs对比n/rfs之间和n/rfs对比复发性肿瘤之间的t检验比较。(箱形图的须延伸到最极端的数据点,其离框不超过1.5xiqr)。

图7.获得性内分泌抗性的细胞模型中的esr1-增强子dna高甲基化。(a-i)(左图)散点图,其显示亲本mcf7细胞(绿色)和内分泌抗性衍生物tamr(橙色)、mcf7x(紫色)和fasr(红色)中跨越目标esr1增强子区域(a-daxx-chr6:33288296-33288372;b-get4-chr7:922042-922114;c-esr1-chr6:152124782-152125008;d-ncor2-chr12:124844786-124844883;e-gata3–chr10:8103616-8103673;f-itpk1-chr14:93412603-93412703;g-rxra-chr9:137252867-137252967;h-msi2-chr17:55371693-55371786;i-c8orf46-chr8:67425069-67425134)的个体cpg位点的甲基化。每个点表示个别cpg位点处的甲基化百分数,并且线代表该区域的平均甲基化。(右图)箱形图,其显示在左图中针对亲本mcf7细胞(绿色)和内分泌抗性衍生物tamr(橙色)、mcf7x(紫色)和fasr(红色)描述的跨越esr1增强子区域的甲基化值的分布(平均值±sd)(*p<0.05,**p<0.01,***p<0.001;t检验)。(箱形图的须延伸到最极端的数据点,其离框不超过1.5xiqr。)

图8.图7中呈现的技术重复之间的相关性的图示。散点图,其显示图7中呈现的多重亚硫酸氢盐-pcr重测序数据的技术重复之间的相关性(r=皮尔逊相关性)。

图9.人乳腺癌中的获得性内分泌抗性中的esr1增强子dna高甲基化。(a-e)(左图)散点图,其显示在来自接受辅助内分泌疗法并表现出无复发生存(rfs)(绿色)的患者的3个原发性luminala乳腺癌、来自在辅助内分泌疗法后复发(定义为无无复发生存(n/rfs)(蓝色))以及其匹配的局部复发(红色)的患者的3个原发性luminala乳腺癌中,跨越目标esr1增强子区域(a-daxx-chr6:33288296-33288372;b-msi2-chr17:55371693-55371786;c-ncor2-chr12:124844786-124844883;d-rxra-chr9:137252867-137252967;e-c8orf46-chr8:67425069-67425134)的个体cpg位点的甲基化。每个点表示单个患者的个体cpg位点处的甲基化百分数,线表示原发性rfs(绿色)、原发性n/rfs(蓝色)和匹配的复发性肿瘤(红色)中该区域的平均甲基化。(右图)箱形图,其显示在左图中针对rfs(绿色)、预后/rfs(蓝色)和匹配的复发性肿瘤(红色)描述的跨越esr1增强子区域的甲基化值的分布;p值对应于rfs对比n/rfs和n/rfs对比复发性肿瘤之间的t检验比较。(箱形图的须延伸到最极端的数据点,其离框不超过1.5xiqr)。

图10.该图提供了说明本公开的计算机系统的流程图,所述计算机系统可用于预测患有esr1阳性乳腺癌的受试者中对内分泌疗法的响应。

序列表的关键:

seqidno:1:命名为gata3_ct_f2的亚硫酸氢盐-pcr引物的dna序列

seqidno:2:命名为gata3_ct_f2的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:3:命名为gata3_ct_r2的亚硫酸氢盐-pcr引物的dna序列

seqidno:4:命名为gata3_ct_r2的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:5:命名为esr1_ct_f1的亚硫酸氢盐-pcr引物的dna序列

seqidno:6:命名为esr1_ct_f1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:7:命名为esr1_ct_r1的亚硫酸氢盐-pcr引物的dna序列

seqidno:8:命名为esr1_ct_r1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:9:命名为esr1_ct_f2的亚硫酸氢盐-pcr引物的dna序列

seqidno:10:命名为esr1_ct_f2的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:11:命名为esr1_ct_r2的亚硫酸氢盐-pcr引物的dna序列

seqidno:12:命名为esr1_ct_r2的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:13:命名为get4_ct_f1的亚硫酸氢盐-pcr引物的dna序列

seqidno:14:命名为get4_ct_f1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:15:命名为get4_ct_r1的亚硫酸氢盐-pcr引物的dna序列

seqidno:16:命名为get4_ct_r1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:17:命名为itpk1_ct_f1的亚硫酸氢盐-pcr引物的dna序列

seqidno:18:命名为itpk1_ct_f1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:19:命名为itpk1_ct_r2的亚硫酸氢盐-pcr引物的dna序列

seqidno:20:命名为itpk1_ct_r2的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:21:命名为msi2_ct_f2的亚硫酸氢盐-pcr引物的dna序列

seqidno:22:命名为msi2_ct_f2的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:23:命名为msi2_ct_r2的亚硫酸氢盐-pcr引物的dna序列

seqidno:24:命名为msi2_ct_r2的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:25:命名为c8orf46_ga_f1的亚硫酸氢盐-pcr引物的dna序列

seqidno:26:命名为c8orf46_ga_f1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:27:命名为c8orf46_ga_r1的亚硫酸氢盐-pcr引物的dna序列

seqidno:28:命名为c8orf46_ga_r1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:29:命名为daxx_ga_f2的亚硫酸氢盐-pcr引物的dna序列

seqidno:30:命名为daxx_ga_f2的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:31:命名为daxx_ga_r2的亚硫酸氢盐-pcr引物的dna序列

seqidno:32:命名为daxx_ga_r2的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:33:命名为ncor2_ga_f1的亚硫酸氢盐-pcr引物的dna序列

seqidno:34:命名为ncor2_ga_f1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:35:命名为ncor2_ga_r1的亚硫酸氢盐-pcr引物的dna序列

seqidno:36:命名为ncor2_ga_r1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:37:命名为rxra_ga_f1的亚硫酸氢盐-pcr引物的dna序列

seqidno:38:命名为rxra_ga_f1的亚硫酸氢盐-pcr融合引物的dna序列

seqidno:39:命名为rxra_ga_r1的亚硫酸氢盐-pcr引物的dna序列

seqidno:40:命名为rxra_ga_r1的亚硫酸氢盐-pcr融合引物的dna序列

详述

总述

在整个说明书中,除非另有特别说明或上下文另有要求,否则提及单一步骤、物质组合物、步骤组或物质组合物组应当用来包括一个和多个(即,一个或多个)那些步骤、物质组合物、步骤组或物质组合物组。

如本文中所用,除非上下文另有明确规定,否则单数形式的“一个/种(a)”、“和(and)”以及“该(the)”包括这些词的复数形式。

术语“和/或”,例如“x和/或y”应理解为意是指“x和y”或“x或y”,并且应被认为是对两种含义或任一含义提供明确的支持。

在整个本说明书中,词语“包含(comprise)”或者诸如“包括(comprises)”或“含有(comprising)”的变型将被理解为暗示包括所陈述的元素、整体或者步骤,或者元素、整体或步骤的组,但不排除任何其他元素、整体或步骤,或者元素、整体或步骤的组。

选择的定义

如本文中所用,术语“诊断(diagnosis)”及其变型(诸如但不限于“诊断(diagnose)”或“诊断(diagnosing)”)应包括但不限于临床状态的初步诊断或临床状态的任何初步诊断。本文所述的诊断方法也可用于评估受试者对特定形式的疗法的响应性,诸如确定患有癌症的受试者是否会响应于内分泌疗法。本文所述的诊断方法也可用于评估受试者的缓解,或监测疾病复发或肿瘤复发(诸如在手术、放射疗法、辅助疗法或化学疗法之后)或确定原发性肿瘤转移灶的外观。本文所述的测定法的所有此类用途均被本公开所涵盖。

如本文中所用,术语“预后(prognosis)”及其变型(诸如但不限于“预后(prognosing)”)应指癌症患者(例如乳腺癌患者)将具有可归因于癌症的死亡,或者癌症将在受试者中进展至恶化阶段,诸如复发或转移扩散,或者癌症将具有或发展抗药性(诸如对内分泌疗法的抗性)的可能性的预测。

如本文中所用,术语“癌症”应被理解为包括特征在于受试者体内的细胞不受控制的生长的疾病。术语“癌症”不应限于特定组织或细胞类型的癌症。本领域技术人员将会意识到,随着癌症进展,转移发生在原发性癌症部位外的器官和组织中。因此,如本文使用的术语“癌症”应被认为包括除了原发性肿瘤以外的癌症转移。在本公开的上下文中特别优选的癌症是乳腺癌。

如本文中所用,术语“乳腺癌”应被理解为包括特征在于受试者乳腺组织细胞的不受控制生长的疾病。

如本文中所用,术语“雌激素受体1(esr1)阳性乳腺癌”应理解为指这样的乳腺癌,其特征在于当与非癌性样品或esr1阴性癌性样品比较时,esr1基因表达增加,或者特征在于与管家基因的表达水平不同的esr1基因的表达水平。

如本文中所用,术语“雌激素受体1(esr1)阴性乳腺癌”应理解为指这样的乳腺癌,其特征在于当与非癌性样品或esr1阳性癌性样品比时,esr1基因表达降低,或者其特征在于与管家基因的表达水平没有显著不同的esr1基因的表达水平,或者其特征在于不存在可检测水平的esr1基因表达,或者其特征在于不存在esr1基因表达。

如本文中所用,术语“雌激素应答性增强子”、“多个雌激素应答性增强子”或类似术语是指与雌激素结合的雌激素受体蛋白(包括结合于雌激素的雌激素受体1(esr1)蛋白)结合以激活基因的转录的基因组的一个或多个区域。应理解的是,“雌激素应答性增强子”可以位于其激活的基因内,或者可以是顺式作用的并且远离其激活的基因,例如在基因起始位点的上游或下游,或者位于基因组的无关部分。例如,“雌激素应答性增强子”可以根据本文实施例2所述的手段来定义,并且特别地使用taberlay等(2014)所述的chromhmm分割程序来定义。

如本文中所用,术语“雌激素受体1结合位点”、“esr1结合位点”或类似术语是指与esr1蛋白(例如包括游离的esr1蛋白或与雌激素结合的esr1蛋白)结合的基因组区域。“雌激素应答性增强子”可包含一个或多个“雌激素受体1结合位点”。

术语“内分泌疗法”被提供给通过用拮抗剂阻断受体结合或通过剥夺癌症例如乳腺癌的雌激素来靶向雌激素受体例如esr1的那些治疗。在本公开的上下文中,术语“内分泌疗法”应包括利用抑制雌激素例如作用于乳腺癌细胞的药剂或化合物的疗法或治疗。此类疗法在被确定为雌激素受体阳性的(即,表达雌激素受体蛋白)的乳腺癌(诸如为esr1阳性的乳腺癌)的治疗中是常规的。适用于内分泌疗法的药物是本领域公知的,并且包括例如阿那曲唑、依西美坦、氟维司群、戈舍瑞林、来曲唑、亮丙瑞林、醋酸亮丙瑞林、甲地孕酮、帕博西尼、他莫昔芬和/或托瑞米芬。

如本文中所用,被表征为对内分泌疗法是“抗性的”或“难治性的”或对内分泌疗法具有“抗性”的乳腺癌是指不响应或不会响应利用内分泌疗法的治疗的乳腺癌。

如本文中所用,术语“肿瘤”是指所有赘生性细胞的生长和增殖(无论是恶性的还是良性的),以及所有癌前和癌性细胞及组织。还将理解的是,在患有癌症的患者的情形中,术语“肿瘤样品”或类似术语是指包含获自癌症患者的肿瘤材料的样品。该术语涵盖肿瘤组织样品,例如通过手术切除获得的组织和通过活组织检查(诸如例如芯活组织检查或细针活组织检查)获得的组织。在一个具体的实施方案中,肿瘤样品是固定的蜡包埋的组织样品,诸如福尔马林固定的石蜡包埋的组织样品。此外,术语“肿瘤样品”涵盖包含从不同于原发性肿瘤的部位获得的肿瘤细胞例如循环肿瘤细胞的样品。

如本文中所用,术语“测试样品”被认为意指取自患有或疑似患有乳腺癌的受试者的任何组织或体液样品。因此,受试者中乳腺癌的存在可能已被确定。因此,本公开的方法可用于确定已知患有esr1阳性生乳腺癌的受试者的乳腺癌的特定亚型(诸如响应于内分泌疗法的esr1阳性乳腺癌或对内分泌疗法有抗性的esr1阳性乳腺癌)。因此,“测试样品”可以是如本文所定义的“肿瘤样品”。或者,本公开的方法可用于确定其中乳腺癌的存在先前尚未被确定的受试者中存在乳癌例如,诸如esr1阳性乳腺癌。

如本文中所用,术语“甲基化”将被理解为意指通过dna甲基转移酶的作用而添加到核酸的区域(例如基因组dna)中的一个或多个胞嘧啶碱基上的甲基基团的存在。因此,如本文中所用,术语“甲基化状态”是指甲基化在特定核酸区域(例如基因组区域)中的存在或不存在。特别地,本公开涉及甲基化的胞嘧啶(5-甲基胞嘧啶)的检测。核酸序列可包含一个或多个cpg甲基化位点。

如本文中所用,术语“差异甲基化”将被认为意指获自受试者的生物样品(例如,诸如细胞或细胞提取物)或体液(诸如血液)中的核酸(例如基因组dna)的甲基化的相对量的变化。在一个实例中,术语“差异甲基化”是核酸甲基化水平的升高。在另一个实例中,术语“差异甲基化”是核酸甲基化水平的降低。在本公开中,通常参照给定的基因组区域的甲基化的基线水平(诸如非癌性样品,包括来自已知患有癌症例如乳腺癌的受试者的非癌性匹配样品)来确定“差异甲基化”。例如,差异甲基化的水平可以比基线甲基化水平高或低至少2%,例如比基线甲基化水平高或低至少5%,或比基线水平高或低至少10%,或比基线甲基化水平高或低至少15%,或比基线甲基化水平高或低至少20%,或比基线水平高或低至少25%,或比基线甲基化水平高或低至少30%,或比基线甲基化水平高或低至少40%,或者比基线甲基化水平高或低至少50%,或者至少低于或等于基线水平或低至少60%,或者比基线甲基化水平高或低至少70%,或比基线甲基化水平高或低至少80%,或者比基线水平高或低至少90%。因此,差异甲基化的水平可以比基线甲基化水平水平高或低至少10%,至少15%,至少20%或至少25%。例如,差异甲基化的水平可以比基线甲基化水平高至少10%,至少15%,至少20%或至少25%。

如本文中所用,“cpg二核苷酸”、“cpg甲基化位点”或等效物应被认为是指通过磷酸二酯键与鸟嘌呤连接的胞嘧啶。cpg二核苷酸是胞嘧啶残基甲基化的靶标,并且可位于编码或非编码核酸内。非编码核酸在本领域中被理解为包括基因组基因的内含子、5'-非翻译区、3'非翻译区、启动子区,或基因间区域。

如本文中所用,“参考甲基化水平”应被理解为包括在来自正常或健康细胞或组织或体液的相应核酸中检测到的甲基化水平,或使用来自正常或健康细胞或组织或体液的信息产生的数据集。“参考甲基化水平”还可包括在来自内分泌疗法难以治疗的患有esr1阳性乳腺癌的受试者的细胞或组织或体液的相应核酸中检测到的甲基化水平,或者使用来自内分泌疗法难以治疗的患有esr1阳性乳腺癌的受试者的细胞或组织或体液的信息产生的数据集,即提供内分泌疗法难以治疗的受试者的基线甲基化水平。“参考甲基化水平”还可包括在来自响应于内分泌疗法的患有esr1阳性乳腺癌的受试者的细胞或组织或体液的相应核酸中检测到的甲基化水平,或使用来自响应于内分泌疗法的患有esr1阳性乳腺癌的受试者的细胞或组织或体液的信息产生的数据集,即提供响应于内分泌疗法的受试者的基线甲基化水平。例如,“参考甲基化水平”可以是来自以下样品的相应核酸中的甲基化水平:

(i)来自正常或健康组织的样品;

(ii)包括非性癌细胞的样品;

(iii)包括不同于被表征为是esr1阴性亚型的乳腺癌细胞的癌性细胞的样品;

(iv)包括不同于被表征为是内分泌疗法难以治疗的esr1阳性亚型的乳腺癌细胞的癌性细胞的样品;

(v)包括被表征为是内分泌疗法难以治疗的esr1阳性亚型的乳腺癌细胞的样品;

(vi)包括被表征为响应于内分泌疗法的esr1阳性亚型的乳腺癌细胞的样品;

(vii)(i)至(vi)中任一项的提取物;

(viii)数据集,其包含正常或健康个体或正常或健康个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(ix)数据集,其包含患有不同于esr1阴性乳腺癌亚型的癌症的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(x)数据集,其包含患有不同于内分泌疗法难以治疗的esr1阳性乳腺癌亚型的癌症的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(xi)数据集,其包含患有被表征为是内分泌疗法难以治疗的esr1阳性乳腺癌亚型的乳腺癌的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;

(xii)数据集,其包含患有被表征为响应于内分泌疗法的esr1阳性乳腺癌亚型的乳腺癌的个体或个体的群体中的相应的雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平;和

(xiii)数据集,其包含所测试的受治疗者中的相应雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化水平,其中测定了具有正常细胞的匹配样品的甲基化水平。

优选地,非癌性样品是(i)或(ii)或(viii)或(xi)。

在一个实例中,参考甲基化水平可以是针对健康乳腺上皮细胞的相应基因组区域内的一个或多个cpg二核苷酸序列确定的甲基化水平。因此,正常或健康的细胞或组织可包括乳腺上皮细胞。另外,“非癌性细胞”可以是乳腺上皮细胞。正常或健康细胞或组织或非癌性细胞的提取物可以是来自乳腺上皮细胞的提取物。

如本文中所用,术语“受试者”或“患者”应被认为意指任何动物,包括人,优选哺乳动物。示例性受试者包括但不限于人、灵长类动物、家畜(例如绵羊、牛、马、驴、猪)、伴侣动物(例如狗、猫)、实验室试验动物(例如小鼠、兔、大鼠、豚鼠、仓鼠)、圈养野生动物(如狐狸、鹿)。优选地,哺乳动物是人或灵长类动物。更优选地,哺乳动物是人。

dna甲基化生物标志物

本公开提供了用于检测患有esr1阳性乳腺癌的受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的差异甲基化的方法,所述方法包括对来自受试者的样品进行测定,所述测定被配置来测定受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处的甲基化状态;以及检测受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,检测一个或多个cpg二核苷酸序列处的差异甲基化可包括将受试者中的一个或多个cpg二核苷酸序列处的甲基化水平与相应的一个或多个cpg二核苷酸序列的参考甲基化水平进行比较,以及确定所述受试者中的所述一个或多个cpg二核苷酸序列处的甲基化是否与相应的参考甲基化水平不同。

本公开还提供了用于预测患有esr1阳性乳腺癌的受试者中的对内分泌疗法的响应的方法,所述方法包括检测受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸的甲基化状态,以及测定所述受试者中的所述一个或多个cpg二核苷酸处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,其中受试者中的所述一个或多个cpg二核苷酸序列处相对于参考水平的差异甲基化指示受试者可能响应于内分泌疗法。例如,确定一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处相对于参考水平的甲基化增加可表明内分泌疗法难以治疗的esr1阳性乳腺癌。

本公开还提供了用于诊断患有esr1阳性乳腺癌的受试者的内分泌疗法难以治疗的esr1阳性乳腺癌的方法,所述方法包括检测受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸的甲基化状态,以及测定所述受试者中的所述一个或多个cpg二核苷酸处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,其中所述受试者中的所述一个或多个cpg二核苷酸处相对于参考水平的差异甲基化指示受试者患有内分泌疗法难以治疗的乳腺癌。

本公开还提供了用于预测接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗结果和/或监测其进展的方法,所述方法包括检测所述受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸的甲基化状态,以及测定所述受试者中的所述一个或多个cpg二核苷酸处相对于对应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,其中所述受试者中的所述一个或多个cpg二核苷酸处相对于参考水平的差异甲基化指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列处相对于参考水平的甲基化增加,可指示内分泌疗法难以治疗的esr1阳性乳腺癌和/或受试者不响应于内分泌疗法。

在前述方法中的任何一种中,鉴定受试者的一个或多个cpg二核苷酸处相对于参考水平的差异甲基化,可用于确定esr1阳性乳腺癌是luminala乳腺癌亚型还是luminalb乳腺癌亚型。因此,本公开的方法还可包括确定esr1阳性乳腺癌是luminala乳腺癌亚型还是luminalb乳腺癌亚型。

一个或多个cpg二核苷酸序列可位于一个或多个雌激素应答性增强子内的一个或多个esr1结合位点内。例如,所述一个或多个cpg二核苷酸序列可在表1中所示的一个或多个esr1结合位点内。参考人基因组大会第19版(“hg19”)来定义表1中所示的esr1结合位点。如本文中所用,“hg19”是指2009年2月人参考序列(参考基因组参考联盟grch37(genomereferenceconsortiumgrch37)),其由国际人类基因组测序联盟产生。根据ncbi大会数据库中的参考基因组参考联盟grch37提供了关于该大会的更多信息。因此,可使用表1中(或在本文公开的任何表中)描述的“起始”和“终止”位置,参考hg19鉴定表1中(或在本文公开的任何表中)鉴定的每个区域的核苷酸序列。

表1中所列的856个基因组区域涵盖esr1结合位点,所述esr1结合位点与在多个内分泌抗性模型(即,mcf7衍生的细胞系,他莫昔芬抗性(tamr)10、氟维司群抗性(fasr)11和雌激素剥夺抗性(mcf7x)12细胞)中相对于esr1阳性激素敏感性mcf7细胞包含高甲基化cpg二核苷酸的雌激素应答性增强子区域重叠。发现表1中所列的856个基因组区域处的甲基化增加与esr1结合的减少相关。对于表1中所示的每个esr1结合位点,提供以下信息:

(i)染色体id(第2列);

(ii)esr1结合位点相对于hg19的基因组坐标(第3-4列);

(iii)esr1结合位点名称(第5列);

(iv)esr1结合位点所在的基因的名称(第6列);和

(v)高甲基化是否导致tamr细胞中esr1结合的丧失

表1.高甲基化的esr1增强子结合位点

在一个实例中,检测差异甲基化的方法包括检测患有esr1阳性乳腺癌的受试者中的表1的第1-856行所示的一个或多个区域内的一个或多个cpg二核苷酸序列处,相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的如表1中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。

在另一个实例中,检测差异甲基化的方法包括检测患有esr1阳性乳腺癌的受试者中的如表1中定义的任何基因组区域内的两个或更多个cpg二核苷酸处,相对于相应两个或更多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的表1中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸,或8个或更多个cpg二核苷酸,或9个或更多个cpg二核苷酸,或者10个或更多个cpg二核苷酸,或者20个或更多个cpg二核苷酸,或者30个或更多个cpg二核苷酸,或者40个或更多个cpg二核苷酸,或者50个或更多个cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即可以是不邻接的)。

在另一个实例中,检测差异甲基化的方法包括检测患有esr1阳性乳腺癌的受试者中的表1中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的表1中所示的2个或更多个,或3个或更多,或4个或更多,或5个或更多,或6个或更多,或7个或更多,或8个或更多个,或9个或更多,或10个或更多个不同基因组区域内的cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。

在一个实例中,鉴定出受试者中的表1的第1-856行中所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于对应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者可能响应于内分泌疗法。

检测出如表1中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处的差异甲基化可指示受试者可能响应对内分泌疗法。

或者,检测出如表1中定义的任何基因组区域内的两个或更多个cpg二核苷酸处的差异甲基化可指示受试者可能响应于内分泌疗法。例如,检测出表1中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸或8个或更多的cpg二核苷酸,或9个或更多个cpg二核苷酸,或10个或更多个cpg二核苷酸,或20个或更多个cpg二核苷酸,或30个或更多个cpg二核苷酸,或40个或更多个cpg二核苷酸,或50个或更多个cpg二核苷酸列处的差异甲基化,可指示受试者可能响应于内分泌疗法。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以不连续的(即可以是不邻接的)。

检测出表1中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸处的差异甲基化可指示受试者可能响应于内分泌疗法。例如,检测出表1中所示的2个或更多个,或3个或更多个,4个或更多个,或5个或更多个,或6个或更多个,或7个或更多个,或8个或更多个,或9个或更多个,或10个或更多个不同的基因组区域内的cpg二核苷酸处的差异甲基化,可指示受试者可能响应于内分泌疗法。

在一个实例中,鉴定出受试者中的表1的第1-856行中所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者患有内分泌疗法难以治疗的乳腺癌。

检测出如表1中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处的差异甲基化可指示受试者患有内分泌疗法难以治疗的乳腺癌。

或者,检测出如表1中定义的任何基因组区域内的两个或更多个cpg二核苷酸处的差异甲基化可指示受试者患有内分泌疗法难以治疗的乳腺癌。例如,检测出表1中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸,或8个或更多个cpg二核苷酸,或者9个或更多个cpg二核苷酸,或者10个或更多个cpg二核苷酸,或者20个或更多个cpg二核苷酸,或者30个或更多个cpg二核苷酸,或者40个或更多个cpg二核苷酸,或者50个或更多个cpg二核苷酸处的差异甲基化,可指示受试者患有内分泌疗法难以治疗的乳腺癌。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即可以是不邻接的)。

检测出表1中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸处的差异甲基化可指示受试者患有内分泌疗法难以治疗的乳腺癌。例如,检测出表1中所示的2个或更多个,或3个或更多个,或4个或更多个,或5个或更多个,或6个或更多个,或7个或更多个,或8个或更多个,或9个或更多个,或10个或更多个不同基因组区域内的cpg二核苷酸处的差异甲基化,可指示受试者患有内分泌疗法难以治疗的乳腺癌。

在一个实例中,鉴定出受试者中的表1的第1-856行中所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于对应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,可指示esr1阳性乳腺癌的可能治疗结果和/或进展。

检测出如表1中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处的差异甲基化可指示esr1阳性乳腺癌的可能治疗结果和/或进展。

或者,检测出如表1中定义的任何基因组区域内的两个或更多个cpg二核苷酸处的差异甲基化可指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,检测出表1中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸,或8个或更多个cpg二核苷酸,或者9个或更多个cpg二核苷酸,或者10个或更多个cpg二核苷酸,或者20个或更多个cpg二核苷酸,或者30个或更多个cpg二核苷酸,或者40个或更多个cpg二核苷酸,或者50个或更多个cpg二核苷酸处的差异甲基化,可指示esr1阳性乳腺癌的可能治疗结果和/或进展。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即可以是不邻接的)。

检测出表1中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸处的差异甲基化可指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,检测出表1中所示的2个或更多个,或3个或更多个,或4个或更多个,或5个或更多个,或6个或更多个,或7个或更多个,或8个或更多个,或9个或更多个,或10个或更多个不同的基因组区域内的cpg二核苷酸处的甲基化差异,可指示esr1阳性乳腺癌的可能治疗结果和/或进展。

在另一个实例中,本公开的方法可包括测定在基因内的一个或多个esr1结合位点内的一个或多个cpg二核苷酸序列的甲基化状态。例如,所述一个或多个cpg二核苷酸序列可以在表2中所示的617个基因内esr1结合位点中的一个或多个内。表2中所列的617个基因组区涵盖基因内esr1结合位点,所述esr1结合位点与雌激素应答性增强子区域重叠并且在多个内分泌抗性模型(即,mcf7衍生的细胞系,他莫昔芬抗性(tamr)10、氟维司群抗性(fasr)11和雌激素剥夺抗性(mcf7x)12细胞)中相对于esr1阳性激素敏感性mcf7细胞包含高甲基化cpg二核苷酸。

也参考hg19定义表2中所示的esr1结合位点。因此,可使用表2中(或本文公开的表中的任何表中)所述的”起始”和“终止”位置,通过参考hg19鉴定表2中(或本文公开的表中的任何表中)鉴定的区域中的每个区域的核苷酸序列。对于表2中所示的每个esr1结合位点,提供了以下信息:

(i)染色体id(第2列);

(ii)esr1结合位点相对于hg19的基因组坐标(第3-4列);

(iii)esr1结合位点名称(第5列);

(iv)与esr1结合位点最紧密相关的基因的名称(第6列);

(v)tcga中甲基化与基因表达之间的反相关性(第7列);

(vi)spearman的rho(第8列);

(vii)相关性p值(第9列);和

(viii)每个esr1结合位点的hm450k探针的数目(第10列)。

表2.高基因内的雌激素增强子中的甲基化esr1结合位点

在一个实例中,检测差异甲基化的方法包括鉴定患有esr1阳性癌症的受试者中的表2的第1-617行所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的如表2中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。

在另一个实例中,检测差异甲基化的方法包括检测患有esr1阳性乳腺癌的受试者中的如表2中定义的任何基因组区域内的两个或更多个cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的表2中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸,或8个或更多个cpg二核苷酸,或9个或更多个cpg二核苷酸,或10个或更多个cpg二核苷酸,或20个或更多个cpg二核苷酸,或30个或更多个cpg二核苷酸,或40个或更多个cpg二核苷酸,或50个或更多个cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即可以是不邻接的)。

在另一个实例中,检测差异甲基化的方法包括检测患有esr1阳性乳腺癌的受试者中的表2中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的表2中所示的2个或更多个,或3个或更多,或4个或更多,或5个或更多,或6个或更多,或7个或更多,或8个或更多个,或9个或更多,或10个或更多个不同基因组区域内的cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。

在一个实例中,鉴定出受试者中的表2的第1-617行中所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于对应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者可能响应于内分泌疗法。

检测出如表2中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处的差异甲基化可指示受试者可能响应于内分泌疗法。

或者,检测出如表2中定义的任何基因组区域内的两个或更多个cpg二核苷酸处的差异甲基化可指示受试者可能响应于内分泌疗法。例如,检测出表2中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸或8个或更多的cpg二核苷酸,或9个或更多个cpg二核苷酸,或10个或更多个cpg二核苷酸,或20个或更多个cpg二核苷酸,或30个或更多个cpg二核苷酸,或40个或更多个cpg二核苷酸,或50个或更多个cpg二核苷酸列处的差异甲基化,可指示受试者可能响应于内分泌疗法。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即可以是不邻接的)。

检测出表2中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸处的差异甲基化可指示受试者可能响应于内分泌疗法。例如,检测出表2中所示的2个或更多个,或3个或更多个,4个或更多个,或5个或更多个,或6个或更多个,或7个或更多个,或8个或更多个,或9个或更多个,或10个或更多个不同的基因组区域内的cpg二核苷酸处的差异甲基化,可指示受试者可能响应于内分泌疗法。

在一个实例中,鉴定出受试者中的表2的第1-617行中所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,可指示受试者患有内分泌疗法难以治疗的乳腺癌。

检测出如表2中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处的差异甲基化可指示受试者患有内分泌疗法难以治疗的乳腺癌。

或者,检测出如表2中定义的任何基因组区域内的两个或更多个cpg二核苷酸处的差异甲基化可指示受试者患有内分泌疗法难以治疗的乳腺癌。例如,检测出表2中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸,或8个或更多个cpg二核苷酸,或9个或更多个cpg二核苷酸,或10个或更多个cpg二核苷酸,或20个或更多个cpg二核苷酸,或30个或更多个cpg二核苷酸,或40个或更多个cpg二核苷酸,或50个或更多个cpg二核苷酸处的差异甲基化,可指示受试者患有内分泌疗法难以治疗的乳腺癌。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即可以是不邻接的)。

检测出表2中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸处的差异甲基化可指示受试者患有内分泌疗法难以治疗的乳腺癌。例如,检测出表2中所示的2个或更多个,或3个或更多个,或4个或更多个,或5个或更多个,或6个或更多个,或7个或更多个,或8个或更多个,或9个或更多个,或10个或更多个不同基因组区域内的cpg二核苷酸处的差异甲基化,可表明受试者患有内分泌疗法难以治疗的乳腺癌。

在一个实例中,鉴定出受试者中的表2的第1-617行中所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示esr1阳性乳腺癌的可能治疗结果和/或进展。

检测出如表2中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处的差异甲基化可指示esr1阳性乳腺癌的可能治疗结果和/或进展。

或者,检测出如表2中定义的任何基因组区域内的两个或更多个cpg二核苷酸处的差异甲基化可指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,检测出表2中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸,或8个或更多个cpg二核苷酸,或9个或更多个cpg二核苷酸,或10个或更多个cpg二核苷酸,或20个或更多个cpg二核苷酸,或30个或更多个cpg二核苷酸,或40个或更多个cpg二核苷酸,或50个或更多个cpg二核苷酸处的差异甲基化,可指示esr1阳性乳腺癌的可能治疗结果和/或进展。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即可以是不邻接的)。

检测出表2中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸处的差异甲基化可指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,检测出表2中所示的2个或更多个,或3个或更多个,或4个或更多个,或5个或更多个,或6个或更多个,或7个或更多个,或8个或更多个,或9个或更多个,或10个或更多个不同的基因组区域内的cpg二核苷酸处的甲基化差异,可指示esr1阳性乳腺癌的可能治疗结果和/或进展。

在表1中所示的esr1结合位点中,那些位点中的328个位点的高甲基化与与各个esr1结合位点最紧密相关的基因的表达降低相关(表3)。这328个esr1结合位点代表了291个独特的基因。因此,本公开的方法可包括测定表3中所示的esr1结合位点中的一个或多个内的一个或多个cpg二核苷酸序列的甲基化状态。也参考hg19来定义表3中所示的esr1结合位点。因此,可使用表3中(或本文公开的表中的任何表中)所述的”起始”和“终止”位置,通过参考hg19鉴定表3中(或本文公开的表中的任何表中)鉴定的区域中的每个区域的核苷酸序列。

对于表3中所示的每个esr1结合位点,提供了以下信息:

(i)染色体id(第2列);

(ii)esr1结合位点相对于hg19的基因组坐标(第3-4列);

(iii)esr1结合位点名称(第5列);

(iv)与esr1结合位点最紧密相关的基因的名称(第6列);

(v)tcga中甲基化与基因表达之间的反相关性(第7列);

(vi)spearman的rho(第列);

(vii)相关性p值(第9列);和

(viii)每个esr1结合位点的hm450k探针的数目(第10列)。

表3.雌激素增强子区域中的高甲基化的esr1结合位点与降低的基因表达相关

在一个实例中,检测差异甲基化的方法包括鉴定患有esr1阳性乳腺癌的受试者中的表3的第1-328行中所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的如表3中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。

在另一个实例中,检测差异甲基化的方法包括检测患有esr1阳性乳腺癌的受试者中的如表3中定义的任何基因组区域内的两个或更多个cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的表3中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸,或8个或更多个cpg二核苷酸,或9个或更多个cpg二核苷酸,或者10个或更多个cpg二核苷酸,或者20个或更多个cpg二核苷酸,或者30个或更多个cpg二核苷酸,或者40个或更多个cpg二核苷酸,或者50个或更多个cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即,可以是不邻接的)。

在另一个实例中,检测差异甲基化的方法包括检测患有esr1阳性乳腺癌的受试者中的表3中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的表3中所示的2个或更多个,或3个或更多,或4个或更多,或5个或更多,或6个或更多,或7个或更多,或8个或更多个,或9个或更多,或10个或更多个不同基因组区域内的cpg二核苷酸处,相对于相应的cpg二核苷酸序列的参考甲基化水平的差异甲基化。

在另一个实例中,检测差异甲基化的方法包括检测患有esr1阳性乳腺癌的受试者中的表3中所示的328个esr1结合位点内的一个或多个cpg二核苷酸相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的高甲基化。由于表3中所示的328个esr1结合位点内的一个或多个cpg二核苷酸的高甲基化可以改变所述esr1结合位点所位于的或与所述esr1结合位点紧密相关的基因的表达,因此所述方法还可包括检测所述受试者中与如表3中定义的esr1结合位点中的任一个相关的基因相对于相应的基因的参考表达水平的表达水平。

在一个实例中,鉴定出受试者中的表3中第1-328行中所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者可能响应于内分泌疗法。

检测出如表3中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处的差异甲基化可指示受试者可能响应于内分泌疗法。

或者,检测出如表3中定义的任何基因组区域内的两个或更多个cpg二核苷酸处的差异甲基化可指示受试者可能响应于内分泌疗法。例如,检测出表3中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸或8个或更多的cpg二核苷酸,或9个或更多个cpg二核苷酸,或10个或更多个cpg二核苷酸,或20个或更多个cpg二核苷酸,或30个或更多个cpg二核苷酸,或40个或更多个cpg二核苷酸,或50个或更多个cpg二核苷酸列处的差异甲基化,可指示受试者可能响应于内分泌疗法。两个或更多个cpg二核苷酸在基因组区域内可以是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以不连续的(即可以是不邻接的)。

检测出表3中所示的两个或更多个不同基因组区域内的至少一种cpg二核苷酸处的差异甲基化可指示受试者可能响应于内分泌疗法。例如,检测出表3中所示的2个或更多个,或3个或更多个,4个或更多个,或5个或更多个,或6个或更多个,或7个或更多个,或8个或更多个,或9个或更多个,或10个或更多个不同的基因组区域内的cpg二核苷酸处的差异甲基化,可指示受试者可能响应于内分泌疗法。

表3中所示的328个esr1结合位点内的一个或多个cpg二核苷酸的高甲基化可改变所述esr1结合位点所位于的或与所述esr1结合位点紧密相关的基因的表达。例如,表3中所示的328个esr1结合位点内的一个或多个cpg二核苷酸的高甲基化可降低与各个esr1结合位点最紧密相关的基因的表达。因此,与如表3中定义的esr1结合位点中的任一个相关的基因的表达水平可指示受试者可能响应于内分泌疗法,例如当所述受试者患有esr1阳性乳腺癌时。

在一个实例中,鉴定出受试者中的表3的1-328行中所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的甲基化的参考水平的差异甲基化,指示所述受试者患有内分泌疗法难以治疗的乳腺癌。

检测出如表3中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处的差异甲基化可指示受试者患有内分泌疗法难以治疗的乳腺癌。

或者,检测出如表3中定义的任何基因组区域内的两个或更多个cpg二核苷酸处的差异甲基化可指示受试者患有内分泌疗法难以治疗的乳腺癌。例如,检测出如表3中所示基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸,或8个或更多个cpg二核苷酸,或者9个或更多个cpg二核苷酸,或者10个或更多个cpg二核苷酸,或者20个或更多个cpg二核苷酸,或者30个或更多个cpg二核苷酸,或者40个或更多个cpg二核苷酸,或者50个或更多个cpg二核苷酸列处的差异甲基化,可指示受试者患有内分泌疗法难以治疗的乳腺癌。两个或更多个cpg二核苷酸可在基因组区域内是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即,可以是不邻接的)。

检测出表3中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸的差异甲基化可指示受试者患有内分泌疗法难以治疗的乳腺癌。例如,检测出表3中所示的2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个或10个或更多个不同基因组区域内的cpg二核苷酸处的差异甲基化,可指示受试者患有内分泌疗法难以治疗的乳腺癌。

表3中所示的328个esr1结合位点内的一个或多个cpg二核苷酸的高甲基化可改变所述esr1结合位点所位于的或与所述esr1结合位点紧密相关的基因的表达。例如,表3中所示的328个esr1结合位点内的一个或多个cpg二核苷酸的高甲基化可降低与各个esr1结合位点最紧密相关的基因的表达。因此,与如表3中定义的esr1结合位点中的任一位点相关的基因的表达水平可指示受试者患有内分泌疗法难以治疗的乳腺癌,例如,诸如内分泌疗法难以治疗的esr1阳性乳腺癌。

在一个实例中,鉴定出受试者中的表3的第1-328行所示的一个或多个区域内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示esr1阳性乳腺癌的可能治疗结果和/或进展。

检测出如表3中定义的基因组区域中的任一个内的单个cpg二核苷酸序列处的差异甲基化可指示esr1阳性乳腺癌的可能治疗结果和/或进展。

或者,检测出如表3中定义的任何基因组区域内的两个或更多个cpg二核苷酸处的差异甲基化可指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,检测出表3中所示的基因组区域内的2个或更多个cpg二核苷酸,或3个或更多个cpg二核苷酸,或4个或更多个cpg二核苷酸,或5个或更多个cpg二核苷酸,或6个或更多个cpg二核苷酸,或7个或更多个cpg二核苷酸,或8个或更多个cpg二核苷酸,或者9个或更多个cpg二核苷酸,或者10个或更多个cpg二核苷酸,或者20个或更多个cpg二核苷酸,或者30个或更多个cpg二核苷酸,或者40个或更多个cpg二核苷酸,或者50个或更多个cpg二核苷酸处的差异甲基化,可指示esr1阳性乳腺癌的可能治疗结果和/或进展。两个或更多个cpg二核苷酸可在基因组区域内是连续的(即,邻接的)。或者,两个或更多个cpg二核苷酸在任何基因组区域内可以是不连续的(即,可以是不邻接的)。

检测出表3中所示的两个或更多个不同基因组区域内的至少一个cpg二核苷酸的差异甲基化可指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,检测出表3中所示的2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个或10个或更多个不同的基因组区域内的cpg二核苷酸处的差异甲基化,可指示esr1阳性乳腺癌的可能治疗结果和/或进展。

表3中所示的328个esr1结合位点内的一个或多个cpg二核苷酸的高甲基化可改变所述esr1结合位点所位于的或与所述esr1结合位点紧密相关的基因的表达。例如,表3中所示的328个esr1结合位点内的一个或多个cpg二核苷酸的高甲基化可降低与各个esr1结合位点最紧密相关的基因的表达。因此,与如表3中定义的任何esr1结合位点相关的基因的表达水平可以指示例如患有esr1阳性乳腺癌并且正在接受或即将接受内分泌疗法的患者中的esr1阳性乳腺癌的可能治疗结果和/或进展。

表1、表2或表3中鉴定的基因组区域中的任何区域内的特定单个cpg二核苷酸可以是受试者可能响应于内分泌疗法的特别强的预测因子。例如,鉴定出受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者可能响应于内分泌疗法。例如,受试者中选自表1的第57行、第111-113行、第256-258行、第288-289行、第469-470行、第805行、第821-822行和第824-826列中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者可能响应于内分泌疗法。

在另一个实例中,鉴定出受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自daxx、rxra、ncor2、msi2和/或c8orf46的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的的差异甲基化,指示受试者可能响应于内分泌疗法。例如,受试者中的选自表1的第57行、第111-113行、第256-258行、第460-470行和第805行中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于对应的一个或多个的cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者可能响应于内分泌疗法。

在另一个实例中,鉴定出受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自foxa1、esr1和/或gata3的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的的差异甲基化,指示受试者可能响应于内分泌疗法。例如,受试者中的选自表1的第277行和第821-822行中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于对应的一个或多个的cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者可能响应于内分泌疗法。

表1、表2或表3中鉴定的基因组区域中的任何基因组区域中的特定单个cpg二核苷酸在确定患有esr1阳性乳腺癌的受试者是内分泌疗法难以治疗的或将是内分泌疗法难以治疗的的方面可具有特别强的诊断价值。例如,鉴定受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者患有内分泌疗法难以治疗的乳腺癌。例如,受试者中的选自表1的第57行、第111-113行、第256-258行、第288-289行、第469-470行、第805行、第821-822行和第824-826中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者患有内分泌疗法难以治疗的乳腺癌。

在另一个实例中,鉴定出受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自daxx、rxra、ncor2、msi2和/或c8orf46的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者患有内分泌疗法难以治疗的乳腺癌。例如,受试者中的选自表1的第57行、第111-113行、第256-258行、第469-470行、第805行中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者患有内分泌疗法难以治疗的乳腺癌。

在另一个实例中,鉴定出受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自foxa1、esr1和/或gata3的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者患有内分泌疗法难以治疗的乳腺癌。例如,受试者中的选自表1的第277行和第821-822行中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示受试者患有内分泌疗法难以治疗的乳腺癌。

表1、表2或表3中鉴定的基因组区域中的任何基因组区域中的特定单个cpg二核苷酸可以是受试者的esr1阳性乳腺癌的可能治疗结果(例如,在接受内分泌疗法的患有esr1阳性乳腺癌的受试者中)和/或进展(例如,在接受内分泌疗法的患有esr1阳性乳腺癌的受试者中)的特别强的预测因子。例如,鉴定出受试者中的例如如表1、表2或表3中定义的一个或多个雌激素应答性增强子区域(所述区域与选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,受试者中的选自表1的第57行、第111-113行、第256-258行、第288-289行、第469-470行、第805行、第821-822行和第824-826中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示esr1阳性乳腺癌的可能治疗结果和/或进展。

在另一个实例中,鉴定出受试者中的例如如表1、表2或表3中定义的一个或多个雌激素应答性增强子区域(所述区域与选自daxx、rxra、ncor2、msi2和/或c8orf46的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,受试者中的选自表1的第57行、第111-113行、第256-258行、第460-470行和第805中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示esr1阳性乳腺癌的可能治疗结果和/或进展。

在另一个实例中,鉴定出受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自foxa1、esr1和/或gata3的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示esr1阳性乳腺癌的可能治疗结果和/或进展。例如,受试者中的选自表1的第277行和第821-822中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化,指示esr1阳性乳腺癌的可能治疗结果和/或进展。

根据本文所述的任何实例,检测差异甲基化的方法可包括鉴定患有esr1阳性乳腺癌的受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的选自表1的第57行、第111-113行、第256-258行、第288-289行、第469-470行、第805行、第821-822行和第824-826行中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。

在另一个实例中,检测差异甲基化的方法可包括鉴定患有esr1阳性乳腺癌的受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自daxx、rxra、ncor2、msi2和/或c8orf46的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的选自表1的第57行、第111-113行、第256-258行、第469-470行和第805行中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。

在另一个实例中,检测差异甲基化的方法可包括鉴定患有esr1阳性乳腺癌的受试者中的如表1中定义的一个或多个雌激素应答性增强子区域(所述区域与选自foxa1、esr1和/或gata3的基因相关或跨越所述基因)内的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。例如,所述方法可包括检测患有esr1阳性乳腺癌的受试者中的选自表1的第277行和第821-822行中定义的那些cpg二核苷酸序列的一个或多个cpg二核苷酸序列处相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的差异甲基化。

应该理解,本文所述的方法包括测定任意排列的表1、表2或表3中所示的基因组区域的任何组合中的cpg二核苷酸序列的任何组合的甲基化状态。例如,本文公开的方法可包括测定任意排列的表1、表2或表3中所示的任何2个或更多个、3个或更多个、4个或更多个、5个或更多个、10个或更多个、20个或更多个、30个或更多个、40个或更多个、50个或更多个、60个或更多个、70个或更多个、80个或更多个、90个或更多个或100个或更多个基因组区域中的任何一个或多个cpg二核苷酸序列的甲基化状态。

通常,对其甲基化状态进行评估的cpg二核苷酸的数量越多,受试者的诊断和/或预后就越可靠。因此,在本文公开的方法中对其甲基化状态进行测定的如表1、表2或表3中定义的基因组区域的数目越多,受试者的诊断或预后就越可靠。

乳腺癌亚型

本公开提供了(i)用于预测患有esr1阳性乳腺癌的受试者的对内分泌疗法的响应的方法,(ii)用于诊断内分泌疗法难以治疗的esr1阳性乳腺癌的方法,以及(iii)用于预测接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗剂结果和/或监测其进展的方法。示例性的为esr1阳性的乳腺癌包括基底乳腺癌、her2阳性乳腺癌、孕激素受体阳性乳腺癌、原位导管癌、原位小叶癌、早期乳腺癌、浸润性乳腺癌、乳头佩吉特病、炎性乳腺癌、局部晚期乳腺癌和继发性乳腺癌。乳腺癌也可根据通常按免疫组织化学基础分类的各种分子亚型来表征。为esr1阳性的乳腺癌的示例性分子亚型如下:

(i)正常(er+、pr+、her2+、细胞角蛋白5/6+和her1+);

(ii)luminala(er+和/或pr+、her2-);和

(iii)luminalb(er+和/或pr+、her2+)。

在本文鉴定的esr1结合位点内的cpg二核苷酸组合处的差异甲基化(例如,高甲基化)的检测可以特别用于乳腺癌的这些已知亚型中的任何一个或多个亚型的诊断、预后和/或治疗管理。

诊断和/或预后测定形式

1.检测核酸的甲基化及其方法

本发明人已经鉴定了在响应于内分泌疗法的esr1阳性乳腺癌细胞中,相较于内分泌疗法难以治疗的esr1阳性乳腺癌细胞被差异甲基化的雌激素应答性增强子内的cpg二核苷酸序列。本发明人还已显示,这些差异甲基化的cpg二核苷酸序列位于esr1结合位点(例如如表1中所述的)内。本发明人还已显示这些差异甲基化的cpg二核苷酸序列的一个亚组位于基因内的esr1结合位点(例如,如表2中描述的)内。此外,本发明人已显示,这些差异甲基化的cpg二核苷酸序列的一个亚组位于esr1结合位点内,并且那些位点的高甲基化与和esr1结合位点最紧密相关的基因(例如,如表3中描述的)的表达下降相关。

本发明人已经证明,例如如表1、2或3中定义的雌激素应答性增强子内的差异甲基化cpg二核苷酸序列能够预测患有esr1阳性乳腺癌的受试者的对内分泌疗法的响应。因此,预测患有esr1阳性乳腺癌的受试者的对内分泌疗法的响应的方法应被认为包括检测一个或多个雌激素应答性增强子(例如如表1、2或3中定义的)内的一个或多个cpg二核苷酸序列的甲基化状态,以确定所述一个或多个cpg二核苷酸序列是否相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平是差异甲基化的,其中受试者中的所述一个或多个cpg二核苷酸序列相对于参考水平的差异甲基化指示受试者可能响应于内分泌疗法。

本发明人还已证明,例如如表1、2或3中定义的雌激素应答性增强子内的差异甲基化的cpg二核苷酸序列能够诊断内分泌疗法难以治疗的esr1阳性乳腺癌。因此,诊断患有esr1阳性乳腺癌患者的内分泌疗法难以治疗的esr1阳性乳腺癌的方法应被认为包括检测例如如表1、2或3中定义的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态,以确定所述一个或多个cpg二核苷酸序列相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平是否被差异甲基化,其中受试者中的所述一个或多个cpg二核苷酸序列相对于参考水平的差异甲基化指示受试者患有内分泌疗法难以治疗的乳腺癌。

本发明人还已证明,例如如表1、2或3中定义的雌激素应答性增强子内的差异甲基化的cpg二核苷酸序列能够预测接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗结果和/或监测其进展。因此,预测接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗结果和/或监测其进展的方法,应被认为包括检测例如如表1、2或3中定义的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态,以确定所述一个或多个cpg二核苷酸序列相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平是否被差异甲基化,其中受试者中的所述一个或多个cpg二核苷酸序列相对于参考水平的差异甲基化指示esr1阳性乳腺癌的可能治疗结果和/或进展。

用于检测甲基化状态的合适方法是本领域已知的和/或本文描述的。

术语“甲基化”应被认为意指通过dna甲基转移酶的作用将甲基添加到核酸(例如,基因组dna)的cpg岛。如本文所述,本领域技术人员已知有几种用于测定核酸甲基化水平或程度的方法。就核酸的“差异甲基化”而言,其意指,在被诊断的受试者内的基因组区域处的甲基化cpg二核苷酸的数量与合适的对照样品(即,其为该基因组区域提供参考甲基化水平)中的相应基因组区域内检测到的所述数量相比存在偏差。差异甲基化的核酸可在核酸的特定或确定区域内具有升高水平的甲基化,诸如高甲基化,或在核酸的特定或确定区域内具有降低水平的甲基化例如,诸如低甲基化。

术语“高甲基化”应被认为意指核酸的特定或确定区域中的多个cpg二核苷酸相对于参考水平是被甲基化。

术语“低甲基化”应被认为意指核酸的特定或确定区域中的多个cpg二核苷酸相对于参考水平未被甲基化。

本公开不受限于甲基化残基的确切数目,因为患者样品之间会发生一些变化,所述甲基化残基的确切数目被考虑用来(i)预测患有esr1阳性乳腺癌的受试者对内分泌疗法的可能响应或(ii)诊断内分泌疗法难以治疗的esr1阳性乳腺癌,或(iii)预测接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗结果和/或进展。本公开也不受限于甲基化残基在雌激素应答性增强子区域内的具体定位。

在一个实例中,测定受试者中的具有表1-3中所示的一个或多个esr1结合位点内的一个或多个cpg二核苷酸的甲基化程度。在一个实例中,测定受试者中的表1中所示的一个或多个esr1结合位点内的一个或多个cpg二核苷酸的甲基化程度。在一个实例中,测定受试者中的表2中所示的一个或多个esr1结合位点内的一个或多个cpg二核苷酸的甲基化程度。在一个实例中,测定受试者中的表3中所示的一个或多个esr1结合位点内的一个或多个cpg二核苷酸的甲基化程度。在一个实例中,测定受试者中的选自daxx、esr1、rxra、get4、ncor2、gata3、msi2、c8orf46和/或itpk1的基因的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸的甲基化程度。在一个实例中,测定受试者中的选自daxx、rxra、ncor2、msi2和/或c8orf46的基因的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸的甲基化程度。在一个实例中,测定受试者中的选自foxa1、esr1和/或gata3的基因的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸的甲基化程度。

a)探针或引物设计和/或产生

本文所述的几种诊断和/或预后方法使用一个或多个探针和/或引物来检测基因组区域处的甲基化。用于设计用于例如pcr或杂交的探针和/或引物的方法是本领域已知的,并且描述于例如dieffenbach和dveksler(编辑)(在pcrprimer:alaboratorymanual,coldspringharborlaboratories,ny,1995)中。此外,可为各种测定设计最佳的探针和/或引物的几个软件包是公共可得的,例如可从centerforgenomeresearch,cambridge,ma,usa获得的primer3。

在探针或引物设计过程中应考其的潜在用途。例如,倘若探针或引物被产生来用于例如甲基化特异性pcr或连接酶链式反应(lcr)测定,则3'末端(或在lcr情况下为5'末端)的核苷酸应对应于核酸中的甲基化核苷酸。

评估可用于检测与乳腺癌相关的标志物的探针和/或引物,例如以确定不形成发夹、自我引发(self-prime)或形成引物二聚体(例如,与检测测定中使用的另一种探针或引物)的那些探针和/或引物。

用于产生和/或合成本公开的探针或引物的方法是本领域已知的。例如,在gait(编辑)(在oligonucleotidesynthesis:apracticalapproach,irlpress,oxford,1984)中描述了寡核苷酸合成。例如,可通过生物合成(例如,通过用限制性内切核酸酶消化核酸)或通过化学合成来获得探针或引物。对于短序列(最多约100个核苷酸),化学合成是优选的。

用于寡核苷酸合成的其它方法包括例如磷酸三酯和磷酸二酯方法(narang等meth.enzymol68:90,1979)和在载体上的合成(beaucage,等tetrahedronletters22:1859-1862,1981)以及氨基磷酸酯技术,caruthers,m.h.等,"methodsinenzymology,"第154卷,第287-314页(1988)以及在"synthesisandapplicationsofdnaandrna,"s.a.narang,编辑,academicpress,newyork,1987和其中引用的参考文献中描述的其它技术。

如例如在nielsen等,j.chem.soc.perkintrans.,1:3423,1997;singhandwengel,chem.commun.1247,1998中所述,合成包含锁核酸(lna)的探针。同时,如例如在egholm等,am.chem.soc.,114:1895,1992;egholm等,nature,365:566,1993以及orum等,nucl.acidsres.,21:5332,1993中所述,合成包含肽-核酸(pna)的探针。

b)dna的甲基化敏感性内切核酸酶消化

在一个实例中,样品中的一个或多个雌激素应答性增强子(例如如表1、2或3中定义的)内的一个或多个cpg二核苷酸序列的甲基化状态使用包括以下步骤的方法测定:在足以使核酸被消化的条件下利用一定量的甲基化敏感性限制性内切核酸酶处理核酸,然后检测产生的片段。示例性甲基化敏感性内切核酸酶包括例如hpai或hpaii。

在一个实例中,通过探针或引物与未消化的核酸的选择性杂交来检测核酸的消化。或者,探针选择性地与消化的和未消化的核酸杂交,但例如通过电泳促进两种形式之间的区分。用于实现与杂交探针选择性杂交的合适的检测方法包括例如southern或其他核酸杂交(kawai等,mol.cell.biol.14,7421-7427,1994;gonzalgo等,cancerres.57,594-599,1997)。

术语“可选择性杂交的”意指在其中靶核酸与探针杂交以产生显著高于背景的信号(即高信噪比)的条件下使用探针。例如,通过对探针进行放射性标记(例如通过在使用前将[α-35s]和/或[α-32p]dntp、[γ-32p]atp、生物素、染料配体(例如,fam或tamra)、荧光团或其他合适配体掺入探针,然后在杂交后检测配体)来测量杂交的强度。

本领域技术人员将会意识到,尽管可以应用一些普遍性,但是应该根据经验确定每种探针的最佳杂交反应条件。优选地,在低至中等严格条件下进行采用短寡核苷酸探针的杂交。

为了确定在这些诊断和/或预后测定中使用的严格性水平,低严格度在本文中被定义为是在约28℃至约40℃下于约6xssc缓冲液中和/或约0.1%(w/v)sds中或在等同条件下进行的杂交和/或洗涤。中等严格性在本文中被定义为是在约45℃至约65℃的范围内的温度下于约2xssc缓冲液和/或约0.1%(w/v)sds中或在同等条件下进行的杂交和/或洗涤。

在富含gc的探针或引物或更长的探针或引物的情况下,高严格性杂交和/或洗涤是优选的。高严格性在本文中被定义为在约0.1xssc缓冲液和/或约0.1%(w/v)sds或更低的盐浓度中和/或至少65℃的温度下或在等同的条件下进行的杂交和/或洗涤。本文提及的特定水平的严格性涵盖使用本领域技术人员已知的不同于ssc的洗涤/杂交溶液的等同条件。

通常,通过降低ssc缓冲液的浓度和/或增加sds的浓度和/或升高杂交和/或洗涤的温度来提高严格性。本领域技术人员将意识到,杂交和/或洗涤的条件可根据用于支持样品dna的杂交基质的性质和/或使用的杂交探针的类型和/或杂交中使用的任何缓冲液的组分而变化。例如,甲酰胺降低杂交或扩增反应中的探针或引物的解链温度。

本领域技术人员理解用于特异性杂交核酸的条件和用于除去非特异性杂交核酸的洗涤条件。仅为了进一步阐明的目的,提及影响核酸分子之间的杂交的参数见于ausubel等(currentprotocolsinmolecularbiology,wileyinterscience,isbn047150338,1992),所述参考文献通过引用并入本文。

根据本实例,针对测试样品和对照样品产生的片段的差异指示(i)受试者可能响应于内分泌疗法,(ii)内分泌疗法难以治疗的esr1阳性乳腺癌,和/或(iii)接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的可能治疗结果和/或进展。类似地,在其中对照样品包含来自为esr1阳性且内分泌疗法难以治疗的乳腺肿瘤、乳腺癌组织或乳腺癌细胞的数据的情况下,测试样品与对照样品之间的相似性(尽管不一定绝对相同)指示(i)受试者可能响应于内分泌疗法,(ii)内分泌疗法难以治疗的esr1阳性乳腺癌,和/或(iii)接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的可能治疗结果和/或进展。

在替代实例中,使用扩增系统诸如聚合酶链式反应(pcr)、滚环扩增(rca)、反向聚合酶链式反应(ipcr)、原位pcr(singer-sam等,nucl.acidsres.18,687,1990)、链置换扩增(sda)或循环探针技术来检测由限制性内切酶产生的片段。

pcr的方法是本领域已知的,并且例如由mcpherson等,pcr:apracticalapproach.(系列编辑,d.rickwood和b.d.hames),irlpresslimited,oxford.第1-253页,1991以及由dieffenbach(编辑)和dveksler(编辑)(pcrprimer:alaboratorymanual,coldspringharbourlaboratories,ny,1995)(所述文献的内容各自通过引用整体并入本文)描述。通常,对于pcr,包含长度为至少约18个核苷酸,并且更优选长度为至少20-30个核苷酸的两个非互补核酸引物分子在其各自的退火位点与核酸模板分子的不同链杂交,并且介于退火位点之间的模板的特异性核酸分子拷贝被酶促扩增。例如,可使用电泳和利用结合核酸的可检测标记的检测来检测扩增产物。或者,用可检测标记(例如荧光团)标记一个或多个寡核苷酸,并使用例如lightcycler(perkinelmer,wellesley,ma,usa)检测扩增产物。

链置换扩增(sda)利用寡核苷酸引物、dna聚合酶和限制性内切核酸酶来扩增靶序列。将寡核苷酸与靶核酸杂交,并使用聚合酶来产生介于引物退火位点之间的区域的拷贝。然后用特异性识别复制的核酸开始处的序列的内切核酸酶使所复制的核酸与靶核酸的双链体产生切口。dna聚合酶识别带切口的dna并产生靶区域的另一个拷贝,同时替换先前产生的核酸。sda的有利方面在于其以等温形式发生,从而促进了高通量自动化分析。

循环探针技术使用包含能够与靶序列杂交的dna-rna-dna的嵌合合成引物。在与靶序列杂交后,形成的rna-dna双链体是rna酶h的靶标,从而切割引物。然后例如使用质谱或电泳来检测切割的引物。

对于侧接甲基化敏感性内切核酸酶识别位点或与该位点相邻的引物,优选的是此类引物仅侧接在esr1乳腺癌中被高甲基化的那些位点,以确保产生诊断和/或预后扩增产物。就这一点而言,扩增产物只有在限制性位点不被切割时(即,当其被甲基化时)才会产生。因此,检测到扩增产物表明一种或多种目标cpg二核苷酸被甲基化。

这种形式的分析可用于测定基因组区域内的多个cpg二核苷酸的甲基化状态,条件是每个二核苷酸在甲基化敏感性限制性内切酶位点内。

在这些方法中,可用可检测标记(例如,荧光标记(例如cy5或cy3)或放射性同位素(例如32p))标记一种或多种引物以促进扩增核酸的快速检测。

通常使用例如非变性琼脂糖凝胶电泳、非变性聚丙烯酰胺凝胶电泳、质谱、液相色谱(例如hplc或dhplc)或毛细管电泳(例如maldi-tof)、高通量检测方法诸如例如基质辅助激光解吸/电离飞行时间(maldi-tof)、电喷雾电离(esi)、质谱(包括串联质谱法,例如lcms/ms)、生物传感器技术、瞬逝光纤技术或dna芯片技术(例如,wo98/49557;wo96/17958;fodor等,science767-773,1991;美国专利第5,143,854号和美国专利第5,837,832号,其内容全部通过引用并入本文)分析扩增的核酸。

或者,可使用如本文所述和/或例如us6,174,670(其通过引用并入本文)中所述的熔解曲线分析方法连续监测核酸的扩增。

c)非甲基化dna的选择性诱变

在本公开的替代实施例中,使用一种方法测定受试者样品中的基因组区域的甲基化状态,所述方法包括在足以诱发诱变的条件下用一定量的选择性突变cpg二核苷酸内的非甲基化的胞嘧啶残基的化合物处理核酸。

示例性化合物使胞嘧啶突变为尿嘧啶或胸苷,所述化合物诸如,例如亚硫酸氢盐,例如亚硫酸氢钠或亚硫酸氢钾(frommer等,proc.natl.acad.sci.usa89,1827-1831,1992)。已知dna的亚硫酸氢盐处理通过使未被甲基化保护的胞嘧啶残基(包括不在cpg二核苷酸内的胞嘧啶残基或位于未经历甲基化的cpg二核苷酸内的胞嘧啶残基)突变来区分甲基化与非甲基化的胞嘧啶残基。

(i)基于序列的检测

在一个实例中,通过对突变的dna进行测序来确定基因组区域中一个或多个突变核苷酸的存在或样品中突变序列的数目。一种分析形式包括使用本文所述的扩增反应(例如pcr)来扩增突变的核酸或甲基化的核酸。然后对扩增的产物直接测序或克隆,并对克隆的产物进行测序。用于对dna进行测序的方法是本领域已知的,包括例如双脱氧链终止方法或maxam-gilbert法(参见sambrook等,molecularcloning,alaboratorymanual(第2版,cshp,newyork1989)或zyskind等,recombinantdnalaboratorymanual,(acad.press,1988))。

由于用化合物(诸如,例如亚硫酸氢盐)处理核酸导致非甲基化的胞嘧啶突变为尿嘧啶或胸苷,因此序列的分析确定是否存在甲基化的核苷酸。例如,通过将使用对照样品或未用亚硫酸氢盐经处理的样品获得的序列或目标区域的已知核苷酸序列与经处理的样品比较,促进了核苷酸序列中的差异的检测。与对照或未处理的样品相比,在经处理的样品中在胞嘧啶的位点处检测到的任何胸腺嘧啶残基可被认为是由亚硫酸氢盐处理导致的突变引起的。例如,在frommer等,proc.natl.acad.sci.usa89:1827-1831,1992或clark等,nucl.acidsres.22:2990-2997,1994中描述了使用对亚硫酸氢盐处理的核酸的测序来检测甲基化的合适方法。用于实施此类方法的商购可得的试剂盒的一个实例是cpgenometmdna修饰试剂盒(millipore)。其它合适的试剂盒可从mdxhealthsa(belgium)获得。

在另一个实例中,使用焦磷酸测序法(诸如,例如如uhlmann等,electrophoresis,23:4072-4079,2002中所述的)检测亚硫酸氢盐处理的样品中突变或非突变核苷酸的存在。该方法基本上是一种实时测序的形式,其使用与在癌细胞中被甲基化的胞嘧啶的位点相邻或接近的位点杂交的引物。在dna聚合酶存在的情况下引物与模板杂交后,按照预定的分配顺序分别加入四种经修饰的三磷酸脱氧核苷酸的每一种。只有与经亚硫酸氢盐处理的样品互补的添加的核苷酸被掺入,并且释放出无机焦磷酸(ppi)。然后ppi驱动反应,从而导致产生可检测水平的光。此类方法允许确定与引物杂交位点相邻的特定核苷酸的身份。

用于确定亚硫酸氢盐处理的核苷酸的序列的相关方法是甲基化敏感性单核苷酸引物延伸(me-snupe)或snapmeth。在例如gonzalgo和jonesnucl.acidsres.,25:2529-2531或uhlmann等,electrophoresis,23:4072-4079,2002中描述了合适的方法。

很显然,本公开涵盖其它高通量测序方法。此类方法包括例如固相微测序(如例如在等,genomics,13:1008-1017,1992中所述的),或利用fret的微测序(如例如在chen和kwok,nucleicacidsres.25:347-353,1997中所述的)。

(ii)基于限制性内切核酸酶的测定形式

在一个实例中,使用组合的亚硫酸氢盐的限制性分析(cobra)(基本上如xiong和laird,nucl.acidsres.,25:2532-2534,2001中的述的)检测非突变核酸序列的存在。该方法利用在用化合物(例如,亚硫酸氢盐)处理后甲基化与非甲基化核酸之间的限制性内切酶识别位点的差异,所述化合物选择性地使非甲基化的胞嘧啶残基突变。

在亚硫酸氢盐处理之后,使用本文所述的扩增反应(例如pcr)扩增目标基因组区域,所述基因组区域包含在esr1阳性癌细胞中被甲基化并且包含在限制性内切核酸酶识别序列中的一个或多个cpg二核苷酸。然后使扩增的产物与在cpg二核苷酸位点处切割的限制性酶接触一段时间并处于足以使切割发生的条件下。可以选择限制性位点来指示是否存在甲基化。例如,限制性内切核酸酶taqi切割序列tcga,在非甲基化核酸的亚硫酸氢盐处理后,该序列将为ttga,并且因此不会被切割。然后使用本领域已知的检测手段(诸如,例如电泳和/或质谱法)检测消化的和/或未消化的核酸。核酸的切割或非切割指示受试者的癌症。

很明显,当进行本公开的诊断和/或预测方法时,可在阳性读出或阴性读出系统中使用该方法。

(iii)阳性读出测定形式

在一个实例中,本公开的测定形式包括阳性读出系统,其中如果乳腺癌是或可能是内分泌疗法难以治疗的,则已用例如亚硫酸氢盐处理的来自乳腺癌样品(例如esr1阳性乳腺癌样品)的高甲基化dna被检测为阳性信号。例如,来自健康或正常对照受试者的非高甲基化dna或来自乳腺癌样品例如esr1阳性乳腺癌样品的非高甲基化dna未被检测到或者仅被微弱地检测到,并且可能响应于或响应于内分泌疗法。

在一个实例中,使用包括以下步骤的方法确定受试者样品中增强的甲基化:

(i)用一定量的化合物处理核酸,所述化合物在足以诱导诱变的条件下选择性地使非甲基化的胞嘧啶残基突变,由此产生突变的核酸;

(ii)使核酸与包含核苷酸序列的探针或引物,在使得与非突变核酸发生选择性杂交的条件下杂交,所述核苷酸序列与含有甲基化的胞嘧啶残基的序列互补;以及

(iii)检测选择性杂交。

在该情况下,术语“选择性杂交”意指探针或引物与非突变核酸的杂交以相较于同一探针或引物与相应的突变序列的杂交更高的频率或比率发生,或具有更高的最大反应速度。优选地,探针或引物在所使用的反应条件下不与携带突变的非甲基化序列杂交或不与其可检测地杂交(例如,不以显著高于背景的水平杂交)。

在一个实例中,使用southern印迹、斑点印迹、狭缝印迹或其它核酸杂交手段(kawai等,mol.cell.biol.14,7421-7427,1994;gonzalgo等,cancerres.57,594-599,1997)检测杂交。经历适当的探针选择,此类测定形式在上文中作了一般性描述,并且可被加以必要的修改以适用于目前描述的选择性诱变方法。

在一个实例中,使用连接酶链式反应形式来区分突变与非突变核酸。连接酶链式反应(ep320,308和us4,883,750中描述的)使用至少两种寡核苷酸探针,所述寡核苷酸探针以使它们与靶核酸并置的方式与靶核酸退火,使得它们可以使用连接酶来连接。未连接的探针通过修改杂交严格性而除去。就这一点而言,尚未连接的探针将在比已经连接的探针更低的严格性杂交条件下选择性杂交。因此,可将杂交的严格性提高到至少与用于杂交较长探针的严格性一样高的严格性,并且优选因连接后由较短的探针所贡献的长度增加而在更高的严格性下。一个示例性方法使靶-探针双链体解链,洗脱解离的探针并确认已经连接,例如通过使用电泳、质谱法、核苷酸序列分析、凝胶过滤或本领域技术人员已知的其它方法测定其长度。

甲基化特异性微阵列(mso)也可用于区分突变序列与非突变序列。例如在adorján等,nucl.acidsres.,30:e21,2002中描述了合适的方法。mso使用已用化合物(例如,亚硫酸氢盐)处理的核酸作为扩增反应的模板,所述化合物选择性地使非甲基化的胞嘧啶残基突变,所述扩增反应扩增突变和非突变的核酸。用至少一种包含可检测标记(例如荧光团,例如cy3或cy5)的引物进行扩增。然后将标记的扩增产物在使得能够检测单核苷酸差异的条件下与微阵列上的寡核苷酸杂交。在洗涤除去未结合的扩增产物后,使用例如微阵列扫描仪检测杂交。该方法不仅可以测定大量cpg二核苷酸的甲基化状态,而且其还是半定量的,使得能够测定所分析的每种cpg二核苷酸处的甲基化程度。由于单个样品中可能存在一定程度的甲基化异质性,因此此类定量可能有助于癌症的诊断。

在一个替代实例中,使用扩增系统检测杂交。在甲基化特异性pcr形式(msp;herman等,proc.natl.acad.sci.usa93:9821-9826,1992)中,杂交是使用包括扩增亚硫酸氢盐处理的dna的方法的检测。通过使用在中等和/或高度严格条件下与未突变序列特异性退火的一种或多种探针或引物,只有使用包含甲基化的核苷酸的样品才产生扩增产物。

可使用本文所述的任何扩增测定形式,诸如,例如聚合酶链式反应(pcr)、滚环扩增(rca)、反向聚合酶链式反应(ipcr)、原位pcr(singer-sam等,nucl.acidsres.18,687,1990)、链置换扩增或循环探针技术。

已经开发了用于检测基因突变(kuppuswamy等,proc.natl.acad.sci.usa88:1143-1147,1991)和定量等位基因特异性表达(szabo和mann,genesdev.9:3097-3108,1995;和singer-sam等,pcrmethodsappl.1:160-163,1992)的pcr技术。此类技术使用内部引物,其与pcr生成的模板退火并且立即终止待测定的单个核苷酸的5'。可容易地将此类形式与上文所述的连接酶链式反应组合。

本公开还设想了甲基化特异性解链曲线分析(基本上如worm等,clin.chem.,47:1183-1189,2001中所述)。该方法利用了使用亚硫酸氢盐处理的甲基化或未甲基化的核酸产生的扩增产物中的解链温度的差异。实质上,在特异性结合双链dna的荧光染料(例如sybrgreeni)存在的情况下进行亚硫酸氢盐处理的样品的无差别扩增。通过在监测荧光的同时升高扩增产物的温度,确定扩增产物的解链性质,从而确定扩增产物的序列。荧光的下降反映了扩增产物中至少一个结构域的解链。荧光降低时的温度指示扩增的核酸的核苷酸序列,由此允许一个或多个cpg二核苷酸的位点处的核苷酸被测定。如使用本公开扩增的核酸的序列

本公开还包括使用实时定量形式的pcr,诸如,例如taqman(holland等,proc.natlacad.sci.usa,88,7276-7280,1991;lee等,nucleicacidres.21,3761-3766,1993)来进行该实施方案。例如,eads等,nucl.acidsres.28:e32,2000的methyllight方法使用改进的taqman测定来检测cpg二核苷酸的甲基化。

或者,不使用需要切割的标记探针,而是使用这样的探针,诸如,例如molecularbeacontm(参见,例如,mhlang和malmberg,methods25:463-471,2001)。分子信标是具有茎环结构的单链核酸分子。环结构与在癌症样品中而不是在对照样品中被甲基化的一个或多个cpg二核苷酸周围的区域互补。茎结构通过使两个彼此互补的“臂”退火形成,所述臂在探针(环)的两侧。荧光部分与一个臂结合,并且淬灭部分与另一个臂结合,当分子信标未与靶序列结合时,所述淬来部分抑制任何可检测荧光。当环区域与其靶核酸结合时,臂被分离并且荧光是可检测的。然而,即使单个碱基错配也会显著改变样品中检测到的荧光水平。因此,特定碱基的存在或不存在由检测到的荧光水平确定。此类测定有助于检测核酸中的一个或多个未突变的位点(即甲基化的核苷酸)。

如本文所例示的,可用于在用选择性地使非甲基化的胞嘧啶残基突变的化合物处理后检测甲基化核酸的另一种基于扩增的测定法,使用了头环pcr技术(例如,如公开的pct申请第pct/au03/00244号;wo03/072810中所述)。该扩增形式使用探针或引物,所述探针或引物包含与核酸结合的区域,并且能够在扩增反应中扩增核酸,无论该核酸是否被甲基化。所述引物另外包含与扩增的核酸的一部分互补的区域,使得该引物的该区域能够与掺入该引物的扩增的核酸杂交,从而形成发夹。退火区域的现在的3'末端核苷酸(即,引物的一个或多个最5'核苷酸)与一个或多个突变的胞嘧啶残基(即,在来自癌症受试者的核酸中未甲基化的)的位点杂交。因此,这促进了来自未甲基化的核酸的扩增产物的自我引发,由此形成的发夹结构阻止了该核酸的进一步扩增。相反,互补区域可以能够或可以不能够与来自甲基化的(突变的)核酸的扩增产物杂交,但不能够“自我引发”,从而使得能够进一步扩增该核酸(例如,由于现在的3'核苷酸不能与扩增产物杂交)。可以使用解链曲线分析方法来进行该方法以测定来自受试者的生物样品中甲基化的核酸的量。

在用选择性地使非甲基化的胞嘧啶残基突变的化合物处理后,用于检测甲基化的核酸的其它基于扩增的方法包括例如甲基化特异性单链构象分析(ms-ssca)(bianco等,hum.mutat.,14:289-293,1999)、甲基化特异性变性梯度凝胶电泳(ms-dgge)(abrams和stanton,methodsenzymol.,212:71-74,1992)和甲基化特异性变性高效液相色谱(ms-dhplc)(deng等,chin.j.cancerres.,12:171-191,2000)。这些方法中的每一种使用不同的技术来基于核苷酸序列和/或二级结构中的差异检测扩增产物中的核酸差异。本公开明确地设想了此类方法。

(iv)阴性读出测定

在一个替代实例中,测定形式包括阴性读出系统,其中来自健康或正常对照受试者的非高甲基化的dna或来自乳腺癌样品(例如esr1阳性乳腺癌样品,其响应于内分泌疗法)的非高甲基化的dna被检测为阳性信号,并且优选地,未检测到或仅微弱地检测到来自为或可能为内分泌疗法难以治疗的乳腺癌样品(例如,esr1阳性乳腺癌样品)的高甲基化dna。

在一个实例中,非高甲基化的dna使用包括以下步骤的方法来测定:

(i)用一定量的化合物处理所述核酸,所述化合物在足以诱导诱变的条件下选择性地使cpg岛内的非甲基化的胞嘧啶残基突变,由此产生突变的核酸;

(ii)使所述核酸与包含核苷酸序列的探针或引物,在使得与所述突变的核酸发生选择性杂交的条件下杂交,所述核苷酸序列与含有突变的胞嘧啶残基的序列互补;以及

(iii)检测选择性杂交。

在这种情况中,术语“选择性杂交”意指探针或引物与突变的核酸的杂交以相较于同一探针或引物与相应的非突变的序列的杂交更高的频率或比率发生,或具有更高的最大反应速度。在一个实例中,探针或引物在所使用的反应条件下不与甲基化的序列(或非突变的序列)杂交或不与其可检测地杂交。

本领域技术人员将能够将上述阳性读出测定改造成阴性读出测定,例如通过产生与非突变的dna而不与突变的dna选择性杂交的探针或引物。

d)甲基化的dna免疫沉淀(medip)

在另一个实例中,使用一种方法测定受试者样品中的基因组区域的甲基化状态,所述方法包括从样品中的低甲基化或非甲基化的dna物理分离甲基化的dna(例如,高甲基化的dna),随后对物理分离的dna进行测序。优选地,使用甲基化dna免疫沉淀(medip)实现甲基化的dna的物理分离,所述甲基化dna免疫沉淀是已在本领域中描述的一种技术(参见,例如weber,m.等(2005)nat.genet.37:853-862;和rakyan,等(2008)genomeres.18:1518-1529;两者均明确地通过引用并入本文)。

根据其中使用medip物理分离甲基化的dna(例如,高甲基化的dna)的本公开的方法,使输入核酸制备物(来自受试者)变性,与针对5-甲基胞嘧啶的抗体一起孵育,然后通过免疫沉淀分离甲基化的dna。例如,为了实现免疫沉淀,可将抗5-甲基胞嘧啶抗体偶联至固体载体(例如,磁性免疫磁珠(dynabead)、微型琼脂糖珠或顺磁性珠)上以允许从溶液中沉淀甲基化的dna(直接免疫沉淀)。或者,可使用识别抗5-甲基胞嘧啶抗体(例如,抗体的恒定区)且被偶联至固体载体的第二抗体或试剂,从而允许从溶液中沉淀甲基化的dna(间接免疫沉淀)。对于直接或间接免疫沉淀,可使用本领域已知的用于样品内组分的物理分离的其它方法,诸如生物素/亲和素或生物素/链霉亲和素系统。例如,可将抗5-甲基胞嘧啶抗体偶联至生物素,然后可使用与固体载体偶联的亲和素或链霉亲和素来使甲基化的dna从溶液中沉淀。对于普通技术人员来说显而易见的是,本领域已知用于引起免疫沉淀的其它变型也适用于本公开的方法中。因此,如本文中所用,术语“甲基化dna免疫沉淀”或“medip”旨在涵盖任何和全部方法,其中将区分高甲基化的dna与低甲基化或非甲基化的dna的抗体与从患有esr1阳性乳腺癌的受试者获得的核酸接触,随后从溶液中沉淀出高甲基化的dna(即,特异性结合抗体的dna)。例如,其中包含甲基化的dna结合结构域(mbd)的抗体或由mbd和抗体或其部分(例如fc部分)组成的双特异性分子被明确地设想用于本公开的用于检测来自样品的甲基化的dna和/或从样品中物理分离所述甲基化的dna的方法。使用包含mbd的抗体和其它蛋白以检测甲基化的dna的技术描述于美国专利公开us200150267263和blueprintconsortium(2016)nat.biotechnol.doi:10.1038/nbt.3062中,所述两者均明确地通过引用并入本文。

通常在将高甲基化的dna与低甲基化或非甲基化的dna物理分离后,然后扩增高甲基化的dna。如本文中所用,术语“扩增的”旨在表示制备额外的dna拷贝,从而增加dna拷贝的数量,这通常使用聚合酶链式反应(pcr)来完成。用于扩增高甲基化的dna的一种具体方法是本领域先前已经描述的连接介导的聚合酶链式反应(lm-pcr)(参见例如,ren,b.等(2000)science22:2306-2309;和oberley,m.j.等(2004)methodsenzymol.376:315-334;所述两者的内容均明确地通过引用并入本文)。在lm-pcr中,通过平端连接将接头末端连接到dna片段的样品上,然后在pcr中使用识别接头末端的核苷酸序列的寡核苷酸引物,从而扩增接头已连接的dna片段。因此,在其中使用lm-pcr的本公开的方法的实例中,将来自患有esr1阳性乳腺癌的受试者的dna片段化(例如,片段化成约300-800bp的片段),并通过平端连接将接头臂连接至所述片段化的dna,然后将高甲基化的dna与低甲基化的dna或非甲基化的dna物理分离(例如,通过medip)。然后,在高甲基化的dna的物理分离后,使用识别已经连接至dna上的接头末端的寡核苷酸引物对回收的高甲基化的dna进行pcr。这导致高甲基化的dna样品扩增。

然后可使用本领域已知的和本文所述的标准测序方法对扩增的高甲基化的dna样品进行测序。然后可使用序列数据来确定受试者样品中基因组区域的甲基化状态。此外,该分析形式可用于同时确定基因组区域内的多个cpg二核苷酸的甲基化状态。

e)另外的方法步骤

本文公开的方法还可包括富集样品中的甲基化的dna的一个或多个步骤。因此,本文公开的方法还可包括从样品中分离甲基化的dna的一个或多个步骤。如本文所公开的,可在用于检测如本文公开的雌激素应答性增强子区域内的cpg二核苷酸序列的甲基化水平的方法中的任何其它步骤之前或伴随所述步骤进行富集/分离步骤。

可使用本领域已知的任何合适的富集/分离步骤。例如,本文公开的方法可以包括使用商购可得的试剂盒诸如cpgmethylquestdna分离试剂盒(millipore)富集样品中甲基化的dna的步骤,所述试剂盒提供了重组蛋白,所述重组蛋白包含通过含有凝血酶切割位点的接头与来自日本血吸虫(s.japonicum)的谷胱甘肽-s-转移酶(gst)蛋白融合的小鼠mbd2b蛋白的甲基结合结构域(mbd),所述重组蛋白被固定在磁珠上。mbd以高亲和力和以不依赖于序列的方式与甲基化的cpg位点结合,从而允许样品中甲基化dna的富集。

应当理解,本领域已知的用于富集/分离样品中的甲基化的dna的替代或另外的方法可用于本文公开的方法。例如,在hsu等,(2014)methodsmolbiol,1105:61-70,serre等,(2010)nucleicacidsres,38:391-399,rauch和pfeifer(2005)labinvest,85:1172-1180,nair等,(2011)epigenetics,6:34-44以及robinson等,(2010)genomeres,20:1719-1729中描述了富集/分离样品中的甲基化的dna的方法。

根据任何实例的本文所公开的方法还可包括基于本文公开的方法的结果来选择患者并且进行另外的诊断方法或者推荐执行另外的诊断方法。例如,对于被诊断为患有内分泌疗法难以治疗或可能变得内分泌疗法难以治疗的esr1阳性乳腺癌的患者,所述另外的诊断方法可以是超声或活组织检查。

2.降低的基因表达的检测

由于核酸序列的甲基化影响其表达,因此本发明人还已证明,本文所述的许多基因组区域中的任一个内的核酸表达水平在esr1阳性乳腺癌受试者和esr1阳性乳腺癌细胞系中是变化的(例如降低或升高)。因此,本文公开的方法可以另外地或可选地包括测定与本文表1-3中鉴定的雌激素应答性增强子区域中的任一个重叠、跨越其或与其紧密相关的任何多核苷酸的表达水平。在一个实例中,本文公开的方法可另外或可选地包括测定与如表1中定义的雌激素应答性增强子区域中的一个或多个重叠、跨越其或与其紧密相关的一个或多个多核苷酸的表达水平。在一个实例中,本文公开的方法可另外地或可选地包括测定与如表2中定义的雌激素应答性增强子区域中的一个或多个重叠、跨越其或与其紧密相关的一个或多个多核苷酸的表达水平。在一个实例中,本文公开的方法可另外地或者可选地包括测定与如表3中定义的雌激素应答性增强子区域中的一个或多个重叠、跨越其或与其紧密相关的一个或多个多核苷酸的表达水平。例如,检测与表1-3中定义的雌激素应答性增强子区域中的一个或多个重叠、跨越其或与其紧密相关的一个或多个多核苷酸的降低的表达水平可能(i)预测患有esr1阳性乳腺癌的受试者可能响应于内分泌疗法,(ii)或诊断内分泌疗法难以治疗的esr1阳性乳腺癌,或(iii)预测接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗结果和/或进展。

a)核酸检测

在一个实例中,核酸的表达水平通过检测从本文所述的基因组区域转录的mrna的水平来测定。

在一个实例中,通过使能够与本文所述的基因组区域的转录物特异性杂交的核酸探针或引物与源自受试者的生物样品中的核酸杂交,并通过检测手段检测所述杂交来检测mrna。优选地,所述检测手段是扩增反应或核酸杂交反应,诸如,例如本文所述的扩增反应或杂交反应。

在这种情况中,术语“选择性杂交”意指探针或引物与转录物的杂交以相较于同一探针或引物与任何其它核酸的杂交更高的频率或比率发生,或具有更高的最大反应速度。优选地,探针或引物在所使用的反应条件下不以可检测的水平与另一种核酸杂交。

当本文所述的基因或假基因的转录物使用由其衍生的mrna或cdna来检测时,检测mrna中的变化的测定是优选的(例如northern杂交、rt-pcr、nasba、tma或连接酶链式反应)。

rt-pcr的方法是本领域已知的,并例如在dieffenbach(编辑)和dveksler(编辑)(在pcrprimer:alaboratorymanual,coldspringharbourlaboratories,ny,1995)中进行了描述。本质上,该方法包括使用cdna进行pcr反应,所述cdna通过使用逆转录酶逆转录来自细胞的mrna而产生。上文所述的pcr方法将用来加以必要的修改以适用于本公开的该实施方案。

类似地,lcr可以使用cdna来进行。优选地,反应中使用的一种或多种探针或引物与目标转录物特异性地杂交。上文描述了lcr的方法,并且所述方法将被用来加以必要的修改以适用于本公开的该实施方案。

tma或自主序列复制(3sr)的方法使用侧接靶序列的两个或更多个寡核苷酸、rna聚合酶、rna酶h和逆转录酶。一个寡核苷酸(其还包含rna聚合酶结合位点)与包含靶序列的rna分子杂交,并且逆转录酶产生该区域的cdna拷贝。rna酶h用于消化rna-dna复合物中的rna,而第二个寡核苷酸用于产生cdna的拷贝。然后用rna聚合酶产生cdna的rna拷贝,并重复该过程。

nasba系统依赖于三种酶(逆转录酶、rna酶h和rna聚合酶)的同时活性来选择性扩增靶mrna序列。使用与靶序列杂交并且在其5'末端包含rna聚合酶结合位点的寡核苷酸,通过逆转录将mrna模板转录成cdna。用rna酶h消化模板rna,并且合成双链dna。然后rna聚合酶产生cdna的多个rna拷贝,并重复该过程。

本公开还设想了使用微阵列来测定本文所述的一个或多个核酸的表达水平。此类方法使得能够检测许多不同的核酸,由此提供多分析物测试并且提高本公开的诊断测定的灵敏度和/或准确度。

b)多肽检测

在一个替代实例中,基因组区域的表达水平通过检测由本文所述的基因组区域内的核酸编码的蛋白质的水平来测定。

就这一点而言,本公开不一定限于检测包含本文所述的特定氨基酸序列的蛋白质。相反,本公开包括检测变体序列(例如,具有至少约80%或90%或95%或98%的氨基酸序列同一性)或检测所述蛋白质的免疫原性片段或表位。

使用技术人员已知的多种技术中的任何技术诸如,例如选自由以下组成的组的技术来测定多肽的量、水平或存在:免疫组织化学、免疫荧光、免疫印迹、western印迹、斑点印迹、酶联免疫吸附测定(elisa)、放射免疫测定(ria)、酶免疫测定、荧光共振能量转移(fret)、基质辅助激光解吸/电离飞行时间(maldi-tof)、电喷雾电离(esi)、质谱法(包括串联质谱法,例如lcms/ms)、生物传感器技术、瞬逝光纤技术或蛋白质芯片技术。

在一个实例中,用于测定蛋白质的量或水平的测定是半定量测定。在另一个实例中,该测定用于在定量测定中测定蛋白质的量或水平。如从前面的描述中显而易见的是,此类测定可能需要使用合适的对照,例如,来自正常个体或匹配的正常对照。

标准固相elisa或flisa形式在测定来自多种样品的蛋白质浓度方面特别有用。

在一种形式中,此类测定包括将生物样品固定在固体基质(诸如聚苯乙烯或聚碳酸酯微孔或油尺(dipstick)、膜或玻璃载体(例如载玻片))上。将与本文描述的蛋白质特异性结合的抗体与固定的生物样品直接接触,并与存在于所述样品中的任何其靶蛋白质形成直接的键。通常用可检测的报告分子,诸如,例如在flisa的情况下,荧光标记(例如fitc或texasred)或荧光半导体纳米晶体(如us6,306,610中所述的),或在elisa的情况下,酶(例如辣根过氧化物酶(hrp)、碱性磷酸酶(ap)或β-半乳糖苷酶)来标记该抗体,或者可选地,可使用结合第一抗体的第二标记抗体。在洗涤以除去任何未结合的抗体后,在荧光标记的情况下,直接检测标记物,或者在酶促标记的情况下,通过添加底物诸如例如过氧化氢、tmb或甲苯胺或5-溴-4-氯-3-吲哚-β-d-吡喃半乳糖苷(x-gal)来检测标记物。

在另一种形式中,elisa或flisa包括将特异性结合上述蛋白质的抗体或配体固定在固体基质(例如膜、聚苯乙烯或聚碳酸酯微孔、聚苯乙烯或聚碳酸酯油尺或玻璃载体)上。然后使样品与所述抗体形成物理关系,并将多肽结合或“捕获”。然后使用标记的抗体检测结合的蛋白质。例如,使用结合与第一(捕获)抗体所结合的表位不同的表位的标记抗体来检测捕获的蛋白质。或者,可以使用结合第二(检测)抗体的第三标记抗体。

在另一个实例中,使用例如生物传感器仪器(例如,biacoretm,pharmaciabiosensor,piscataway,n.j.)检测体液中的蛋白质的存在或水平。在此类测定中,将特异性结合蛋白质的抗体或配体固定在受体芯片的表面上。例如,将抗体或配体共价连接至附着于生物传感器装置的流动池内的金膜上的葡聚糖纤维上。使测试样品通过所述池。体液样品中存在的任何抗原与固定的抗体或配体结合,引起介质在金膜上的折射率变化,这被检测为金膜的表面等离子体共振的变化。

在另一个实例中,使用蛋白质和/或抗体芯片检测蛋白质或其片段或表位的存在或水平。为了产生此类芯片,将与目标抗原结合的抗体或配体结合至固体载体(诸如,例如玻璃、聚碳酸酯、聚四氟乙烯、聚苯乙烯、氧化硅、金或氮化硅上。该固定是直接的(例如通过共价键联,诸如,例如希夫碱形成、二硫键联或酰胺或脲键形成)或间接的。

为了将蛋白质结合至固体载体上,通常必需诸如,例如用含醛的硅烷试剂或lee等,proteomics,3:2289-2304,2003中所述的杯冠化合物衍生物处理固体载体以在表面上生成化学反应基团。链霉亲和素芯片也可用于捕获已与生物素缀合的蛋白质和/或肽和/或核酸和/或细胞(例如,如pavlickova等,biotechniques,34:124-130,2003中所述的)。或者,将肽捕获在微加工的聚丙烯酰胺凝胶垫上并使用微电泳将其加速进入凝胶,如arenkov等anal.biochem.278:123-131,2000中所述的。

还设想了其它测定形式,诸如流通免疫测定(pct/au2002/01684)、侧流免疫测定(us20040228761、us20040248322或us20040265926)、荧光偏振免疫测定(fpia)(美国专利第4,593,089号、第4,492,762号、第4,668,640号和第4,751,190号)、均质微粒免疫测定法(“hmi”)(例如,美国专利第5,571,728号、第4,847,209号、第6,514,770号和第6,248,597号)或化学发光微粒免疫测定(“cmia”)。

3多重测定形式

本公开还设想了多重或多分析物形式测定来改善本文所述的诊断和/或预后方法的准确性或特异性。此类测定也可通过测定来提高群体覆盖率。

用于确定测定的灵敏度的方法对于技术人员将是显而易见的。例如,本文所述的测定用于分析测试受试者的群体以确定将发展成癌症的那些群体。然后使用事后分析来确定实际确定乳腺癌的那些受试者。测定“真阳性”(即,发展成乳腺癌并且使用本公开的方法阳性鉴定的受试者)和“真阴性”(即,未发展乳腺癌并且未使用本公开的方法鉴定的受试者)的数目。

然后通过以下公式测定所述测定的灵敏度:

真阳性数目/(真阳性数目+假阴性数目)。

在一个实例中,本公开的方法在预测患有esr1阳性乳腺癌的受试者响应于内分泌疗法的可能性方面具有高度的灵敏度。例如,在测试的个体群体中,本公开的方法能够预测受试者不会响应于内分泌疗法,例如,在至少约50%的患有不响应于内分泌疗法的esr1阳性乳腺癌的受试者中,例如,在至少约60%的患有不响应于内分泌疗法的esr1阳性乳腺癌的受试者中,例如,在至少约65%的患有不响应于内分泌疗法的esr1阳性乳腺癌的受试者中,例如,在至少约70%的患有不响应于内分泌疗法的esr1阳性乳腺癌的受试者中,例如,在至少约75%的患有不响应于内分泌疗法的esr1阳性乳腺癌的受试者中,例如,在至少约80%的患有不响应于内分泌疗法的esr1阳性乳腺癌的受试者中,例如,在至少约85%的患有不响应于内分泌疗法的esr1阳性乳腺癌的受试者中,例如,在至少约90%的患有不响应于内分泌疗法的esr1阳性乳腺癌的受试者中,例如,在至少约95%的患有不响应于内分泌疗法的esr1阳性乳腺癌的受试者中。

在另一实例中,本公开的方法在检测内分泌疗法难以治疗的esr1阳性乳腺癌方面具有高度的灵敏度。例如,在测试的个体群体中,本公开的方法检测到至少约50%的发展或患有内分泌疗法难以治疗的esr1阳性乳腺癌的受试者,例如,至少约60%的发展或患有内分泌疗法难以治疗的esr1阳性乳腺癌的受试者,例如,至少约65%的发展或患有内分泌疗法难以治疗的esr1阳性乳腺癌的受试者,例如,至少约70%的发展或患有内分泌疗法难以治疗的esr1阳性乳腺癌的受试者,例如,至少约75%的发展或患有内分泌疗法难以治疗的esr1阳性乳腺癌的受试者,例如,至少约80%的发展或患有内分泌疗法难以治疗的esr1阳性乳腺癌的受试者,例如,至少约85%的发展或患有内分泌疗法难以治疗的esr1阳性乳腺癌的受试者,例如,至少约90%的发展或患有内分泌疗法难以治疗的esr1阳性乳腺癌的受试者,例如,至少约95%的发展或患有内分泌疗法难以治疗的esr1阳性乳腺癌的受试者。

在另一个实例中,本公开的方法在将与内分泌疗法后的与预后特征相关的esr1阳性乳腺癌亚型(例如,诸如可能响应于内分泌疗法的esr1阳性乳腺癌患者的群体和不可能响应于内分泌疗法的esr1阳性乳腺癌患者的群体)进行分级方面具有高度灵敏度。这样,本公开的方法在预测接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗结果和/或进展方面具有高度的敏感度。例如,在患有esr1阳性乳腺癌的测试的个体群体中,根据疾病结果,本公开的方法将至少约50%的患有esr1阳性乳腺癌的受试者进行分级,例如根据疾病结果,将至少约60%的患有esr1阳性乳腺癌的受试者分级,例如根据疾病结果,将至少约70%的患有esr1阳性乳腺癌的受试者分级,例如根据疾病结果,将至少约80%的患有esr1阳性乳腺癌的受试者分级,例如根据疾病结果,将至少约85%的患有esr1阳性乳腺癌的受试者分级,例如根据疾病结果,将至少约90%的患有esr1阳性乳腺癌的受试者分级,例如根据疾病结果,将至少约95%的患有esr1阳性乳腺癌的受试者分级。根据本实例的疾病结果是乳腺癌患者在内分泌疗法后存活至少3年,例如内分泌疗法后存活至少5年,例如内分泌疗法后存活至少10年的可能性。

特异性由以下公式确定:

真阴性的数目/(真阴性的数目+假阳性的数目)。

用于本公开的方法中的示例性多重测定包括例如检测表1-3中所示的多个雌激素应答性增强子区域中的一个或多个cpg二核苷酸的差异甲基化。在一个实例中,所述方法包括检测表1-3中所示的多个雌激素应答性增强子区域中的一个或多个cpg二核苷酸的甲基化水平,以预测患有esr1阳性乳腺癌的受试者的对内分泌疗法的响应。在另一个实例中,所述方法包括检测表1-3中所示的多个雌激素应答性增强子区域中的一个或多个cpg二核苷酸的甲基化水平,以诊断内分泌疗法难以治疗的esr1阳性乳腺癌。在另一个实例中,所述方法包括检测表1-3中所示的多个雌激素应答性增强子区域中的一个或多个cpg二核苷酸的甲基化水平,以将接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗结果和/或进展分级和/或预测所述治疗结果和/或进展。

本公开的多重测定不限于目标区域(即,每个雌激素应答性增强子区域)内的单个cpg二核苷酸处的甲基化的检测。相反,本公开设想了检测每个核酸中足够数量的cpg二核苷酸处的甲基化以提供诊断/预后。例如,本公开设想了检测每个核酸(即,每个雌激素应答性增强子区域)中的1个或2个或3个或4个或5个或7个或9个或10个或15个或20个或25个或30个cpg二核苷酸处的甲基化。优选地,本公开设想了检测每个核酸(即每个雌激素应答性增强子区域)中多于1个cpg二核苷酸处的甲基化。

如将从先前描述中显而易见的,甲基化特异性微阵列适合于此类高密度分析。先前,已使用此类微阵列分析了多达232个cpg二核苷酸(adorján等,nucl.acidsres.30:e21,2002)。

本公开的方法可包括一个或多个测定,以测定跨越、包含表1-3中所示的至少一个雌激素应答性增强子区域或与其紧密相关的基因的表达水平,以预测患有esr1阳性乳腺癌的受试者的对内分泌疗法的响应。本公开的方法可包括一个或多个测定,以测定跨越、包含表1-3中所示的至少一个雌激素应答性增强子区域或与其紧密相关的基因的表达水平,以诊断内分泌疗法难以治疗的esr1阳性乳腺癌。本公开的方法可包括一个或多个测定,以测定跨越、包含表1-3中所示的至少一个雌激素应答性增强子区域或与其紧密相关的基因的表达水平,以将接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗结果和/或进展分级和/或预测所述治疗结果和/或进展。例如,该方法可包括检测对应于跨越、包含表1-3中所示的至少一个雌激素应答性增强子区域或与其紧密相关的基因的mrna或蛋白质的水平。或者,可测定从跨越、包含表1-3中所示的至少一个雌激素应答性增强子区域或与其紧密相关的一个或多个基因表转录的mrna水平和由相同的或不同的跨越、包含表1-3中所示的至少一个雌激素应答性增强子区域或与其紧密相关的基因表达的一种或多种蛋白质的水平。

先前描述的检测技术中的每一种可在所述的诊断和/或预测方法中彼此独立地使用。因此,可以分析单个样品以测定一个或多个雌激素应答性增强子区域中的一个或多个cpg二酷苷酸的甲基化水平,并测定一种或多种核酸和/或蛋白质的表达水平。根据该实例,表1-3中定义的一个或多个雌激素增强子区域内的一个或多个cpg二核苷酸的高甲基化以及跨越、包含表1-3中所示的至少一个雌激素应答性增强子区域或与其紧密相关的一个或多个基因的表达降低,指示(i)受试者可能响应于内分泌疗法,例如对内分泌疗法无应答,(ii)esr1阳性乳腺癌是内分泌疗法难以治疗的,和/或(iii)接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的可能治疗结果和/或进展。

基于本文提供的教导,多种测定组合对于技术人员将是显而易见的。

本公开还设想将已知的诊断测定与本文所述的测定结合使用。

样品

用于本公开的方法的样品例如来自疑似含有esr1阳性乳腺癌或esr1阳性乳腺癌细胞的组织。例如,细胞来自被认为包含esr1阳性乳腺癌或esr1阳性乳腺癌细胞的组织的区域。这并不排除起源于特定组织但从远程来源分离的细胞。

样品可取自疑似患有esr1阳性乳腺癌的受试者。例如,样品可取自患有esr1阳性乳腺癌且疑似患有内分泌疗法难以治疗的esr1阳性乳腺癌或处于发展所述乳腺癌的风险中的受试者。例如,受试者可具有esr1阳性乳腺癌(包括对内分泌疗法具有抗性,或发展对内分泌疗法的抗性的esr1阳性乳腺癌)的家族史。受试者可能已经历任何其它测试以检测任何形式的esr1阳性乳腺癌。

在一个实例中,样品包括体液或体液的衍生物或身体分泌物。例如,体液选自由全血、尿液、唾液、母乳、胸膜液、汗液、泪液及其混合物组成的组。体液衍生物的实例选自由血浆、血清或血沉棕黄层级分组成的组。在一个实例中,样品包括全血样品、血清样品或血浆样品。

在一个实例中,从以下的任一种分离dna:源自经诊断患有乳腺癌的患者或健康对照的血液的全血、血浆、血清、外周血单核细胞(pbmc)或富集的上皮细胞。然后可对dna进行亚硫酸氢盐转化,并且可通过以下的任一种检测基因特异性甲基化的序列:甲基化特异性头环抑制pcr、maldi-tof质谱(sequenom)或其它基于亚硫酸氢盐的pcr测定。

优选地,样品包括有核细胞或其提取物。更优选地,样品包括乳腺癌细胞,例如esr1阳性乳腺癌细胞或其提取物。

在另一个实例中,样品包括来自乳腺癌细胞的核酸和/或蛋白质,例如来自esr1阳性乳腺癌细胞的核酸和/或蛋白质。核酸和/或蛋白质可以不必与细胞分离,而是可以来自例如裂解的细胞。

由于本公开提供了用于早期检测在中至长期中内分泌疗法难以治疗的esr1阳性乳腺癌的方法,因此术语乳腺癌细胞不受所述乳腺癌细胞所源自的受试者的癌症分期(即,无论患者是处于缓解中还是正在经历疾病复发或者无论esr1阳性乳腺癌是原发性肿瘤还是转移的结果)的限制。术语“乳腺癌细胞”、“癌细胞”或类似术语也不被所述癌细胞的细胞周期阶段所限制。

在一个实例中,样品包括来自乳腺的细胞或多个细胞。

在一个实例中,生物样品先前已经从受试者中分离出来。根据该实例,离体地进行本公开的方法。在该情况下,样品可以被加工或部分加工成基本上不含污染性蛋白质的核酸样品。所有此类实例都由本公开涵盖。

从受试者中分离样品的方法是本领域已知的,并且包括例如手术、活组织检查、体液采集,例如通过穿刺或胸腔穿刺,或例如血液或其级分的采集。所有此类用于分离生物样品的方法应被认为是在提供或获得样品的范围内。

例如,在乳腺癌的情况下,例如使用细针穿刺活检、芯针穿刺活检或手术活组织检查来采集样品。

从先前描述中将显而易见的是,由本公开提供的方法涉及一定程度的定量,以测定疑似包含癌细胞或其转移灶的组织中的核酸的升高或增强的甲基化,或疑似包含癌细胞或其转移灶的组织中的降低的基因表达。通过在如下所述的测定中包含适当的对照样品来容易地提供这样的定量。

对于技术人员将显而易见的是,当内部对照不包括在所进行的每个测定中时,可以从已建立的数据集中导出对照。

关于对照受试者的数据选自由以下组成的组:

1.数据集,其包含已知患有esr1阳性乳腺癌的受试者的典型群体的甲基化程度和/或基因表达的测量结果,所述esr1阳性乳腺癌在测试所述受试者时响应于内分泌疗法;

2.数据集,其包含待测试的受试者的甲基化程度和/或基因表达的测量结果,其中所述测量结果是先前产生的,诸如,例如当已知受试者健康时,或在患有esr1阳性乳腺癌的受试者的情况下,当受试者处于疾病进展阶段时,当esr1阳性乳腺癌响应于内分泌疗法时;

3.数据集,其包含对健康个体或健康个体的群体的甲基化程度和/或基因表达的测量结果;

4.数据集,其包含对正常个体或正常个体的群体的甲基化程度和/或基因表达的测量结果;

5.数据集,其包含被诊断为患有不同于被表征为是esr1阴性亚型或内分泌疗法难以治疗的esr1阳性亚型的乳腺癌的癌症的个体或个体的群体的甲基化程度和/或基因表达的测量结果;和

6.数据组,其包含来自被测试的受试者的甲基化程度和/或基因表达的测量结果,其中在匹配样品中测定测量结果。

在优选实例中,包含健康受试者个体或群体的甲基化程度和/或基因表达的测量结果的数据与来自受试者个体或群体的健康乳腺上皮细胞相关。

基于本文提供的教导,本领域技术人员能够容易地确定用于在本公开的任何诊断/预后测定中进行比较的基线而无需过度实验。

在本说明书上下文中,关于已知患有响应于内分泌疗法的esr1阳性乳腺癌的受试者的术语“典型群体”应被认为指经诊断患有特定形式的esr1阳性乳腺癌的受试者的群体或样品,其代表患有esr1阳性乳腺癌的受试者谱。这不能被视为需要形态学或临床病理学参数在群体中的严格正态分布,因为这种分布的一些变化是允许的。优选地,“典型群体”将展现处于疾病进展的不同阶段以及具有处于不同分期的肿瘤和具有不同的形态学或分化程度的一系列esr1阳性乳腺癌的亚型。

在本说明中,术语“健康个体”应被认为意指已知不患有乳腺癌的个体,此类知识来源关于个体的临床数据。关于与乳腺癌相关的任何症状,健康个体优选是无症状的。

术语“正常个体”应被认为意指在来源于所述个体的特定样品中具有如本文所述的正常水平的基因组区域处的甲基化和/或基因表达的个体。

如本领域技术人员将会知道的,从足够大的群体样品获得的数据将标准化,从而允许生成用于确定特定参数的平均水平的数据集。因此,可测定个体的任何群体和来源于所述个体的任何样品的如本文所述的甲基化和/或基因表达水平,以供随后与针对被测样品测定的水平进行比较。在依赖于此类标准化数据集的情况下,内部对照优选地包括在为了控制变化而进行的每个测定中。

术语“匹配的样品”应被认为意指对照样品在大致相同的时间点源自与测试样品所源自的受试者相同的受试者。在一个实例中,对照样品几乎不显示或不显示癌症的形态学和/或病理学指征。匹配的样品不适用于基于血液或血清的测定。因此,匹配的样品优选来自与测试样品相同的组织的区域,所述组织例如乳腺组织,诸如乳腺上皮组织,然而似乎不包含癌细胞。例如,匹配的样品不包括恶性细胞或表现出疾病的任何症状。例如,样品包括少于约20%的恶性细胞,例如少于约10%的恶性细胞,例如少于约5%的恶性细胞,例如少于约1%的恶性细胞。恶性细胞的形态学和病理学适应症在本领域中是已知的和/或描述于本文中。

在一个实例中,表1-3中定义的一个或多个雌激素应答性增强子区域内的一个或多个cpg二核苷酸相对于对照的相应的一个或多个cpg二核苷酸的甲基化状态的差异甲基化指示受试者可能响应于内分泌疗法。例如,一个或多个cpg二核苷酸的高甲基化指示患有esr1阳性乳腺癌的受试者将对内分泌疗法具有抗性。或者,一个或多个cpg二核苷酸的非高甲基化指示受试者患有响应于内分泌疗法的esr1阳性乳腺癌。

在另一个实例中,表1-3中定义的一个或多个雌激素应答性增强子区域内的一个或多个cpg二核苷酸相对于对照的相应的一个或多个cpg二核苷酸的甲基化状态的差异甲基化诊断对内分泌疗法难以治疗的esr1阳性乳腺癌。例如,一个或多个cpg二核苷酸的高甲基化诊断对内分泌疗法难以治疗的esr1阳性乳腺癌。或者,一个或多个cpg二核苷酸的非高甲基化诊断响应于内分泌疗法esr1阳性乳腺癌。

在另一个实例中,表1-3中定义的一个或多个雌激素应答性增强子区域内的一个或多个cpg二核苷酸相对于对照的相应的一个或多个cpg二核苷酸的甲基化状态的差异甲基化,预测接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的可能治疗结果和/或进展。例如,一个或多个cpg二核苷酸的高甲基化预测正在接受或即将接受内分泌疗法的患有esr1阳性乳腺癌的受试者将不会响应于治疗和/或癌症将进展至恶化阶段。或者,一个或多个cpg二核苷酸的非高甲基化预测正在接受或即将接受内分泌疗法的患有esr1阳性乳腺癌的受试者将具有良好的治疗结果和/或癌症不会进展至恶化阶段。

在一个替代实例中,与表1-3中定义的一个或多个雌激素应答性增强子区域内的一个或多个cpg二核苷酸重叠、跨越其或与其紧密相关的基因相对于对照的相应的基因表达水平的差异表达,指示受试者可能响应于内分泌疗法。例如,与一个或多个cpg二核苷酸重叠、跨越其或与其紧密相关的基因的表达降低指示患有esr1阳性乳腺癌的受试者将对内分泌疗法具有抗性。或者,未降低的与一个或多个cpg二核苷酸重叠、跨越其或与其紧密相关的基因的表达指示受试者患有响应于内分泌疗法的esr1阳性乳腺癌。

在另一个替代实例中,与表1-3中定义的一个或多个雌激素应答性增强子区域内的一个或多个cpg二核苷酸重叠、跨越其或与其紧密相关的基因相对于对照的相应的基因表达水平的差异表达诊断内分泌疗法难以治疗的esr1阳性乳腺癌。例如,与一个或多个cpg二核苷酸重叠、跨越其或与其紧密相关的基因的表达降低诊断内分泌疗法难以治疗的esr1阳性乳腺癌。或者,降低的与未一个或多个cpg二核苷酸重叠、跨越其或与其紧密相关的基因的表达诊断响应于内分泌疗法的esr1阳性乳腺癌。

在另一个替代实例中,与表1-3中定义的一个或多个雌激素应答性增强子区域内的一个或多个cpg二核苷酸重叠、跨越其或与其紧密相关的基因相对于对照的相应的基因表达水平的差异表达,预测正在接受或即将接受内分泌疗法的受试者的esr1阳性乳腺癌的治疗结果和/或可能的进展。例如,与一个或多个cpg二核苷酸重叠、跨越其或与其紧密相关的基因的表达降低预测正在接受或即将接受内分泌疗法的患有esr1阳性乳腺癌的受试者将不会响应于治疗和/或癌症将进展到恶化阶段。或者,未降低的与一个或多个cpg二核苷酸重叠、跨越其或与其紧密相关的基因的表达预测正在接受或即将接受内分泌疗法的患有esr1阳性乳腺癌的受试者将具有良好的治疗结果和/或癌症不会进展至恶化阶段。

可使表1-3中所示的一个或多个雌激素应答性增强子区域内的一个或多个cpg二核苷酸的差异甲基化水平经历多变量分析以产生一种算法,所述算法使得能够确定患有esr1阳性乳腺癌的受试者将对内分泌疗法具有抗性或响应于内分泌疗法,例如esr1阳性乳腺癌亚型的分级,和/或正在接受或即将接受内分泌疗法的患有esr1阳性乳腺癌的受试者将响应于或正在响应于内分泌疗法,和/或esr1阳性乳腺癌在内分泌疗法后将进展至恶化阶段的概率指数。因此,在一个实例中,本公开提供了基于甲基化生物标志物与对照样品的水平的比较的应用的法则。在另一个实例中,该法则基于统计和机器学习算法的应用。此类算法使用甲基化生物标志物与在训练数据(具有已知疾病状态)中观察到的疾病状态之间的关系来推断随后用于预测具有未知状态的患者的状态的关系。数据分析领域的熟练技术人员认识到,可以使用训练数据中推断关系的许多不同形式,而不实质上改变本公开。

术语“状态”应被认为包括受试者是否患有响应于内分泌疗法或内分泌疗法难以治疗的esr1阳性乳腺癌(即,诊断状态),esr1阳性乳腺癌是否已响应于内分泌疗法和/或已发展了对其的抗性。

如上述段落中所述的分析也可考虑临床参数或常规实验室风险因素。

通过使用包括统计分类算法等在内的各种公式,将组合的性能特征组合并且在许多情况下将其扩展到任何单个数据点之外,可以将如上论述的信息组合起来,使其在临床上更加有用。这些特定的组合显示出可接受水平的诊断/预后准确性,并且当来自多个标志物的足够信息被组合到经过训练的公式中时,通常可靠地实现了可从一个群体移至另一个群体的高水平的诊断/预后准确性。

可使用本领域已知的几种统计和建模算法来辅助生物标志物选择的选择并优化组合这些选择的算法。统计工具(诸如因子和交叉生物标志物相关性/协方差分析)允许更合理的方法来进行小组构建。可有利地使用显示生物标志物之间的欧几里得标准化距离(euclideanstandardizeddistance)的数学聚类和分类树。还可以采用此类统计分类技术的途径告知的接种(pathwayinformedseeding),同样地可以使用基于它们普遍地参与特定途径或生理功能或个体表现,可使用基于个体生物标志物(例如,诸如表1-3中所示的雌激素应答性增强子区域内的那些cpg二核苷酸)的选择的推理方法。

最终,公式(诸如统计分类算法)可直接用于选择甲基化生物标志物以及生成和训练将多个甲基化生物标志物的结果组合成单一指标所必需的最佳公式。通常使用诸如向前(从零潜在说明性参数)和向后选择(从所有可用的潜在说明性参数)的技术,并且使用信息标准来定量小组的表现和诊断/预后准确性与所使用的甲基化生物标志物的数目之间的权衡关系。在向前或向后选择的小组上的单个甲基化生物标志物的位置可与其为该算法提供递增的信息内容紧密相关,因此贡献的顺序高度依赖于小组中的其它构成生物标志物。

任何公式都可以用于将甲基化生物标志物结果组合成在本公开的实践中有用的指数或指标。如本文所指出的且非限制性地,此类指数可在各种其它标志之中指示疾病的概率、可能性、绝对或相对风险、时间或速率,从一种疾病状态至另一种疾病状态的转变,或预测癌症的未来生物标志物的测量值。这可以持续特定的时间段或时间范围,或持续终身风险,或仅被提供作为相对于另一个参考受试者群体的指标。

所使用的实际模型类型或公式本身可基于其在训练群体中的结果的性能和诊断准确性特征从潜在模型的领域中选择。公式本身的细节通常可以从相关训练群体中的生物标志物结果中得出。在其它用途中,此类公式可旨在将来源于一个或多个生物标志物输入的特征空间映射至一组受试者类别(例如,用于预测受试者的类别成员为正常,预测为患有响应于内分泌疗法或对内分泌疗法具有抗性/内分泌疗法难以治疗的esr1阳性乳腺癌,或处于发展对内分泌疗法的抗性的风险中),旨在使用贝叶斯方法(bayesianapproach)得出对风险(例如,对内风险疗法具有抗性/内分泌疗法难以治疗的esr1阳性乳腺癌的风险,或处于发展对内分泌疗法的抗性的风险中)的概率函数的估计,或者旨在估计类别条件概率,然后使用贝叶斯法则(bayes’rule)产生类别概率函数(如在先前的情况下)。

在分析和确定响应内分泌疗法或对内分泌疗法具有抗性/内分泌疗法难以治疗的esr1阳性乳腺癌的存在或不存在或处于发展对内分泌疗法的抗性的风险中的概率指数后,可将该指数传送或提供给第三方(例如,执业医生)进行评估。医生可使用该指数来评估是否需要另外的诊断方法,例如活组织检查和组织学分析和/或其它测定,或者改变治疗,例如远离内分泌疗法或开始治疗(例如内分泌疗法)。

监测治疗的功效和疾病进展

由于esr1-阳性乳腺癌的甲基化谱可以随着癌症的进展而变化,因此先前响应于内分泌疗法的患有esr1阳性乳腺癌,或先前已经鉴定为具有指示响应于内分泌疗法的甲基化谱的受试者可能(随着时间的推移)获得指示对内分泌疗法的抗性,从而发展对内分泌疗法的抗性的甲基化谱。因此,本文所述的方法可用于监测患有esr1阳性乳腺癌的的受试者的esr1阳性乳腺癌的进展以及监测治疗功效。就这一点而言,术语“监测esr1阳性乳腺癌的进展”和/或“监测治疗的功效”包括例如确定患有esr1阳性乳腺癌的受试者是否保留指示响应于内分泌疗法的甲基化谱,或获得指示对内分泌疗法的抗性的甲基化谱。例如,该方法包括测定来自受试者的样品中的表1、表2和/或表3中所示的一个或多个雌激素应答性增强子区域内的一个或多个cpg二核苷酸,相对于先前针对受试者或对照样品测定的相应的一个或多个cpg二核苷酸的参考甲基化水平的差异甲基化。

在一个实例中,与先前获得的样品相比,样品中的一个或多个cpg二核苷酸处的甲基化增加可以表明esr1阳性乳腺癌例如通过获得对内分泌疗法的抗性已经进展至恶化阶段。在此类情况下,可能需要乳腺癌的替代或另外的治疗。

在另一个实例中,与先前获得的样品相比,样品中一个或多个cpg二核苷酸处的甲基化降低可表明esr1阳性乳腺癌已经改善,即受试者响应于治疗,和/或保持响应于或已变得响应于内分泌疗法。例如,在其中受试者保持指示响应于内分泌疗法的甲基化谱并且已在进行内分泌疗法的情况下,可能期望继续内分泌疗法。例如,在其中受试者先前已被确定具有指示对内分泌疗法的抗性的甲基化谱且因此不经历内分泌疗法的情况下,可能期望开始内分泌疗法。

显然,不同于表1-3中所示的那些生物标志物的一个或多个另外的生物标志物的检测包括在本公开的这个实例中。

用于检测标志物的方法在本文中进行了描述,并且将被用来加以必要的修改以适用于本公开的这个实例。

治疗方法

本公开另外提供了治疗esr1阳性乳腺癌的方法。此类方法包括例如使用本文描述的任何一个或多个实例中描述的本公开的方法诊断esr1阳性乳腺癌,并基于受试者是被确定为响应于内分泌疗法还是对内分泌疗法具有抗性,施用合适的治疗性化合物或进行手术或推荐利用合适的治疗性化合物的治疗,或推荐进行手术。例如,如果在进行本公开的诊断或预后的方法后,受试者被确定为响应于内分泌疗法,则该方法可包括开始内分泌疗法,例如通过施用阻断、改变或除去雌激素和/或孕酮的活性的治疗性化合物,或推荐受试者开始内分泌疗法。在另一个实例中,如果在进行本公开的诊断或预后的方法后,受试者被确定为对内分泌疗法具有抗性/内分泌疗法难以治疗的,则该方法可包括开始不同于内分泌疗法的治疗,例如化学疗法或放射疗法和/或进行手术,或推荐受试者开始不同于内分泌疗法的治疗,例如化学疗法或放射疗法,和/或推荐手术。

适用于内分泌疗法的药物是本领域所公知的,包括例如阿那曲唑、依西美坦、氟维司群、戈舍瑞林、来曲唑、亮丙瑞林、醋酸亮丙瑞林、甲地孕酮、帕博西尼、他莫昔芬和托瑞米芬。

适用于治疗乳腺癌的化学治疗药物是本领域已知的,但可以包括例如多西他赛、紫杉醇、铂剂(顺铂、卡铂)、长春瑞滨、卡培他滨、阿霉素脂质体、吉西他滨、米托蒽醌、伊沙匹隆、白蛋白结合的紫杉醇和艾日布林。

试剂盒

本公开另外提供了用于本公开的方法中的试剂盒。在一个实施方案中,该试剂盒包含:

(i)与本文根据任何实例描述的生物标志物(cpg二核苷酸)特异性杂交的一种或多种探针或引物(或分离的抗体或配体);和

(ii)检测工具。

在另一个实例中,试剂盒另外还包含参考样品。此类参考样品可以例如是来源于从一个或多个患有乳腺癌的受试者分离的样品的多核苷酸样品。或者,参考样品可包括从一个或多个正常健康个体分离的样品。

在一个实例中,试剂盒包含探针或引物。在一个实例中,能够与本文根据任何实例所述的雌激素应答性增强子区域的cpg二核苷酸选择性杂交的探针或引物。

在其中探针尚不可用的情况下,必须产生它们。用于此类合成的装置目前可商购获得,并且用于各种核酸合成的技术可从文献中获得。用于产生探针或引物的方法是本领域已知的和/或本文描述的。

在一个实例中,探针或引物与表1-3中所示的雌激素应答性增强子区域的cpg二核苷酸选择性地杂交,如果残基未被甲基化,则通过例如亚硫酸氢盐处理来选择性地使所述cpg二核苷酸突变。在另一个实例中,探针或引物与表1-3中所示的基因组区域的cpg二核苷酸选择性杂交,所述cpg二核苷酸可在esr1阳性乳腺癌细胞中被甲基化。

试剂盒还可包含用于检测本文公开的任何靶基因的甲基化水平和用于将这些甲基化水平与参考水平进行比较的说明书。说明书可提供一个或一系列截止值,其标定受试者患有响应于内分泌疗法或对内分泌疗法具有抗性的esr1阳性乳腺癌的风险的可能性。

本公开另外提供了包含用于治疗性治疗esr1阳性乳腺癌的化合物的试剂盒或制品,所述化合物与用于执行基本上如本文根据本公开的任何实例所述的方法的说明书一起包装。例如,如果esr1阳性乳腺癌被确定为响应于内分泌疗法,则该试剂盒可包含阻断、改变或除去雌激素和/或孕酮的活性的治疗性化合物,例如阿那曲唑、依西美坦、氟维司群、戈舍瑞林、来曲唑、亮丙瑞林、醋酸亮丙瑞林、甲地孕酮、帕博西尼、他莫昔芬或托瑞米芬。另一方面,如果esr1阳性乳腺癌被确定为对内分泌疗法具有抗性,则试剂盒可包含本领域已知用于治疗乳腺癌的化学治疗药物,例如多西他赛、紫杉醇、铂剂(顺铂、卡铂)、长春瑞滨、卡培他滨、阿霉素脂质体、吉西他滨、米托蒽醌、伊沙匹隆、白蛋白结合的紫杉醇和艾日布林

基于知识的系统

用于实现本公开的算法的基于知识的计算机软件和硬件也构成本公开的一部分。此类计算机软件和/或硬件对于执行本公开的方法是有用的。因此,本公开还提供了经编程以实现算法的软件或硬件,所述算法经由单变量或多变量分析处理通过执行本公开的方法获得的数据,以提供疾病指数值并提供或允许响应于内分泌疗法或对内分泌疗法具有抗性的esr1阳性乳腺癌的诊断,和/或用于治疗管理以在整个治疗期间确定esr1阳性乳腺癌的进展或状态,以利用疾病指数值与预定值比较的结果来确定对内分泌疗法的响应性或抗性是否可能有变化。

图10说明用于预测患有雌激素受体1(esr1)阳性乳腺癌的受试者的对内分泌疗法的响应的计算机系统100。计算机系统100包括连接到程序存储器104、数据存储器106、通信端口108和用户端口110的处理器102。程序存储器104是非暂态计算机可读介质,诸如硬盘驱动器、固态硬盘或cd-rom。软件,即存储在程序存储器104上的可执行程序使得处理器102执行本文公开的方法。例如,处理器102测定受试者中的一个或多个雌激素应答性增强子内的一个或多个cpg二核苷酸序列的甲基化状态;并且鉴定受试者中的所述一个或多个cpg二核苷酸序列相对于相应的一个或多个cpg二核苷酸序列的参考甲基化水平的数据的差异甲基化。受试者中的所述一个或多个cpg二核苷酸序列相对于参考水平的差异甲基化指示受试者可能响应于内分泌疗法。

如在本公开的计算机系统100的上下文中所用,术语“确定甲基化状态(determinesthemethylationstatus)”、“确定甲基化状态(determiningthemethylationstatus)”或类似术语是指计算、检索或接收指示受试者中的一个或多个cpg二核苷酸序列的甲基化状态的一个或多个数据值。这也适用于相关条款。

处理器102然后可将甲基化状态存储在数据存储106上,诸如ram或处理器寄存器上。处理器102还可经由通信端口108将所确定的甲基化状态发送到服务器(诸如病理学服务器)。

处理器102可从数据存储器106以及从通信端口108和连接到显示器112的用户端口110接收数据(诸如测序数据),所述显示器112向用户116诸如临床医生显示预测的响应的视觉表示114。在一个实例中,处理器102经由通信端口108(诸如通过使用局域网)接收来自测序仪的测序数据。尽管通信端口108和用户端口110被显示为不同的实体,但应当理解,可使用任何类型的数据端口来接收甲基化状态数据,诸如网络连接、存储器接口、处理器102的芯片封装的引脚,或逻辑端口,诸如ip套接字,或存储在程序存储器104上并由处理器102执行的功能的参数。这些参数可存储在数据存储器106上并且可按值或按引用(即,在源代码中为指针)来处理。

处理器102可通过所有这些接口来接收测序数据,所述接口包括易失性存储器(诸如超高速缓存储器或ram)或非易失性存储器(诸如光盘驱动器、硬盘驱动器、存储服务器或云存储)的存储器存取。计算机系统100还可在云计算环境(诸如托管动态数量的虚拟机的托管的互连服务器组)内实现。

应理解的是,在任何接收步骤之前都可由处理器102确定或计算稍后接收的数据。例如,处理器102确定甲基化状态并将甲基化状态存储在数据存储器106(诸如ram或处理器寄存器)中。处理器102然后诸如通过提供读取信号连同存储器地址来从数据存储器106请求数据。数据存储器106提供数据作为物理位线上的电压信号,并且处理器102经由存储器接口接收甲基化状态。

例如,处理器102可接受以存储在为远程(云)或本地的文件系统(包括网络附加存储器(nas)或服务器附加存储器(san))上的文件的形式存在的测序数据。处理器102分析这些测序数据并鉴定甲基化的胞嘧啶核苷酸(5-甲基胞嘧啶或5-mec)和/或胞嘧啶-至-尿嘧啶转换的核苷酸(任选地鉴定为胸腺嘧啶核苷酸)的存在。处理器102可通过比较接收的测序数据与参考数据并确定被甲基化的那些胞嘧啶核苷酸和/或未被甲基化的那些胞嘧啶核苷酸(例如,由于亚硫酸氢盐处理而还未被脱氨并由此转化成尿嘧啶的那些胞嘧啶核苷酸)来鉴定被甲基化的胞嘧啶核苷酸。处理器102将该鉴定的结果在文件系统上存储于单独的文件中,所述文件系统可以与其上存储有测序数据的文件系统相同或不同。

应当理解,除非另有说明,否则在整个本公开中,甲基化状态、序列、甲基化、水平、患者、受试者等可以指物理地存储在数据存储器106上或由处理器102处理的数据结构。另外,为了简洁起见,当提及诸如“差异甲基化”或“甲基化状态”的特定变量名称时,这可以被理解为指作为物理数据存储在计算机系统100中的变量的值。

用于预测对内分泌疗法的响应的方法可被理解为软件程序的蓝图,并且可以被逐步执行,使得每个步骤由编程语言(诸如c++或java)中的函数来表示。然后可将所得到的源代码编译为计算机可执行指令并存储在程序存储器104上,或作为可执行源代码诸如php或python提供。

处理器102可生成输出以指示预测的对内分泌疗法的响应。该输出可包括电子文档,诸如pdf文档。还可使该输出在临床医生可远程访问的网站上呈现。生成输出则可包括生成html代码并将该html代码存储在网络服务器的数据存储器上。这一代html代码可以动态地发生并由临床医生请求信息触发。可将预测的对内分泌疗法的响应存储在与受试者相关的数据库,诸如受试者数据库中。系统100可以使用用于用户界面生成的有角前端和用于数据库管理的flask后端来实现。

应该理解,本公开的技术可使用各种技术来实现。例如,本文所述的方法可通过驻留在合适的计算机可读介质上的一系列计算机可执行指令来实现。合适的计算机可读介质可包括易失性(例如ram)和/或非易失性(例如rom、盘)存储器、载波和传输介质。示例性载波可采取沿着本地网络或公共可访问的网络(诸如因特网)传送数字数据流的电、电磁或光学信号的形式。

应该理解的是,除非特别指出,否则从以下论述中显而易见的是,应理解,在整个说明书中,利用术语诸如“估计”或“处理”或“计算(computing)”或“计算(calculating)”、“优化”或“确定”或“显示”或“最大化”等的论述,在计算机系统100的上下文中,是指计算机系统或类似电子计算设备的作用和过程,其将在计算机系统的寄存器和存储器内表示为物理(电子)量的数据处理和转换成在计算机系统的存储器和寄存器或其它此类信息存储、传输或显示设备内类似地表示为物理量的其它数据。

在一个实例中,本公开的方法可用于与病理学服务相关的现有基于知识的体系结构或平台中。例如,可将来自本文所述的方法的结果经由通信网络(例如因特网)传送至处理系统,算法存储在所述处理系统中并用于生成预测的后验概率值,该值转化为疾病概率的指数(例如,响应于内分泌疗法或对内分泌疗法具有抗性的esr1阳性乳腺癌)或对治疗的响应性,然后以诊断或预测报告的形式将其提供给最终用户。

因此,本公开的方法可呈试剂盒或基于计算机的系统的形式,其包括检测生物标志物浓度所必需的试剂以及计算机硬件和/或软件以便于确定报告并将其传送给临床医生。

本公开的测定允许整合到现有的或新开发的病理学结构或平台系统中。例如,本公开设想了允许用户确定受试者关于esr1阳性乳腺癌的状态的方法,所述方法包括:

(a)接收数据,所述数据呈测试样品的表1-3中所示的一个或多个雌激素应答性增强子区域内的一个或多个cpg二核苷酸相对于参考甲基化水平的差异甲基化的水平的形式,任选地与乳腺癌例如esr1阳性乳腺癌的另一种标志物组合;

(b)经由单变量和/或多变量分析处理受试者数据以提供疾病指数值;

(c)根据疾病指数值与预定值比较的结果确定受试者的状态;和(d)参考多变量分析,经由通信网络将受试者状态的指示传送至用户包括执行所述多变量分析功能的算法。

在一个实例中,该方法还包括:

(a)使用户使用远端站确定数据;和

(b)经由通信网络将数据从终端站传送至基站。

基站可包括第一和第二处理系统,在这种情况下,该方法可包括:

(a)将数据传送至第一处理系统;

(b)将数据传送至第二处理系统;和

(c)使第一处理系统执行单变量或多变量分析功能以生成疾病指数值。

该方法还可包括:

(a)将单变量或多变量分析功能的结果传送至第一处理系统;和(b)使第一处理系统确定受试者的状态。

在该情况下,该方法还包括以下中的至少一个:

(a)通过第一防火墙在通信网络与第一处理系统之间传送数据;和

(b)通过第二防火墙在第一与第二处理系统之间传送数据。

可将第二处理系统耦合到适于存储预定数据和/或单变量或多变量分析功能的数据库,所述方法包括:

(a)查询数据库以从数据库获得至少选择的预定数据或对多变量分析功能的访问;和

(b)将所选择的预定数据与受试者数据进行比较或者生成预测概率指数。

可将第二处理系统耦合到数据库,该方法包括将数据存储在数据库中。

该方法还可包括让用户使用安全阵列来确定数据,所述元素的安全阵列能够确定生物标志物的水平并且具有多个特征,每个特征位于相应代码上的相应位置处。在该情况下,该方法通常包括使基站:

(a)从数据中确定代码;

(b)确定指示阵列上每个特征的位置的布局;和

(c)根据确定的布局和数据确定参数值。

该方法还可以包括使基站:

(a)确定付款信息,所述付款信息表示用户付款的提供;和

(b)响应于支付信息的确定而执行比较。

本公开还提供了用于确定受试者关于esr1阳性乳腺癌的状态的基站,所述基站包括:

(a)存储方法;

(b)处理系统,所述处理系统适于:

(i)经由通信网络从用户接收受试者数据;

(ii)根据算法功能(包括比较)的结果来确定受试者的状态;和

(c)经由通信网络向用户输出受试者状态的指示。

处理系统可适用于从适合于确定数据的远端站接收数据。

处理系统可以包括:

(a)第一处理系统,其适于:

(i)接收数据;和

(ii)根据单变量或多变量分析功能(包括比较数据)的结果确定受试者的状态;和

(b)第二处理系统,其适用于:

(i)从处理系统接收数据;

(ii)执行单变量或多变量分析功能(包括比较);和

(iii)将结果传送至第一处理系统。

基站通常包括:

(a)第一防火墙,其用于将第一处理系统耦合到通信网络;和

(b)第二防火墙,其用于耦合第一和第二处理系统。

处理系统可以耦合到数据库,处理系统适于将数据存储在数据库中。

现于以下的非限制性实施例中进一步描述本公开。

实施例

实施例1-内分泌抗性细胞中增强子基因座的dna甲基化图谱分析

为了探究dna甲基化重塑作为获得性内分泌抗性的关键组分,我们以使用infiniumhumanmethylation450微珠芯片,对esr1阳性激素敏感性mcf7细胞和三种不同的良好表征的内分泌抗性mcf7衍生的细胞系:他莫昔芬抗性(tamr)10、氟维司群抗性(fasr)11和雌激素剥夺抗性(mcf7x)12细胞一式两份进行甲基化图谱分析。

细胞培养和humanmethylation450k阵列

由juliagee博士(cardiffuniversity,uk)提供mcf7乳腺癌细胞和相应的内分泌抗性亚细胞系。简言之,将mcf7细胞维持在含有5%(v/v)胎牛血清(fcs)的基于rpmi-1640的培养基中。通过在含有5%活性炭脱除的fcs和4-oh-他莫昔芬(1×10-7m)(tam)的不含酚红的rpmi培养基中长期培养mcf7细胞来生成他莫昔芬抗性mcf7(tamr)细胞。通过在含有5%活性炭脱除的fcs和氟维司群(1×10-7m)(fas)的不含酚红的rpmi培养基中长期培养mcf7细胞来生成氟维司群抗性mcf-7(fasr)细胞。通过在含有5%活性炭脱除的fcs的不含酚红的rpmi培养基中长期培养mcf7细胞来生成长期雌激素剥夺的mcf7(mcf7x)细胞。建立内分泌抗性亚系并在6个月内分泌激发/雌激素剥夺暴露10,11,12之后进行表征。所有细胞系通过短串联重复序列(str)谱分析(cellbank,australia)进行认证,并且在认证之后培养不到6个月。使用qiagendneasy血液和组织试剂盒按照制造商的说明提取基因组dna。humanmethylation450k阵列由澳大利亚基因组研究机构(australiangenomeresearchfacility,agrf)(melbourne,australia)进行。细胞系humanmethylation450k阵列数据可在geo(gse69118)在线获得。

hm450分析

每条件两个生物学重复-在illumina’shumanmethylation450k阵列上对mcf7、tamr、mcf7x或fasr进行分析。使用preprocessillumina(bg.correct=真,normalize="对照",reference=1),利用biconductorminfi软件包(aryee等,(2014)bioinformatics30:1363-1369)预处理原始hm450数据并进行背景标准化;将所得m值用于统计分析,并将β值用于热图可视化和聚类。预处理数据的差异甲基化分析使用bioconductorlimma软件包来执行。

结果

显示亲本mcf7细胞与个体内分泌抗性细胞系的dna甲基化谱之间的相关性的密度图表明两者均为esr1阳性的mcf7x和tamr细胞(knowlden等,(2003)endocrinology144:1032-1044;staka等,(2005)endocrrelatcancer12:s85-97)主要获得dna甲基化,如由趋势线上方的点的密度增加所指示的。相反,为esr1阴性的fasr细胞(mcclelland等,(2001)endocrinology,142:2776-2788)相对于亲本mcf7细胞显示出高和低甲基化事件,如由对称密度分布指示的(图1a-c)。我们首先试图通过进行配对分析(即每个内分泌抗性细胞系对mcf7亲本对照)并重叠数据来鉴定存在于三个独特衍生的内分泌抗性细胞模型中的每一个中的常见差异dna甲基化事件(图1d)。我们发现在个体耐药细胞系之间,14,749个cpg探针通常被高甲基化(fdr<0.01),然而仅192个探针显示共有的低甲基化(fdr<0.01)(图1d)。

实施例2-内分泌抗性细胞中增强子基因座处的差异甲基化的功能基因组位置的表征

为了全面表征在内分泌抗性细胞模型中观察到的差异甲基化的功能基因组位置,我们使用先前在taberlay等,(2014)genomeresearch,24(9):1421-32中所述的mcf7基因组的chromhmm分割。

基因组分割和注释

由taberlay等人(2014)获得了mcf7基因组的chromhmm分割。为了我们的分析目地,将增强子(“增强子”和“增强子+ctcf”)和启动子类别(“启动子”,“启动子+ctcf”和“准备启动子”)分别合并为单个“增强子”和“启动子”状态。refseq转录物注释获自ucsc基因组浏览器(kent等(2002)genomeresearch12:996-1006(2002);meyer等(2013)nucleicacidsres.41:d64-69)。引人注目的是,在基因组的增强子区域中仅观察到了常见高甲基化的探针的显著富集(n=3932个探针,p<<0.0001;超几何检验)(图1e)。

我们接下来试图确定在所有内分泌抗性模型中被鉴定为甲基化程度更高的增强子区域是否受亲代mcf7细胞中的雌激素受体调节。对mcf7esr1(ross-innes等(2012)nature481:389-393)、gata3(theodorou等,(2013)genomeres.23:12-22)和foxa1(hurtado等,(2011)nat.genet.43:27-33)(与esr1-活性紧密相关的两个转录因子)使用再加工的公共可得的chipseq数据,我们发现增强子特异性cpg高甲基化的探针在esr1结合位点富集约6倍,在foxa1结合位点富集5倍以及在gata3结合位点富集8倍(p<0.0001;超几何检验)(图2a)。发现最大数量的高甲基化的增强子探针与esr1结合位点重叠(n=801),这代表了增强子区域中所有高甲基化的探针的约20%。有意义的是,47%(801中的379个)的位于esr1结合位点内的高甲基化的增强子探针也位于foxa1和/或gata3结合位点内(图2b),这尤其值得注意,因为这些转录因子通过形成功能增强子体协同调节esr1转录网络。

实施例3-增强子dna高甲基化和减少的esr1结合

在已定义了一个亚组的esr1结合位点(所述结合位点与在多个内分泌抗性模型中含有高甲基化的基因座的增强子区域重叠)(n=856个位点-表1)后,我们试图确定dna甲基化是否影响这些位点处的esr1结合强度。

chip-seq数据采集和分析

使用先前由ross-innes等(2012)nature481:389-393所述的mcf7和tamresr1chip数据,我们比较了包含一个或多个高甲基化的探针的esr1-增强子位点与所有其它esr1-增强子位点处的esr1结合信号强度的变化。将读数映射到具有蝴蝶结和错配(>3个错配碱基)的基因组构造体hg19(grch37),从下游分析中排除多重映射和重复读取。利用homer软件包(heinz等(2010)molecularcell38:576-589),使用findpeaks实用程序(-stylefactor-fraglength200-size300-f0-l0-c0-poisson1e-06)对每个实验分别鉴定esr1富集峰。将所得到的峰合并以产生120,735个区域的基本集(groundset)用于随后的分析。通过用edegr(robinson等,(2010)bioinformatics26:139-140)比较与三个mcf7esr1实验(gsm798423、gsm798424和gsm798425)和mcf7输入实验(gsm798440)中的esr1区域的基本集重叠的读数分布在mcf7中鉴定了活性esr1区域。这在mcf7中产生了54,265个活性esr1区域(fdr<0.05)。对tamr数据应用类似的策略以在tamr细胞中产生49,511个esr1区域。通过使用edger在整个esr1区域的基本集合上比较mcf7和tamr中的序列读数分布来鉴定差异esr1结合的区域,并且使用diffbind(ross-innes等(2012)nature481:389-393)解释了潜在的拷贝数变化。该分析结果是与mcf7细胞相比在tamr细胞中存在24,711个区域具有esr1结合的统计学显著的增加(fdr5%)和32,343个区域具有esr1结合的统计学显著的损失(fdr5%)。将与hm450探针重叠的esr1峰分配至最近的refseq转录物(<20kb距离)用于基因表达分析的目的。原始mcf7gata3和foxa1chip-seq数据分别获自theodorou等,(2013)genomeres.23:12-22和hurtado等,(2011)natgenet43:27-33。以与针对前所述的esr1chip-seq概述的方式相同的方式处理数据。

结果

在甲基化的esr1增强子位点处,与mcf7细胞相比,在tamr中esr1结合减少了2.29对数倍。相比之下,在所有其它esr1增强子结合位点处,与mcf7细胞相比,在tamr中esr1结合减少了0.52对数倍。因此,esr1增强子位点处的甲基化增加与esr1结合减少有关(p<<0.0001;t检验)(图2c)。四个说明性实例显示了在tamr细胞中在内分泌抗性mcf7对比亲本mcf7中的甲基化程度更高的增强子区域处的esr1结合丧失(图2d)。实例包括位于死亡相关蛋白6(daxx)、高尔基体至er交通蛋白4同源物(get4)(bag6-ubl4a-get4dna损伤应答/细胞死亡复合物的成员)的基因体内的增强子区域、esr1本身和核受体辅阻遏蛋白2(ncor2)(图2d)。

实施例4-增强子dna高甲基化和相关的基因表达

由于与亲本mcf7细胞相比,在内分泌抗性细胞系中鉴定为高甲基化的绝大多数esr1-增强子结合位点是基因内的,即856个中的617个(72%)具有至少部分重叠(表2),我们接下来试图确定在人乳腺癌中这些区域的dna甲基化是否与它们所位于的基因(或者如果是基因间的,则最接近的tss)的表达相关。

tcga数据采集

dna甲基化分析利用了可通过tcga乳腺浸润癌(brca)组群(tcga(2012)nature490:61-70)获得的临床数据。原始hm450甲基化数据(1级)获自tcga数据入口(正常样品=97,esr1阳性肿瘤=353,esr1阴性=105)。使用孕酮受体(pr)表达将esr1阳性肿瘤进一步分成luminala(luma=301)和luminalb(lumb=52)群体,使得luma是esr1+/pr+,lumb是esr1+/pr-。经处理的rna-seq表达数据(3级)获自tcga数据入口(588个esr1阳性肿瘤,其中73个匹配的正常,和174个esr1阴性样品,其中19个匹配的正常)。

tcga数据的基因集富集分析

针对分子签名数据库v4.0(msigdb)(subramanian等(2005)pnas,102:15545-1555)c2采集进行gsea。通过如在r统计软件包中实施的超几何检验来评估富集。

结果

使用来源于tcga乳腺组群(n=459名患者)的rna-seq和hm450甲基化数据,我们确定在856个目标esr1-增强子结合位点中,328个位点(即,38%的esr1-增强子位点)的高甲基化与与它们最紧密相关的基因的表达降低相关(spearman相关系数;p<0.001)(表3)。328个esr1增强子结合位点代表了291个独特的基因(包括图2d中所示的那些基因)。基因组富集分析显示,这些基因在通过esr1激活上调、在内分泌抗性的获得中下调的基因集以及在基底对比腔疾病中低表达的基因集中被过代表,因此表明这些基因是雌激素驱动的肿瘤的关键驱动者(图3a)。有趣的是,使用无监督聚类分析,该基因集(n=291)将esr1阳性和esr1阴性乳腺癌患者分级(图3b)。累积地,这表明在整个内分泌抗性获得过程中发生的甲基化事件正起着促进反映内分泌疗法难以治疗的乳腺癌亚型的不依赖于雌激素的表型的作用。

实施例5-esr1增强子甲基化定义乳腺癌亚型

我们接下来试图确定esr1-增强子高甲基化是否指示乳腺癌亚型。我们评估了tcga正常(n=97)、luminala(n=301)、,luminalb(n=52)和esr1阴性(n=105)患者hm450数据中的所有高甲基化esr1增强探针(n=801)的中位甲基化。

临床样品采集和dna提取

福尔马林固定、石蜡包埋(ffpe)的乳腺癌样品获自st.georgehospital,kogarah,australia。经脱鉴定的苏木精-伊红染色的切片由病理学家审查,并标记代表性肿瘤区域,以及相应地从块取芯。根据制造商的说明使用qiagenallprepdna/rnaffpe试剂盒提取基因组dna。

临床ffpedna的多重亚硫酸氢盐pcr重测序

亚硫酸氢盐dna转化使用手动方案进行。对于每次转化,一次将约100ng进行亚硫酸氢盐转化。按照clark等(2006)nat.protoc.1:2353-2364中所述的方法,在0.3mnaoh、3.75mm醌和2.32m焦亚硫酸钠的存在下,在80℃下进行转化持续45分钟。如korbie等(2015)clinicalepigenetics7:28中详述的那样进行多重亚硫酸氢盐pcr反应。简言之,将具有flexi缓冲液(m5005)的promegahotstartgotaq与指定浓度的下列组分一起使用:5xgreen(1x)、ces5x,(0.5x,如ralser等,(2006)biochembiophysrescommun347:747-751中所述)、mgcl2(4.5mm)、dntp’s(各自200μm)、引物(正向和反向,100mm下)、热启动taq(0.025uμl-1)、dna(2ngμl-1)。所有使用的引物列于表4中。

表4.用于临床ffpedna的多重亚硫酸氢盐-pcr测序的引物序列

循环条件是:94℃,5分钟;12个循环(95℃,20秒;60℃,1分钟);12个循环(94℃,20秒;65℃,1分钟30秒);65℃,3分钟,10℃保持。使用agencourtxp珠清理并浓缩多重反应以用于随后的条形码标记(即添加illuminap5/p7序列和样品特异性dna条形码)。条形码pcr以指定的终浓度在100μl反应中使用以下试剂:1xgotaqgreenflexi缓冲液;0.25xces;4.5mmmgcl2;200μmdntp;0.05uμl-1热启动taq;25μl的agencourtxp珠清理后汇集的模板;和20μlmiseq(fluidigmpnfld-100-3771)。循环条件是:94℃,5分钟;9个循环(97℃,15秒;60℃,30秒;72℃,2分钟);72℃,2分钟;6℃,5分钟。使用miseqreagen试剂盒v2,300个循环;pnms-102-2002进行miseq测序。生物信息学分析始于使用trimgalore(选项:--长度100)的接头修剪。映射使用bismark甲基化映射程序(krueger等,(2011)bioinformatics27:1571-1572)运行bowtie2(langmead和salzberg(2012)nat.methods,9:357-359)(选项:--bowtie2-n1-l15--bam-p2--scorel,-0.6,-0.6--non_directional;bismark_methylation_extractor-s-merge_non_cpg–comprehensive--cytosine_report)。为了减少计算开销,仅针对正在研究的那些基因组区域另外加上100bp-1kb的侧翼序列进行映射。

结果

在正常乳腺组织中(据报道,其为约7%esr1阳性,例如,如petersen等,(1987)cancerresearch47:5748-5751中所述),esr1-增强子位点的中位甲基化程度最高,而中位dna甲基化在luminala病中显著减少(p<<0.0001;mann-whitneyu检验),这指示其内分泌响应状态。有趣地,中位esr1增强子甲基化在luminalb患者中相较于luminala患者更大(p=0.017;mann-whitneyu检验),所述luminalb患者几乎有2倍的可能获得内分泌抗性。在esr1阴性疾病中,中位甲基化高于luminal疾病(对比luminala,p<<0.0001;对比luminalb,p<<0.0001;mann-whitneyu检验)(图4a)。热点图突出显示luminala疾病中相对于正常乳腺腺组织和另一种乳腺癌亚型的esr1增强子位点的低甲基化状态(图4b)。这一趋势在daxx增强子区域得以清楚地说明,在所述daxx增强子区域中esr1结合位点内的每个cpg在luminala病中相较于正常组织和luminalb以及esr1阴性癌症被低甲基化(图4c)。关键的是,在daxx启动子区域(转录起始位点的上游1000bp和下游100bp)中未出现此类变化(图4c),表明增强子基因座处甲基化增加的显著调节作用。

实施例6-esr1-增强子高甲基化预测内分泌失败

鉴于esr1-增强子高甲基化在体外获得的内分泌抗性(图1e和图2a-d)以及本质上对内分泌疗法不太敏感的乳腺癌的分子亚类中普遍存在(图4a-c),因此我们接下来试图确定来自具有不同结果的患者的esr1阳性(luminala)乳腺癌样品中的这些基因座的小组的甲基化状态。

原代样品来源于接受内分泌疗法5年,并且经历无复发生存(rfs)(>14年)或已复发(<6年)(定义为无复发生存(n/rfs))的患者。也将匹配的局部复发样品与原代n/rfs患者样品进行比较。所有患者接受相同的内分泌疗法(他莫昔芬)。患者数据在表5中提供)。

使用专门针对ffpe衍生的dna设计的多重亚硫酸氢盐-pcr重测序方法(korbie等,(2015)clinicalepigenetics7:28),探究跨越9个雌激素应答性增强子区域的小组的多个cpg位点的甲基化(图4显示了所有研究的扩增子的技术重复相关性)。这些增强子区域包括位于daxx、msi2、ncor2、rxra和c8orf46(图5a-e)内的那些增强子区域以及位于gata3、itpk1、esr1和get4(图6a-d)内的增强子区域。用从内分泌抗性细胞系和亲本mcf7细胞的生物副本中提取的dna重复该测定以确保其活力(图7a-i;所研究的所有扩增子的技术重复相关性示在图8中)。与匹配的原代(n/rfs)肿瘤相比在复发性肿瘤中于所有增强子基因座处检测到的平均甲基化水平显著更高(daxx;p<0.0001,esr1;p<0.0005,rxra;p<0.005,get4、ncor2、gata3、msi2;p<0.01,c8orf46、itpk1;p<0.05;t检验),从而证实了esr1响应性增强子处的dna甲基化是在抵抗性疾病中获得的(图6和9)。rfs与n/rfs原发肿瘤之间的dna甲基化的差异不太大,尽管对于daxx;p<0.0001,rxra;p<0.01,c8orf46;p=0.01,ncor2和msi2(p<0.05;t检验)增强子区域观察到统计学显著的差异(图9)。

从实施例1-6得出的结论

本文提供的结果支持其中esr1应答性增强子dna甲基化是定义乳腺癌中的内分泌敏感性的基本统一特征的模型。本研究是第一次深入地组合mcf7chromhmm注释和来自多个抗性模型的全基因组甲基化数据,以更全面地表征跨不同基因组区域的全局差异甲基化。本研究首次显示增强子的甲基化状态与体外esr1结合的抑制以及与人疾病中esr1活性的关键调控因子和效应子的表达减少相关。esr1响应性增强子体高甲基化的鉴定在内分泌抗性的背景中既新颖又有相当大的相关性,因为定义了在乳腺癌细胞中招募esr1的顺式调控元件组的全基因组位置分析已揭示了其向增强子(与启动子区域相反)的主要募集作用。在本研究中,在抗性细胞中被鉴定为高甲基化的大多数esr1调控的增强子区域位于基因体内。引人注目的是,这些增强子区域的高甲基化常常与宿主基因的表达降低相关。其表达与esr1增强子dna甲基化反相关的基因的实例包括daxx和get4,其每一个都被报道在细胞凋亡中起作用。与促凋细胞亡功能相关的基因表达的丧失可能通过降低由内分泌疗法激活的细胞凋亡信号传导途径的功效而促进内分泌抗性的进展。

重要的是,在内分泌敏感性和内分泌抗性乳腺癌患者样品中,在内分泌抗性细胞系中鉴定的esr1应答性增强子甲基化事件也被差异甲基化。因此,esr1响应性增强子甲基化状态可以反映内分泌依赖性,并可用于将患者分级为内分泌疗法的响应者。例如,在620名淋巴结阴性esr1阳性乳腺癌患者中,ncor2(其表达先前与无转移生存相关的基因)经显示与esr1增强子甲基化呈负相关。在本研究中,ncor2增强子甲基化在不良(非无复发)预后患者中显著高于良好(无复发)预后的原发性luminala乳腺癌患者。

序列表

<110>garvaninstituteofmedicalresearch

<120>用于诊断、预后和监测乳腺癌的方法及其所用的试剂

<130>173877

<141>2016-07-14

<150>us62/192,540

<151>2015-07-14

<160>40

<170>siposequencelisting1.0

<210>1

<211>23

<212>dna

<213>人工序列

<220>

<223>gata3_ct_f2引物序列

<400>1

gatagattagaggtagtaaggaa23

<210>2

<211>45

<212>dna

<213>人工序列

<220>

<223>gata3_ct_f2融合引物序列

<400>2

acactgacgacatggttctacagatagattagaggtagtaaggaa45

<210>3

<211>25

<212>dna

<213>人工序列

<220>

<223>gata3_ct_r2引物序列

<400>3

cttttcaaaaacaccttaaaaacta25

<210>4

<211>47

<212>dna

<213>人工序列

<220>

<223>gata3_ct_r2融合引物序列

<400>4

tacggtagcagagacttggtctcttttcaaaaacaccttaaaaacta47

<210>5

<211>21

<212>dna

<213>人工序列

<220>

<223>esr1_ct_f1引物序列

<400>5

ttgtagggtttaggatgaagt21

<210>6

<211>43

<212>dna

<213>人工序列

<220>

<223>esr1_ct_f1融合引物序列

<400>6

acactgacgacatggttctacattgtagggtttaggatgaagt43

<210>7

<211>24

<212>dna

<213>人工序列

<220>

<223>esr1_ct_r1引物序列

<400>7

ctttacaatctctctttttccatt24

<210>8

<211>46

<212>dna

<213>人工序列

<220>

<223>esr1_ct_r1融合引物序列

<400>8

tacggtagcagagacttggtctctttacaatctctctttttccatt46

<210>9

<211>19

<212>dna

<213>人工序列

<220>

<223>esr1_ct_f2引物序列

<400>9

ggtgtggaaggtaagggaa19

<210>10

<211>41

<212>dna

<213>人工序列

<220>

<223>esr1_ct_f2融合引物序列

<400>10

acactgacgacatggttctacaggtgtggaaggtaagggaa41

<210>11

<211>27

<212>dna

<213>人工序列

<220>

<223>esr1_ct_r2引物序列

<400>11

ctaaacattacaaacttattcaaatat27

<210>12

<211>49

<212>dna

<213>人工序列

<220>

<223>esr1_ct_r2融合引物序列

<400>12

tacggtagcagagacttggtctctaaacattacaaacttattcaaatat49

<210>13

<211>21

<212>dna

<213>人工序列

<220>

<223>get4_ct_f1引物序列

<400>13

gttggtgtttttggatatgtg21

<210>14

<211>43

<212>dna

<213>人工序列

<220>

<223>get4_ct_f1融合引物序列

<400>14

acactgacgacatggttctacagttggtgtttttggatatgtg43

<210>15

<211>23

<212>dna

<213>人工序列

<220>

<223>get4_ct_r1引物序列

<400>15

ccatccataaaacaaaatcaact23

<210>16

<211>45

<212>dna

<213>人工序列

<220>

<223>get4_ct_r1融合引物序列

<400>16

tacggtagcagagacttggtctccatccataaaacaaaatcaact45

<210>17

<211>24

<212>dna

<213>人工序列

<220>

<223>itpk1_ct_f1引物序列

<400>17

gaaagttggttttttggttttagt24

<210>18

<211>46

<212>dna

<213>人工序列

<220>

<223>itpk1_ct_f1融合引物序列

<400>18

acactgacgacatggttctacagaaagttggttttttggttttagt46

<210>19

<211>22

<212>dna

<213>人工序列

<220>

<223>itpk1_ct_r2引物序列

<400>19

catcatcatcaacaaccaaaca22

<210>20

<211>44

<212>dna

<213>人工序列

<220>

<223>itpk1_ct_r2融合引物序列

<400>20

tacggtagcagagacttggtctcatcatcatcaacaaccaaaca44

<210>21

<211>26

<212>dna

<213>人工序列

<220>

<223>msi2_ct_f2引物序列

<400>21

gagtatttggtttttatttttaagtg26

<210>22

<211>48

<212>dna

<213>人工序列

<220>

<223>msi2_ct_f2融合引物序列

<400>22

acactgacgacatggttctacagagtatttggtttttatttttaagtg48

<210>23

<211>23

<212>dna

<213>人工序列

<220>

<223>msi2_ct_r2引物序列

<400>23

cccaaaaataaactcaactcctt23

<210>24

<211>45

<212>dna

<213>人工序列

<220>

<223>msi2_ct_r2融合引物序列

<400>24

tacggtagcagagacttggtctcccaaaaataaactcaactcctt45

<210>25

<211>23

<212>dna

<213>人工序列

<220>

<223>c8orf46_ga_f1引物序列

<400>25

ccaacatcaaaaaaaaaaacacc23

<210>26

<211>45

<212>dna

<213>人工序列

<220>

<223>c8orf46_ga_f1融合引物序列

<400>26

acactgacgacatggttctacaccaacatcaaaaaaaaaaacacc45

<210>27

<211>22

<212>dna

<213>人工序列

<220>

<223>c8orf46_ga_r1引物序列

<400>27

gggtagattgattttgtagttg22

<210>28

<211>44

<212>dna

<213>人工序列

<220>

<223>c8orf46_ga_r1融合引物序列

<400>28

tacggtagcagagacttggtctgggtagattgattttgtagttg44

<210>29

<211>25

<212>dna

<213>人工序列

<220>

<223>daxx_ga_f2引物序列

<400>29

acatatttaaaaataacctcatcca25

<210>30

<211>47

<212>dna

<213>人工序列

<220>

<223>daxx_ga_f2融合引物序列

<400>30

acactgacgacatggttctacaacatatttaaaaataacctcatcca47

<210>31

<211>23

<212>dna

<213>人工序列

<220>

<223>daxx_ga_r2引物序列

<400>31

tttttaagggttgagtgttttga23

<210>32

<211>45

<212>dna

<213>人工序列

<220>

<223>daxx_ga_r2融合引物序列

<400>32

tacggtagcagagacttggtcttttttaagggttgagtgttttga45

<210>33

<211>18

<212>dna

<213>人工序列

<220>

<223>ncor2_ga_f1引物序列

<400>33

ctcccaaaaccacaccct18

<210>34

<211>40

<212>dna

<213>人工序列

<220>

<223>ncor2_ga_f1融合引物序列

<400>34

acactgacgacatggttctacactcccaaaaccacaccct40

<210>35

<211>21

<212>dna

<213>人工序列

<220>

<223>ncor2_ga_r1引物序列

<400>35

ttttggaggtaaagttagtgg21

<210>36

<211>43

<212>dna

<213>人工序列

<220>

<223>ncor2_ga_r1融合引物序列

<400>36

tacggtagcagagacttggtctttttggaggtaaagttagtgg43

<210>37

<211>23

<212>dna

<213>人工序列

<220>

<223>rxra_ga_f1引物序列

<400>37

aaacttttaatatactacccacc23

<210>38

<211>45

<212>dna

<213>人工序列

<220>

<223>rxra_ga_f1融合引物序列

<400>38

acactgacgacatggttctacaaaacttttaatatactacccacc45

<210>39

<211>19

<212>dna

<213>人工序列

<220>

<223>rxra_ga_r1引物序列

<400>39

gatgagttagatggtaggg19

<210>40

<211>41

<212>dna

<213>人工序列

<220>

<223>rxra_ga_r1融合引物序列

<400>40

tacggtagcagagacttggtctgatgagttagatggtaggg41

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1