能预测人类乳腺癌转移能力的拷贝数变化的制作方法

文档序号:571258阅读:489来源:国知局
专利名称:能预测人类乳腺癌转移能力的拷贝数变化的制作方法
技术领域
本发明在一个实施例中涉及通过确定指定基因中的单核苷酸多态性(SNP)数目 来提供乳腺癌的预后的方法。
背景技术
乳腺癌是一种异质性疾病,呈现出多种临床表现、组织学类型和生长速率。在没有 可检测的淋巴结转移的患者(据认为低风险的群体)中,20-30%的患者在五到十年的随访 后发展复发性疾病。目前不能可靠地进行这组中有复发风险的个体的鉴定。DNA拷贝数变化(CNA)或者拷贝数多态性(CNP),如缺失、插入和扩增,据认为是促 成癌发生的主要基因组变化之一。常规的和基于阵列的比较基因组杂交均已揭示了乳腺肿 瘤中发生了变化的染色体区域。但是,没有使用高通量、高分辨率平台来研究DNA拷贝数变 化与乳腺癌预后的关系的研究。

发明内容
本文公开的方法使得使用拷贝数变化(CNA)来预测患者预后结果成为可行。当与 基于基因表达的特征集合(signature)结合在一起来进行预后时,拷贝数特征集合(CNS) 能精修风险分类,并且能鉴定具有明显更差的预后前景和对化疗药物的潜在差异响应的那 些乳腺癌患者。在本文讨论的实例中,使用了高通量和高分辨率的基于寡核苷酸的单核苷酸多态 性(SNP)阵列技术来分析乳腺癌基因组中超过100,000个SNP基因座的CNA。在一大群的 313名LNN(淋巴结阴性)乳腺癌患者中,鉴定了与一亚群具有非常高的发展远程转移的可 能性的患者相关的CNA。在两个独立的患者群体中验证了 CNA的预后能力。另外,使用公布 的预测性基因特征集合,对所鉴定的具有不同预后的患者亚群测试了推定性药物功效。结 果表明,将DNA拷贝数分析和基因表达分析相组合,能提供另外的和更好的乳腺癌患者风 险评估方法。


本发明参照附图进行公开,其中图1是鉴定具有预后性拷贝数变化(CNA)的基因(SNP)的分析工作流程;图2A和2B示出了具有预后性CNA的染色体区域;图3显示无远程转移的存活与CNS的关系;图4说明对化疗化合物的敏感性;
图5图示ER阳性肿瘤和ER阴性肿瘤的分化;和图6显示ER阴性肿瘤的某些数据。本文给出的实例举例说明了本发明的几个实施例,但是不应该理解为以任何方式 限制本发明的范围。
具体实施例方式特定的DNA拷贝数变化(CNA),如缺失和扩增,是通过减低的凋亡、未受约束的增 殖和增加的运动性和血管发生促成癌发生和肿瘤进展的主要基因组变化。由于很大部分的 基因组畸变与癌症生物学无关,而是仅仅由随机的中性事件所致,因此要鉴定负责最终导 致恶性转化和进展的基因表达调节的那些致病基因CNA,这是一个挑战。荧光原位杂交和比 较基因组杂交(CGH)均已揭示了乳腺肿瘤中显示CNA的染色体区域。在最近的包括51个 乳腺肿瘤的研究中,将高分辨率SNP与基因表达概况分析相结合使用来精修乳腺癌扩增子 边界和缩小潜在驱动基因名单。但是,仅有少数的研究考察了 CNA的预后意义,而这些研究 的样品数量过小,因此不能得出确切的结论。另外,以足够的样品数量和具有对人基因组的 适当覆盖率和定位(mapping)分辨率的技术,采用CNA和基因表达概况分析的组合分析来 考察乳腺癌预后的研究就更少。本说明书描述了 313个淋巴结阴性(LNN)原发性乳腺肿瘤的基因组DNA中,人基 因组的100,000多个SNP基因座的DNA拷贝数的分析,所述肿瘤同时还有全基因组基因表 达数据可供利用。将这两个数据集相结合可以鉴定与远程转移有高度相关性的基因组基因 座和它们的定位基因。基于公布的预测性特征集合,对经鉴定的患者亚群进一步测试推定 性药物功效。对没有接受辅助性系统治疗的一大群313名LNN乳腺癌患者进行了 DNA拷贝数和 基因表达的组合分析。就我们所知,在使用分辨率比aCGH高得多的的高密度SNP阵列技术 分析CNA以进行乳腺癌预后的研究中,这是最大型的一个。从200名LNN患者的训练集鉴 定了显示CNA和一致的基因表达调节的81个基因的特征集合。将这个CNS在独立的113 名LNN患者中以及在116名LNN患者的外部aCGH数据集中进行了验证。初步的临床效用 已得到证明,因为由81基因CNS鉴定具有特别快速的复发的极差预后组实际上构成了由单 独的76基因GES预测的差预后患者亚群。因此通过在应用GES之外还应用CNS,乳腺癌患 者的预后的风险分类得到明显改进。此外,通过使用之前报道的有关对化疗化合物的敏感 性的基因特征集合谱(gene signature prof ile),证实这个极差预后组对手术前T/FAC组 合化疗特别是对环磷酰胺和多柔比星化合物的抗性可能要高得多,而却受益于依托泊苷和 托泊替康。这可提示,与其他患者组相比,属于这个类别的患者应加以紧密监测,并用不同 的化疗方案进行管理,而且CNS的81个基因在化疗敏感性方面也起到重要作用。之前的考察基因扩增和乳腺癌预后之间的关系的研究,将不同的乳腺癌亚型如ER 阳性和ER阴性认为是单一同类群体。但是,众所周知,这些肿瘤在病理学上和生物学上差 异极大,这由大为不同的全局基因表达谱得到证明。这一二分情形(dichotomy)还延伸到 DNA拷贝数的全局模式。因此,所述分析需要分别对ER阳性和ER阴性(雌激素受体阳性 和阴性)肿瘤来进行。的确,从ER阳性肿瘤鉴定的预后性染色体区域与ER阴性肿瘤享有 的共同之处极少。例如,染色体区域8q是公知的与乳腺癌预后差有关的DNA扩增位点。区域8q在ER阳性肿瘤中的确是扩增热点,但对于ER阴性肿瘤却不含明显的扩增区域。由 于ER阴性肿瘤仅占LNN乳腺癌的一小部分( 25% ),有理由推测,那些在其分析中没有 将两种类型的乳腺肿瘤区分开来的研究可能会让其结论受控于来自占大部分的ER阳性肿 瘤样品的结果。从我们的分析观察到的这两类肿瘤之间的另一明显差异在于染色体区域 20ql3. 2-13. 3。ER阳性肿瘤中这个区域的拷贝数的增加,但相反ER阴性肿瘤中这个区域的 拷贝数的损失,与早期复发相关。这些结果合在一起再度强调,ER阳性肿瘤和ER阴性肿瘤 遵循不同的生物途径来进行癌发育和发展。预后件染饩体区域的鉴定从每个SNP的四分位拷贝数估计数(interquartile copy numberestimate)计算 得到的平均拷贝数的中值为2. 1,这与基因组的大部分是二倍体的一般假定相一致。用PCA 对所有313个肿瘤进行的无监督分析表明,染色体拷贝数变化在ER阳性肿瘤和ER阴性肿 瘤之间显示明显的分离倾向(图5)。因此,这两类乳腺肿瘤不仅在如之前许多研究所示的 全局基因表达方面有差异,而且在DNA水平上也有不同的染色体变化。因此,有必要分别对 ER阳性肿瘤和ER阴性肿瘤进行随后的分析。将患者以大约2 1的比例随机分成200名 患者(ER阳性肿瘤133名,ER阴性肿瘤67名)的训练集和113名患者(ER阳性肿瘤66名, ER阴性肿瘤47名)的测试集(表1和图1)。训练集用来鉴定预后性染色体区域和被定位 基因,并用来构建CNS以预测远程转移;测试集是为了验证目的单独留出。首先,鉴定出其CNA与患者的DMFS相关的染色体区域。对于ER阳性肿瘤,分布在 17条染色体上的45个染色体区域被鉴定为具有与DMFS相关的CNA (图2A和表7),对于ER 阴性肿瘤,有56个区域分布在19条染色体上(表8)。ER阳性肿瘤和ER阴性肿瘤的这些 区域大小的总数分别为521Mb (表4)和496Mb (表5)。从ER阳性肿瘤鉴定的预后性染色体 区域与ER阴性肿瘤享有的共同之处极少(图2A和2B)。在200名患者的训练集当中,构建了 81基因预后性拷贝数特征集合(copy number signature, CNS),该特征集合在113名患者的独立测试集当中(风险比[HR] :2.8,95%置 信区间[Cl] :1.4-5.6,ρ = 0.0036)和在116名患者的外部数据集当中(HR:3. 7,95CI 1.3-10.6,ρ = 0.0102)鉴定到远程转移概高率的患者亚群。这些高风险患者构成了由我 们之前确立的76基因表达特征集合(gene expression signature, GES)预测到的高风险 患者亚群。由CNS和GES鉴定出的这个极差预后组对手术前紫杉醇和5-FU-多柔比星-环 磷酰胺(T/FAC)组合化疗(ρ = 0. 0003)特别是对多柔比星和环磷酰胺化合物的抗性据推 定更高,而却潜在受益于依托泊苷和托泊替康。患者样品本研究中使用了从Erasmus医学中心(荷兰鹿特丹)肿瘤库选择的313名LNN 乳腺癌患者的冷冻肿瘤样本。这些患者都没有接受过任何系统(新)辅助疗法。局部原 发治疗的指导方针是一样的。在这些样本当中,273个用来产生76基因特征集合,以供用 Affymetrix U133A芯片预测远程转移。其余40名患者用来研究预后性生物途径。本研 究得到荷兰鹿特丹Erasmus医学中心的医学伦理委员会的批准(MEC 02. 953),并按照荷 兰医学科学学会联盟(the Federation of Medical Scientific Societies)的行为准 则(http://www.fmwv.nl/)进行,并且在可能的情况下遵循肿瘤标志预后研究的报道建议 REMARK(Reporting Recommendations forTumor Marker Prognostic Studies REMARK)。
用之前描述的ER(和PgR)截止值,有199个肿瘤样本被归类为ER阳性,114个为 ER阴性。患者在手术(保乳手术230名患者;改良式的乳房根除术83名患者)时的年 龄中值为54岁(范围26-83岁)。存活患者(η = 220)的随访时间中值为99个月(范 围20-169个月)。总共有114名患者(36% )发展了远程转移,在DMFS的分析中算作失 败。在去世的93名患者中,7名死亡时没有疾病迹象,在DMFS的分析中在最终随访时进行 审查;86名患者在早先的复发后死亡。患者的临床病理学特征在表1中给出。含有临床 和SNP数据的数据集已提交到Gene ExpressionOmnibus数据库,登录号为10099 (http // www. ncbi. nlm. nih. gov/geo,用户名jyu8 ;密石马jackxyu)。在本研究中用作独立验证的116名LNN患者的外部阵列CGH(aCGH)数据集下载自 http://www. ncbi. nlm. nih. gov/geo/query/acc. cgi ? acc = GSE8757。与这个数据集相 关的临床数据(表1)由英国剑桥大学的Teschendorff博士惠赠。DNA分离、杂交和DNA拷贝数分析用QIAamp DNA小型试剂盒(Qiagen,荷兰Venlo市)按照厂商提供的方案从 5-10 个 30 μ m 肿瘤冰冻切片(10-25mg)分离基因组 DNA。用 Affymetrix GeneChiρ Mapping 100K阵列组(Affymetrix,Santa Clara, CA)按照标准的方案对得自每个患者样 品的基因组DNA进行等位基因型分析(allelo-typed)。简言之,将250ng的基因组DNA 用Hind III或Xba I消化,然后连接到能识别黏性四碱基对(bp)突出端的衔接头。使用 DNAEngine (MJ Research, Watertown, ΜΑ),用能识别该衔接头序列的通用引物,以经优化 能优先扩增250-2000bp大小范围的片断的PCR条件,扩增衔接头所连接的DNA片断。用 Qiagen MinElute 96UF PCR纯化系统纯化后,使总共40 μ g的PCR产物片断化,约2. 9 μ g 在4% TBE琼脂糖凝胶上进行显影,以确认DNA片断的平均尺寸小于180bp。然后将片断 化的DNA用生物素进行标记,在杂交炉中与Affymetrix GeneChi ρ HumanMapping 100Κ 阵列组在480C下杂交17小时。用Affymetrix FluidicsStation将阵列洗涤和染色,用 GeneChip 扫描仪 3000 G7 和GeneChip 操作软件(GCOS) (Affymetrix)进行扫描。用 GTYPE (Affymetrix)软件产生阵列上每个探针组的SNP信号(SNP call)。本研究中96. 6% 的探针组测定到SNP信号,标准偏差为2.6%。然后用CCNT 3. 0软件产生代表每个探针组 的拷贝数的数 。这是通过将每个芯片的杂交强度与厂商提供的100多名各种族正常个 体的强度测量值参考组相比较来进行。然后用CCNT的基因组平滑函数,以0. 5Mb的窗口 大小,对拷贝数测量值进行平滑处理。Affymetrix GeneChipiHuman Mapping 100K阵列组 含有115,353个探针组,其精确定位位置得到了界定。各探针组之间的间距的长度中值为 8. 6kb,75%的间距小于28kb,95%的间距小于94. 5kb。n 有予页 J^ 丨牛拷 uim^m^Mmmmm^通过利用可获得的关于RNA基因表达和DNA拷贝数的基因组数据-RNA基因表达 数据是从我们之前的研究产生,而DNA拷贝数数据是在本研究中从同一患者群体获得_设 计了综合性分析方法来鉴定其CNA与远程转移相关的染色体区域和经定位候选基因(图 1)。我们的方法在原理上与Adler等人采取并描述为微阵列特征集合的逐步连锁分析 (SLAMS)的方法非常相似,SLAMS是通过使全基因组DNA拷贝数和基因表达数据交叉来鉴定 表达特征集合(expression signature)的遗传调节物。对ER阳性患者和ER阴性患者分别进行分析,并在平衡临床和病理参数(包括T阶段、等级、绝经状态和复发)的情况下以 大约2 1的比例将患者随机分成200名患者的训练集和113名患者的测试集(图1)。训 练集用来鉴定预后性染色体区域和被定位基因,并用来构建CNS以预测远程转移;测试集 是为了验证目的单独留出。我们的分析中的第一个步骤是鉴定其拷贝数变化与远程转移相关的染色体区域。 简言之,在训练集当中,用单变量Cox比例风险回归评估每个单独SNP的拷贝数和FMFS的 时间之间的相关性的统计学显著性。然后,为对预后性染色体区域进行精修,用平均含有 250个SNP的5Mb滑动窗口,以1Mb的阶梯对染色体进行扫描,以编集该窗口当中所有SNP 的Cox回归ρ值,和确定所有这些SNP作为一个整体相对于被重排列的数据集的平滑ρ值。 简言之,对于含有η个SNP的5Mb大小的给定窗口,让β i和Pi分别表示第i个SNP的Cox 回归的Cox回归系数和P值。通过如下将这个窗口当中的所有SNP的统计学显著性作为一 个整体进行加和,确定这个窗口的对数分数S
其中 指示变量Ii用来说明和区分阳性相关拷贝数变化与阴性相关拷贝数变化,这由 Cox回归系数Pi的符号表示。正系数反映出复发患者具有比无疾病患者更高的拷贝数,而 负系数则相反。为从对数分数计算平滑P值,运用重排列(permutation)得出对数分数的 空分布。通过将临床信息对患者编号进行“洗牌”,进行了四百个重排列。从平滑P值,预后 性染色体区域定义为其中平滑P值均小于0. 05的染色体区段。CNS和预测樽型的构津一旦鉴定出预后性染色体区域,用UCSC基因组浏览器(http://genome.ucsc. edu)人2006年3月(hgl8)汇编,以那些区域当中的Entrez Gene ID对明确界定的基因 进行定位。接着,用两个过滤步骤选择那些具有预后价值的置信度较高的基因以建立CNS。 首先,过滤掉那些具有至少一个相应的AfTymetrix U133A探针组ID的基因。只有那些从 基因表达数据具有统计学上显著的Cox回归ρ值(ρ <0.05)的基因得以通过。其次,基因 表达水平和拷贝数之间的相关性必须大于0. 5。如果该基因当中含有多个SNP,则选择具有 最佳Cox回归ρ值的SNP ;如果不含有SNP,则选择最接近的SNP。对于U133A探针组,使用 具有最佳Cox ρ值的那一个。为使用CNS中的基因建立模型以预测远程转移,将基因数字拷贝数估计数转换成 离散数值,即扩增、无变化或者缺失。为进行转换,通过对代表性SNP的拷贝数数据进行正 态混合建模和使用建模得到的分布的主峰作为二倍拷贝数的估计数来估计每个基因的二 倍拷贝数。于是,对于扩增,将它定义为比二倍拷贝数估计数高1.5个单位以确保因内在数 据变异性所致的假阳性低;而由于该拷贝数变化的性质和针对拷贝数损失的拷贝数数据的 窄分布,将缺失定义为比二倍拷贝数估计数低0.5个单位。一旦转换了拷贝数数据,用以下 的简单和直观算法建立预测模型。如果某患者中至少η个基因的拷贝数发生变化,则该算
7法将该患者归类为复发者,否则归类为非复发者。对CNS中从1到所有基因的η检查所有 可能的情形,并通过检查训练集当中所述特征集合的性能(由显著的log-rank试验ρ值来 测量)和为阳性(预测的复发者)百分数设定下限以避免出现随着η的增加阳性数变得非 常少的情况,来确定η的值。CNS的验证用与上文所述相同的算法,在剩余的测试患者的拷贝数数据集当中和在外部aCGH 数据集当中,评估CNS的性能。对于外部数据集,由于它是从完全不同的aCGH技术得出,并 且数据格式为log2比例,扩增的截止值设定为0. 45,而缺失的截止值设定为-0. 35,以确保 所产生的阳性百分数与SNP阵列技术相当。和CNS的构建一样,验证是用CNS中相应的基 因子集分别在ER阳性和阴性肿瘤中进行的。但是,所显示的最终性能代表测试集当中ER 阳性和阴性患者两者的组合性能。对化疗的推定件响应为检验测试集患者对化疗化合物的推定性响应,使用了两个公布的研究中的基因 表达特征集合。30基因手术前紫杉醇、氟尿嘧啶、多柔比星和环磷酰胺(T/FAC)响应特征集 合的原始基因表达数据集和对角线性鉴别分析(DLDA)的预测算法的R函数下载自http:// bioinformatics. mdanderson. org/pubdata. html。模型是用所提供的R函数从原始数据 集训练,然后在我们的基因表达数据集当中测试。对于七个预测对各个化疗药物的敏感性 的基因表达特征集合的每一个,在Anil Potti和Jowph Nevins博士的帮助下,采用二值 probit回归模型的Bayesian拟合计算对每个化合物的敏感性的预测概率(有关细节参见 Potti A, Dressman HK, Bild A, Riedel RF, Chan G, Sayer R 等人。Genomic signatures to guide the use of chemotherapeutics (指导化疗药物的使用的基因组特征集合)。Nat Med. 2006 年 11 月;12(11) 1294-300))。统计分析以所有SNP对拷贝数数据集进行使用主成分分析(PCA)的无监督分析以检查潜在 的肿瘤亚类。用Kaplan-Meier存活曲线和log-rank试验评估预测的高风险组和低风险组 的DMFS的差异。进行Cox比例风险回归以计算HR及其95% Cl。由于缺少等级方面的数 据,多变量Cox回归分析是通过在一般位置模型下用Markov Chain Monte Carlo方法进行 多重填补来进行(Schafer JL. Analysis of incomplete multivariate data(不完全多变 量数据的分析)。London :Chapman&Hall/CRC Press ;1997)。进行T检验以评估各预后组 之间差异治疗响应的显著性。所有统计分析都是用R版本2. 6. 2进行。搜索预后性候选基因以构建CNS采用得自我们之前对相同肿瘤的研究的基因表达概况分析数据(WangY,Klijn JG, Zhang Y,Sieuwerts AM,Look MP,Yang F等人。Gene-expression profiles to predict distant metastasis of lymph-node-negative primary breast cancer(予页测淋巴结阴性 原发性乳腺癌的远程转移的基因表达谱)。Lmcet. 2005年2月19日;365 (9460) :671_9,和 Yu JX, Sieuwerts AM,Zhang YiMartens JW, Smid MiKlijn JG等人。Pathway analysis of gene signatures predicting metastasis ofnode-negative primary breast cancer(予页 测淋巴结阴性原发性乳腺癌的转移的基因特征集合的途径分析)。BMC Cancer. 2007年9 月25日;7(1) 182)来筛选在基因表达谱和拷贝数变化之间具有一致变化模式的基因。拷贝数的变化必须反映在基因表达水平的相应变化才能具有表型效应,这一点被认为是合理 的。在这些预后区域当中,分别对ER阳性肿瘤(表4)和ER阴性肿瘤(表5)定位了总共 2,833个和3,656个基因。对于ER阳性肿瘤,有122个基因在基因表达数据和拷贝数数据 具有显著的Cox回归ρ < 0. 05,并显示出DNA拷贝数和基因表达的变化方向相同。对于ER 阴性肿瘤,有78个基因在该两个数据集具有显著ρ值,并显示出相同的变化方向(图6)。 其中,ER阳性肿瘤的53(43% )个基因和ER阴性肿瘤的28(36% )个基因分别有大于0. 5 的基因表达与拷贝数间相关系数。因此总共鉴定出81个预后性候选基因,于是将它们用作 预后用CNS (表2及表6A和6B)。CNS的验证验证是分别在ER阳性和阴性肿瘤中,分别用来自CNS的53个和28个基因对测 试集进行。所显示的最终性能代表这2个亚群的组合结果。在113名独立患者的测试集 当中,对由81基因CNS分级的两个患者群体进行的Kaplan-Meier分析显示出在远程转移 时间方面有统计学上显著差异(图3,A),风险比(HR)为2. 8 (ρ = 0.0036)。两个群体的 估计的5年远程转移率分别为27% [95%置信区间(Cl),17%-35% ]和67% (95% Cl, 32% -84% ) ο 当与我们之前鉴定的 76 基因 GES (Wang Y,Klijn JG, ZhangY, Sieuwerts AM, Look MP, Yang F 等人。Gene-expression profilesto predict distant metastasis of lymph-node-negative primarybreast cancer (预测淋巴结阴性原发性乳腺癌的远程转移 的基因表达谱)。Lancet. 2005 Feb 19 ;365 (9460) :671_9)结合使用时,由81基因CNS确 定为具有较差预后结果的患者群体保持一样,估计的5年远程转移率为67%。76基因GES 将另一个具有较好预后的患者群体进一步分级成良好预后组和差预后组,5年估计复发率 分别为11%和37% (图3,B)。这个结果导致得出三个预后组,对于GES良好/CNS良好组、 GES差/CNS良好组、GES差/CNS差组分别定义为良好组、差组和极差组。对两种特征集合 连同传统的临床和病理学因素进行的多变量Cox回归分析表明,这两种特征集合的组合是 DMFS的唯一显著(似然比检验ρ = 0. 0003)预后因子,极差预后组与良好预后组相比HR为 8. 86,差预后组与良好预后组相比HR为3. 59 (表3)。接着,在得自较低分辨率aCGH技术(ChinSF, Teschendorff AE, Marioni JC, Wang Y, Barbosa-Morais NL, Thorne NP 等人。High-resolution array-CGH and expression profiling identifies a novelgenomic subtype of ER negative breast cancer(高分辨 率阵列CGH和表达概况分析鉴定出ER阴性乳腺癌的新型基因组亚型)。Genome Biol. 2007 年10月9日;8 (10) :R215)的116名LNN患者(79个ER阳性肿瘤和37个ER阴性肿瘤)的 完全独立外部数据集当中,对CNS进行测试。81基因CNS明显地将这个患者群体(图3,C) 分级成两个HR为3. 7 (ρ = 0. 0102)的预后组,并在包括年龄、肿瘤大小、等级、ER状态的的 多变量Cox回归分析中仍是唯一显著的预后因子(ρ = 0.015)。与我们自己的数据集相比, 差预后组的5年远程转移率较低(19%),这很可能是由于肿瘤尺寸较小(78%小于2cm)和 由于这个群体中三分之一以上的患者已接受过辅助激素和/或化疗的事实(表1)。对化疗的响应随后,用得自两个研究的得到很好验证的基因特征集合(Potti A,Dressman HK, Bild A, Riedel RF, Chan G, Sayer R 等人。Genomicsignatures to guide the use of chemotherapeutics (指导化疗药物的使用的基因组特征集合)。Nat Med. 2006年11月;12(11) 1294-300,和 Hess KR, Anderson K, Symmans WF, Valero V, Ibrahim N, Mejia JA 等 人。Pharmacogenomic predictor of sensitivity to preoperativechemotherapy with paclitaxel and fluorouracil, doxorubicin, andcyclophosphamide in breast cancer (乳腺癌中手术前紫杉醇和氟尿嘧啶、多柔比星和环磷酰胺化疗敏感性的药物基因 组学预测物)。J ClinOncol. 2006 年 9 月 10 日;24 (26) :4236_44),对由 GES 和 CNS 预后 测定所确定的三个预后组进行化疗响应谱考察。对于所述两个研究,还有随访验证研究 可供利用(Bonnefoi H,Potti A,Delorenzi M,Mauriac L,Campone M,Tubiana-Hulin M 等 人。Validation of gene signaturesthat predict the response of breast cancer to neoadjuvantchemotherapy :a substudy of the EORTC 10994/BIG 00-01 clinicaltrial (预测乳腺癌对新辅助化疗的响应的基因特征集合的验证E0RTC10994/ BIG 00-01 临床试验的子研究)。Lancet Oncol. 2007 年 12 月;8 (12) 1071-8,和 Peintinger F,Anderson K,Mazouni C,Kuerer HM, Hatzis C,Lin F 等人。Thirty-gene pharmacogenomic test correlateswith residual cancer burden after preoperative chemotherapy forbreast cancer (30基因药物基因组学试验与乳腺癌手术前化疗后的残 余癌负荷相关联)。Clin Cancer Res. 2007年7月15日;13(14) :4078_82)。首先,使用之 前发表的预测对手术前T/FAC化疗的病理完全响应(pCR)的30基因特征结合(Hess KR, Anderson K, Symmans WF,ValeroV, Ibrahim N, Mejia JA等人。Pharmacogenomic predictor ofsensitivity to preoperative chemotherapy with paclitaxel andfluorouraci1, doxorubicin, and cyclophosphamide in breast cancer (季L腺癌中手术Ilf紫杉酉享禾口氣尿 嘧啶、多柔比星和环磷酰胺化疗敏感性的药物基因组学预测物)。J Clin Oncol. 2006年9 月10日;24 (26) :4236-44),将不同预后亚组中的每个患者分配到2个响应组中具有pCR 或者仍具有残余疾病。极差预后组中的15名患者只有2名(13%)被预测为具有pCR,而 差预后组中的60名患者有34名(57%)和良好预后组中38名患者中有14名(37% )分 别被预测为具有pCR。极差预后组的化疗响应分数显著低于差预后组(P = 0.0003),这表 明在要是这些患者接受了手术前T/FAC化疗的情况中,这些患者对手术前T/FAC化疗的抗 性会大得多(图4,A)。其次,使用在细胞系上建立的表达特征集合(Potti A,Dressman HK, Bild A, Riedel RF, Chan G, Sayer R 等人。Genomicsignatures to guide the use of chemotherapeutics (指导化疗药物的使用的基因组特征集合)。Nat Med. 2006年11月; 12(11) :1294-300),将这三个预后组针对七种分别的化疗化合物进行响应谱测定。对于每 种化合物,采用二值probit回归模型的Bayesian拟合计算对该化合物的敏感性的预测概 率。与差预后组相比,极差预后组中的患者对多柔比星(图4,D)和环磷酰胺(图4,E)的 抗性似乎更大,这与30基因特征集合作出的T/FAC响应预测(图4,A)相一致。另一方面, 极差预后组对依托泊苷(图4,G)和托泊替康(图4,H)更敏感。因此,当与基于基因表达 的特征集合相结合进行预后和疗法预测时,由SNP阵列测量的CNA能改进风险分类,并且能 鉴定具有明显更差的预后前景和对化疗药物的潜在差异响应的那些乳腺癌患者。^ 1 患、者及jq中瘤的临床禾Π病理学Φ寺征年龄,岁
平均值(标准偏差) <=40 41-55 56-70 >70 绝经状态 绝经前 绝经后 T阶段 Tl T2
T3/4 未知 等级 差
中等 良好 未知 ER状态 阳性 阴性 PR状态
阳性
等级是由地区病理学家评估,反映肿瘤收集年间的现行规范;ER阳性和PgR阳性 > lOfmol/mg蛋白质或者> 10%阳性肿瘤细胞。NA,无。m 2-Mimuimmm^ (cns)的 8i 个某因的说明
全部患者 训练集 驗证集 特征(n=313) (n=200) (n=113) 外部验证集(n=116)
(12)
5
2%)
(31%)
2%)
(48%)
2%)
10
\ly /—S % % ) 9 7 %
3 3(4o 7 5 8
/O Λι/ 6
14
111
%)
8 CJ
3 7 5
\7 (6
3 3 1
3) 3
/Iv
(50%)
100
^^ \l/ 6 % 4 4
/V /Iv
52°/64%) 3 4
/IN /fv
7 2 1
(43%)
_ \l/ /O \)/ \l/
\I/ ft/ /O /mv
2l°/3 2β/
(31
3 1
%) %)
(4
(51
2 5 1
\1/ \ly % % ) 9 7 % A^ (4(4(4:0·/
3 5 1
8
11
/O Ni/ /O /O / ft/ /O
3 ^ O W/ 4 6 O
(2%)
1-3 yc
(6
(3
19 11
(50
5 1
148 (47%)
%) 3
/Iv
/O ft/ \—/
巧5 %
(32
6 3
/ι /Iv
4 O O 1 2

移 疗
性知明 查衫 知 阴未54是否审_是否未
U \ / V/ \|/ H % 5 9 % 3 O 5 3 5 1 3
7 5
5 3
/ V /Iv /Iv 18 1
(3
8 3
78 (67%)
(78%) (22%) O O
(42%) (29%) (29%) O
(68%) (32%)
7 3
na
na na7%)
(90%)3%)
10
X)/
^^ ^^ X)/
7 1%
1 2 7
11 表3 :GES和CNS组合的多变量Cox回归分析 年龄(每10岁递增) 绝经后相比绝经前 HR =风险比;95% CI = 95%置信区间。表4 :ER阳件肿瘤具有预后件拷贝数夺化(CNA)的染色体区域 表5 :ER阴t牛肿瘤H有预后t牛拷贝!^夺化(CNA)的染fM本区域 表6A 用作CNS的81个基因的说明
ql2. 1
表 6B用作CNS的81个某因的说明(续)
前53个基因来自ER阳性肿瘤,后28个基因来自ER阴性肿瘤。表7 =ER阳件肿瘤中的预后件染饩体区域 表8 :ER阴件肿瘤中的预后件染饩体区域
权利要求
一种界定具有预后价值的染色体区域的方法,所述方法包括将染色体的预定区段中的所有SNP的显著性加和以界定具有预后价值的染色体区域的步骤。
2.根据权利要求1所述的方法,其中所述加和步骤是通过测定所述区域中每个SNP的 Cox比例风险回归的P值并将组合的P值加和来进行。
3.根据权利要求1所述的方法,所述方法还包括将SNP拷贝数与位于所述预定染色体 区段当中的基因的表达水平相关联的步骤。
4.根据权利要求1所述的方法,所述方法还包括基于组合的P值开发治疗方案的步骤。
5.一种提供人乳腺癌的预后的方法,所述方法包括以下步骤 获得人的DNA样品;在至少选自以下的基因中对所述DNA样品检查单核苷酸多态性SMC4、PD⑶10、PREP、 CBX3、NUP205、TCEBl、TERFl、TPD52、GGH、TRAMl、ZBTB10, YTHDF3、EIF3E、P0LR2K、RPL30、 CCNE2、RAD54B、MTERFD1、ENY2、DPYl9L4、ZNF623、SCRIB、SLC39A4、ATP6V1G1、TCTN3、PSMA6、 STRN3、CLTC、TRIM37、NME1、NME2、RPS6KB1、PPMlD、MED13、SLC35B1、APPBP2、MKS1、C17orf71、 HEATR6、TMEM49、USP32、ANKRD40、NME1-NME2、ZNF264、ZNF304、ATP5E、CSTFU PPP1R3D、 AURKA、RAEl、STX16、C20orf43、RAB22A、HDACl、BSDCl、Clorf9、C0X5B、EIF5B、DDX18、TSN、 p20、METTL5、MGATl、TUBB2A、RWDDl、PGM3、F0X03、CDC40、REV3L、HDAC2、TSPYL4、C6orf60、 ASF1A、MED23、TSPYLl、ACTRlO、KIAA0247、RARA, KRT10、RI0K3、IMPACT、以及它们的组合; 基于所述检查DNA样品的步骤的结果,提供人乳腺癌的预后。
6.根据权利要求5所述的方法,所述方法还包括获得人的乳腺肿瘤样品的步骤。
7.根据权利要求6所述的方法,所述方法还包括确定所述肿瘤样品是雌激素受体阳性 还是雌激素受体阴性的步骤。
8.根据权利要求7所述的方法,其中所述肿瘤样品被确定为雌激素受体阳性,并且所 述单核苷酸多态性被确定为在TCTN3方面的损失。
9.根据权利要求7所述的方法,其中所述肿瘤样品被确定为雌激素受体阴性,并且所 述单核苷酸多态性被确定为在HDAC1、BSDCl或它们的组合方面的损失。
10.一种提供人乳腺癌的预后的方法,所述方法包括以下步骤获得人的DNA样品; 在选自染色体号 1、2、3、4、5、6、7、9、10、11、12、14、16、17、18、19、20、21、23 以及它们的组合的至少一个染色体上对该DNA样品检查单核苷酸多态性,其中所述单核苷酸多态性出 现在表7和8所示的相应起始碱基和终止碱基之间;基于所述检查DNA样品的步骤的结果,提供人乳腺癌的预后。
11.根据权利要求10所述的方法,所述方法还包括从所述人获得乳腺肿瘤样品的步马聚ο
12.根据权利要求11所述的方法,所述方法还包括确定所述肿瘤样品是雌激素受体阳 性还是雌激素受体阴性的步骤。
13.根据权利要求12所述的方法,其中所述肿瘤样品被确定为雌激素受体阳性,并且 所述单核苷酸多态性出现在表7所示的相应起始碱基和终止碱基之间。
14.根据权利要求12所述的方法,其中所述肿瘤样品被确定为雌激素受体阴性,并且 所述单核苷酸多态性出现在表8所示的相应起始碱基和终止碱基之间。全文摘要
本发明书公开了一种界定具有预后价值的染色体区域的方法,所述方法是通过将染色体的预定区段中的所有SNP(单核苷酸多态性)的显著性进行加和来界定具有预后价值的染色体区域。基于指定基因中的SNP,可提供更加准确的乳腺癌预后。
文档编号C12Q1/68GK101918591SQ200880120887
公开日2010年12月15日 申请日期2008年12月15日 优先权日2007年12月14日
发明者J·X·于, Y·张, Y·王, Y·蒋 申请人:维里德克斯有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1