多发性骨髓瘤分子分型及应用的制作方法

文档序号:15514743发布日期:2018-09-25 17:33阅读:712来源:国知局

本发明属于生物技术领域,尤其涉及一种多发性骨髓瘤分子分型及应用。



背景技术:

多发性骨髓瘤(multiplemyeloma,mm)是一种由浆细胞恶性增殖所导致的肿瘤,是第二常见的血液肿瘤,在中国的发病率为1~2/十万人。多发性骨髓瘤是好发于年龄大于60岁的老年人群中,随着我国老龄化程度的加重,其发病率逐年提升,已成为严重威胁老年人健康的一种疾病。多发性骨髓瘤的典型特征为骨髓中存在大量异常增生的浆细胞,这种浆细胞会分泌一种异常的免疫球蛋白或免疫球蛋白片段,即m蛋白。

随着蛋白酶体抑制剂如硼替佐米和免疫调节药物如来那度胺的应用,多发性骨髓瘤的生存情况有了明显的改善。但是,多发性骨髓瘤目前仍然无法被完全治愈。多发性骨髓瘤在生物学上和临床上具有高度的异质性,因此,其对多药物联合治疗的反应及治疗后生存情况在不同的病人中具有巨大的差异。造成这种差异的生物学机制目前尚未被充分理解,在一定程度上阻碍了个性化精准治疗的进行。因此,为了加深对多发性骨髓瘤生物学本质的理解,辅助临床治疗决策,开发简单可靠的分子分型系统迫在眉睫。目前,国际上已经有几个多发性骨髓瘤分子分型系统被提出来。例如,bergsagel等人鉴定了8种具有不同的细胞周期蛋白d(cyclind)表达和染色体易位的多发性骨髓瘤亚型。使用无偏无假设的转录组分析,zhan和broyl等人提出多发性骨髓瘤具有7-10个分子亚型,根据病人生存期的长短,这些亚型可以被进一步简化为高风险组和低风险组。此外,与预后相关的基因表达特征如uams-70和uams-17,uams-80,ifm-15,millennium-100,emc-92,基因扩增指数如gpi-5,mrc-ix-6以及中心体扩增指数也被提出。但以上分子分型和表达特征并不能预测药物治疗反应,也不能与浆细胞的发育过程相关联,而且用于分子分型的基因与多发性骨髓瘤病因之间的关联也未被阐明。



技术实现要素:

本发明一个目的是提供获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质的用途。

本发明提供了获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质在制备预测待测多发性骨髓瘤肿瘤患者预后生存率的产品中的应用。

本发明还提供了获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质在制备预测多发性骨髓瘤肿瘤患者预后生存期产品中的应用。

本发明还提供了获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质在制备预测多发性骨髓瘤肿瘤患者预后存活风险产品中的应用。

本发明另一个目的是提供获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质和运行多发性骨髓瘤贝叶斯分类器的设备的用途。

本发明提供了获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质和运行多发性骨髓瘤贝叶斯分类器的设备在制备预测待测多发性骨髓瘤肿瘤患者预后生存率的产品中的应用。

本发明还提供了获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质和运行多发性骨髓瘤贝叶斯分类器的设备在制备预测多发性骨髓瘤肿瘤患者预后生存期产品中的应用。

本发明还提供了获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质和运行多发性骨髓瘤贝叶斯分类器的设备在制备预测多发性骨髓瘤肿瘤患者预后存活风险产品中的应用。

上述97个基因为如下:

acbd3、adar、adss、aldh2、anp32e、anxa2、atf3、atp8b2、cacybp、capn2、ccnd1、cct3、cdc42se1、cers2、chsy3、clic1、clmn、copa、csnk1g3、dap3、dennd1b、ensa、eprs、epsti1、evl、fam13a、fam49a、flad1、frzb、glrx2、hax1、hdgf、hla-a、hla-b、hla-c、hla-f、hla-g、il6r、isg20l2、jtb、klf2、lamtor2、ldha、mcl1、moxd1、mrpl24、mrpl9、mvp、myl6、ndufs2、nop58、notch2nl、ntan1、pak1、pi4kb、piezo1、pik3ap1、pim2、pip5k1b、pmvk、pogz、ppia、prcc、prkca、prrc2c、psmb4、psmd4、rab29、rcbtb2、scamp3、scaper、sdhc、sel1l3、selplg、shc1、sidt1、ssr2、stap1、tap1、timm17a、tlr10、tmco1、tor1aip2、tor3a、tp53inp1、tpm3、trank1、trove2、uap1、ube2q1、ubqln4、uhmk1、vps45、yy1ap1、zc3h11a、zfp36和znf593。

上述多发性骨髓瘤贝叶斯分类器按照包括如下步骤的方法获得:

1)获得n个多发性骨髓瘤样本的97个基因的表达量数据;

2)将所述n个多发性骨髓瘤样本的97个基因的表达量数据用consensusclustering聚类算法分为mcl1-m-high和mcl1-m-low两个亚型;

3)基于步骤2的两个亚型、步骤1)的n个多发性骨髓瘤样本的97个基因的表达量数据、n个多发性骨髓瘤样本的预后生存期数据,用朴素贝叶斯方法构建得到素贝叶斯分类器。

上述步骤3)为先将所述n个多发性骨髓瘤样本按照样本数量比大于1:1的比例随机划分训练集和验证集;再使用训练中的所述97个基因的表达量数据,并结合所述用consensusclustering聚类算法获得的各样本mcl1-m-high和mcl1-m-low亚型标签,使用r语言机器学习包klar包中的朴素贝叶斯算法建立预测单个患者mcl1-m-high亚型和mcl1-m-low亚型的多发性骨髓瘤贝叶斯分类器;

上述所述获得各个多发性骨髓瘤样本的97个基因的表达量数据的方式为检测或者从数据库中获得。

本发明第3个目的是提供一种产品。

本发明提供的产品,包括获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质和运行多发性骨髓瘤贝叶斯分类器的设备。

上述产品中,所述产品具有如下至少一种功能:

1)预测待测多发性骨髓瘤肿瘤患者预后生存率;

2)预测多发性骨髓瘤肿瘤患者预后生存期;

3)预测多发性骨髓瘤肿瘤患者预后存活风险。

上述产品还包括记载检测方法的载体;

所述检测方法包括如下步骤:所述检测方法包括如下步骤:用所述获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质得到所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据;再将所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据用所述多发性骨髓瘤贝叶斯分类器进行分类,属于mcl1-m-high亚型的待测多发性骨髓瘤肿瘤患者预测预后生存期显著低于属于mcl1-m-low亚型的待测多发性骨髓瘤肿瘤患者。

上述产品中,所述待测多发性骨髓瘤肿瘤患者为单个患者或多个患者。

本发明第4个目的是提供构建对多发性骨髓瘤肿瘤患者进行分型的模型的方法。

本发明提供的方法包括如下步骤:

1)获得n个多发性骨髓瘤样本的97个基因的表达量数据;

2)将所述n个多发性骨髓瘤样本的97个基因的表达量数据用consensusclustering聚类算法分为mcl1-m-high和mcl1-m-low两个亚型;

3)基于步骤2)的两个亚型、步骤1)的n个多发性骨髓瘤样本的97个基因的表达量数据、n个多发性骨髓瘤样本的预后生存期数据,用朴素贝叶斯方法构建得到素贝叶斯分类器,即为目的模型。

上述产品还包括运行多发性骨髓瘤贝叶斯分类器的设备(该设备可以是光盘或者电脑等。);

上述产品还包括记载检测方法的载体;

所述检测方法包括如下步骤:用所述获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质得到所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据;再将所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据用所述多发性骨髓瘤贝叶斯分类器进行分类,属于mcl1-m-high亚型的待测多发性骨髓瘤肿瘤患者预测预后生存期显著低于属于mcl1-m-low亚型的待测多发性骨髓瘤肿瘤患者。

上述产品中,所述待测多发性骨髓瘤肿瘤患者为单个患者或多个患者。

上述产品中,所述n个多发性骨髓瘤样本为551例样本。

或所述大于1:1的比例为按照2:1的比例随机划分训练集和验证集。

上述产品具有如下至少一种功能:

1)预测待测多发性骨髓瘤肿瘤患者预后生存率;

2)预测多发性骨髓瘤肿瘤患者预后生存期;

3)预测多发性骨髓瘤肿瘤患者预后存活风险。

本发明的另一个目的是提供构建对多发性骨髓瘤肿瘤患者进行分型的模型的方法。

本发明提供的方法,包括如下步骤:

1)获得n个多发性骨髓瘤样本的97个基因的表达量数据;

2)将所述n个多发性骨髓瘤样本的97个基因的表达量数据用consensusclustering聚类算法分为mcl1-m-high和mcl1-m-low两个亚型;

3)基于步骤2)的两个亚型、步骤1)的n个多发性骨髓瘤样本的97个基因的表达量数据、n个多发性骨髓瘤样本的预后生存期数据,用朴素贝叶斯方法构建得到素贝叶斯分类器,即为目的模型。

上述获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质和/或所述运行多发性骨髓瘤贝叶斯分类器的设备或上述方法得到的模型在制备预测待测多发性骨髓瘤肿瘤患者预后生存率的产品中的应用也是本发明保护的范围。

上述获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质和/或所述运行多发性骨髓瘤贝叶斯分类器的设备或上述方法得到的模型在制备预测多发性骨髓瘤肿瘤患者预后生存期产品中的应用也是本发明保护的范围。

上述获得或检测待测多发性骨髓瘤肿瘤患者中97个基因表达的物质和/或所述运行多发性骨髓瘤贝叶斯分类器的设备或上述方法得到的模型在制备预测多发性骨髓瘤肿瘤患者预后存活风险产品中的应用也是本发明保护的范围。

本发明还提供了一种对待测多发性骨髓瘤肿瘤患者分型的方法,包括如下步骤:

检测或获得所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据;再将所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据用上述多发性骨髓瘤贝叶斯分类器进行分型,得到待测多发性骨髓瘤肿瘤患者是属于mcl1-m-high亚型还是mcl1-m-low亚型。

本发明还提供了一种预测多发性骨髓瘤肿瘤患者预后存活风险的方法,包括如下步骤:检测或获得所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据;再将所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据用上述多发性骨髓瘤贝叶斯分类器进行分型,属于mcl1-m-high亚型的待测多发性骨髓瘤肿瘤患者预测预后存活率低于属于mcl1-m-low亚型的待测多发性骨髓瘤肿瘤患者。

本发明还提供了一种预测多发性骨髓瘤肿瘤患者预后存活风险的方法,包括如下步骤:检测或获得所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据;再将所述待测多发性骨髓瘤肿瘤患者97个基因的表达量数据用上述多发性骨髓瘤贝叶斯分类器进行分型,属于mcl1-m-high亚型的待测多发性骨髓瘤肿瘤患者预后存活率低的风险大;属于mcl1-m-low亚型的待测多发性骨髓瘤肿瘤患者的预后存活率低的风险小。

上述基因的表达量均为肿瘤细胞中的基因表达量。

为了克服以上缺陷,发明人探索了围绕生发中心(gc)浆细胞发育过程中保守的关键信号通路的基因共表达网络是否能够辅助阐明mm发病机制并应用于mm的分子分型。发明人重点寻找了多发性骨髓瘤中控制b细胞向浆细胞分化过程中失调的基因网络,因为它可能在多发性骨髓瘤的形成中起到关键作用。经过上述分析,鉴定出了一个与mcl1基因共表达的基因模块(简称为mcl1-m),并应用它将多发性骨髓瘤分成为两个主要亚型,即mcl-m-high亚型和mcl-m-low亚型。这两个亚型具有显著不同的预后与遗传学特征,更重要的是,该分类系统还能预测病人对硼替佐米的治疗的反应并且与浆细胞的发育阶段相关。这些发现能为今后个体化精准治疗的实施铺平了道路,也能提高对多发性骨髓瘤病因的理解。

附图说明

图1为gse2658验证集中贝叶斯分类器分型结果roc图。

图2为mmrf数据集中贝叶斯分类器分型结果roc图。

图3为gse19784数据集中贝叶斯分类器分型结果roc图。

图4为gse2658中多发性骨髓瘤mcl1-m-high和mcl1-m-low分子亚型的总体生存曲线。

图5为gse2658中多发性骨髓瘤mcl1-m-high和mcl1-m-low分子亚型的总体生存曲线。

图6为gse19784中多发性骨髓瘤mcl1-m-high和mcl1-m-low分子亚型的总体生存曲线(上图)和无进展生存曲线(下图)。

图7为gs19784中mcl1-m-high和mcl1-m-low亚型病人对硼替佐米治疗具有不同的反应。

具体实施方式

下述实施例中所使用的实验方法如无特殊说明,均为常规方法。

下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

实施例1、多发性骨髓瘤的分子诊断标志物的筛选及分子分型的实施

利用ncbigeo公共数据库提供的多发性骨髓瘤表达量数据集gse2658,通过皮尔森相关性分析,获得了87个与mcl1共表达的基因,并以此为基础,鉴定出了46个在低表达mcl1-m基因的多发性骨髓瘤样本中富集的基因。为了更稳定的进行分子分型,这133个基因中36个分类效力不高的被进一步筛除,最终97个稳定差异表达且丰度相对较高的分类基因被保留了下来。

97个基因的名称如下:

acbd3、adar、adss、aldh2、anp32e、anxa2、atf3、atp8b2、cacybp、capn2、ccnd1、cct3、cdc42se1、cers2、chsy3、clic1、clmn、copa、csnk1g3、dap3、dennd1b、ensa、eprs、epsti1、evl、fam13a、fam49a、flad1、frzb、glrx2、hax1、hdgf、hla-a、hla-b、hla-c、hla-f、hla-g、il6r、isg20l2、jtb、klf2、lamtor2、ldha、mcl1、moxd1、mrpl24、mrpl9、mvp、myl6、ndufs2、nop58、notch2nl、ntan1、pak1、pi4kb、piezo1、pik3ap1、pim2、pip5k1b、pmvk、pogz、ppia、prcc、prkca、prrc2c、psmb4、psmd4、rab29、rcbtb2、scamp3、scaper、sdhc、sel1l3、selplg、shc1、sidt1、ssr2、stap1、tap1、timm17a、tlr10、tmco1、tor1aip2、tor3a、tp53inp1、tpm3、trank1、trove2、uap1、ube2q1、ubqln4、uhmk1、vps45、yy1ap1、zc3h11a、zfp36和znf593。

这97个基因随后将作为用于分型的分类因子。利用gse2658数据集的551例多发性骨髓瘤样本中这97个基因的表达量数据,首先使用consensusclustering聚类算法以无监督的聚类方式把这551例多发性骨髓瘤分为了mcl1-m-high和mcl1-m-low两个亚型。但基于聚类的分类方法不能针对单独样本进行分子分型。为了实施个体化诊断,这551例样本按照2:1的比例被随机划分训练集(369例)和验证集(182例),用于建立和评估个体化的分类器。取样采取了分层取样的方式,以保证训练集和测试集中mcl1-m-high和mcl1-m-low两个亚型的比例与原来维持一致。

根据训练集中369例样本的97个分类基因的表达量数据和consensusclustering聚类算法分成的mcl1-m-high和mcl1-m-low两个亚型标签,使用r语言中机器学习包klar包提供的朴素贝叶斯算法建立了可预测单个患者mcl1-m-high亚型和mcl1-m-low亚型的多发性骨髓瘤贝叶斯分类器。

并利用验证集中182例样本评估了其分类的准确度。

根据返回的准确度,不断迭代优化模型,最终使分类的准确度超过了95%,该分类器的准确度数据见表1,受试者工作曲线(roc)见图1。

表1.利用gse2658数据集建立的分类器在验证集中的准确度

为了确定利用gse2658数据集建立的分类器能够被推广应用。发明人随后利用该分类器预测了nci发布的多发性骨髓瘤大型数据集mmrf及geo多发性骨髓瘤表达量数据集gse19784中样本的分子亚型。

mmrf数据集不同于gse2658,其基因的表达量通过rna-seq获得,而非芯片。其预测的结果如表2,roc图见图2。

表2.利用gse2658数据集建立的分类器的在mmrf数据集中的准确度

结果显示,即使跨平台,该分类器也能保持很高的准确度,这说明它具有较高的推广应用价值。

gse19784也是一个多发性骨髓瘤的表达量数据集,与gse2618一样,采用的是u1332.0plus芯片测量基因表达量。但是,两者来由不同的实验在不同的时间进行检测,实验条件可能具有差别,这导致两者的数据在分布和噪音水平上显著不同。该数据库亚型预测结果见表3,roc曲线见图3。

表3.利用gse2658数据集建立的分类器的在gse19784数据集中的准确度

结果显示,该分类器能较好的克服上述问题,依然保持较高的准确度。

实施例2、多发性骨髓瘤的贝叶斯分类器在预测患者预后存活率中的应用

一、数据库gse2658

根据gse2658数据库551例多发性骨髓瘤患者样本(治疗前检测)的97个分类基因的表达量数据,采用实施例1获得的多发性骨髓瘤贝叶斯分类器将该551例样本分类,得到249例mcl1-m-high亚型多发性骨髓瘤和302例mcl1-m-low亚型多发性骨髓瘤。

跟踪随访551例样本患者治疗后72个月,根据随访结果,进行生存分析(k-m分析及cox回归分析),结果如图4所示,可以看到,mcl1-m-high和mcl1-m-low两个多发性骨髓瘤亚型具有显著不同的预后,mcl1-m-high亚型的总体生存率比mcl1-m-low亚型要低(log-rank检验,p=0.0201,似然比检验,风险比1.588,p=0.0212)。

因此,采用贝叶斯分类器利用mcl1基因群97个基因进行分型,可以用来预测待测患者的预后。

二、数据库mmrf

根据mmrf数据集中534例多发性骨髓瘤患者样本(治疗前检测)mcl1基因群97个分类基因的表达量数据,分别采用实施例1获得的多发性骨髓瘤贝叶斯分类器将该534例样本分为mcl1-m-high(231例)和mcl1-m-low两个亚型(303例)。

跟踪随访534例样本患者治疗后48个月,根据随访结果,进行生存分析(k-m分析及cox回归分析),结果如图5所示,可以看到,在mmrf数据集中,mcl1-m-high和mcl1-m-low两个亚型同样具有显著不同的预后,mcl1-m-high亚型的总体生存率比mcl1-m-low亚型要低(log-rank检验,p=0.006663,似然比检验,风险比1.838,p=0.00706)。

该结果表明,不管基因表达量数据来自于哪个平台,采用贝叶斯分类器利用mcl1基因群97个基因进行分型,可以用来预测待测患者的预后。

三、数据库gse19784

根据数据库gse19784中验证集304例多发性骨髓瘤患者样本(治疗前检测)的mcl1基因群97个分类基因的表达量数据,分别采用实施例1获得的多发性骨髓瘤贝叶斯分类器将该304例样本分为mcl1-m-high(107例)和mcl1-m-low两个亚型(196例)。

跟踪随访304例样本患者治疗后96个月,根据随访结果,进行生存分析(k-m分析及cox回归分析),结果如图6所示(a为总体生存率,b为无进展生存率),可以看到,在gse19784数据集中,mcl1-m-high和mcl1-m-low两个亚型同样具有显著不同的预后,mcl1-m-high亚型的总体生存率比mcl1-m-low亚型要低(log-rank检验,p<0.0001,似然比检验,风险比1.91,p=0.0002)。gse19784数据集也包括疾病的进展信息,因此我们也分析了无进展生存率的差别,类似的,mcl1-m-high亚型的无进展生存率也比mcl1-m-low亚型要低log-rank检验,p=0.0282,似然比检验,风险比1.36,p=0.031)该结果再次表明,采用贝叶斯分类器利用mcl1基因群97个基因进行分型,可以用来预测待测患者的预后。

实施例3、多发性骨髓瘤的分子诊断标志物及分型在预测待测患者是否能够用硼替佐米治疗

gse19784多发性骨髓瘤的表达量数据集来自于一项iii期药物的临床试验(hovon-65/gmmg-hd4),附有病人的药物治疗方案。该试验把病人随机分到了两组分别接受vad(155例)和pad(148例)两种药物组合,两者的差别在于pad方案多了硼替佐米(商品名:万珂)这种药物。入组病人的基因表达量数据都采集于治疗前。

按上述mcl1-m分子分型对病人进行了分层,然后分别在mcl1-m-high(pad51例,vad56例)和mcl1-m-low(pad104例,vad92例)两个亚型中按药物治疗方案进分组进行了生存分析(k-m分析及cox回归分析)。

结果如图7所示,a为mcl1-m-high组的总体生存率,b为mcl1-m-low组的总体生存率,c为mcl1-m-high组的无进展生存率,d为mcl1-m-low组的无进展生存率;可以观察到,使用硼替佐米的pad药物仅能延长mcl1-m-high组中患者的生存期,尤其是无进展生存期(图7左侧,mcl-m-high组,右侧mcl-m-low组;上方,总体生存曲线,下方,无进展生存曲线),这揭示了硼替佐米在临床上能够延缓mcl-m-high组病人的复发恶化,但在mcl-m-low组病人中却没有任何效果。综上所述,实施本发明的分子分型可以指导临床用药,可以避免在mcl1-m-low组病人中使用硼替佐米,一方面可以减轻患者的经济负担,一方面也能使患者少承担药物治疗带来的副作用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1