一种用于正常核型急性髓系白血病预后分层的方法及装置与流程

文档序号:14937693发布日期:2018-07-13 19:43阅读:208来源:国知局

本发明属于分子生物技术领域,尤其涉及一种用于正常核型急性髓系白血病预后分层的方法及装置。



背景技术:

急性髓性白血病(aml,acutemyeloidleukemia)是一种以造血干细胞分化受阻导致不同阶段未成熟细胞异常增殖而正常造血组织减少为特征的恶性克隆性疾病,严重影响人类的健康。

根据细胞遗传学分层可将aml预后分为低危组、中危组和高危组,其中,被划分在中危组的核型正常的(cn-aml,cytogeneticallynormalacutemyeloidleukemia)患者约占全部aml患者50%,这类患者存在明显异质性,预后存在明显差异。

目前可在cn-aml患者中检测到分子遗传学的变化,包括与cn-aml预后相关的基因突变和基因表达的改变,然后利用分子遗传学并结合联用多项临床指征,比如:基因突变、患者年龄、细胞遗传学水平及基因表达等进行联合打分可以实现cn-aml患者的预后评估。但是这种评估方法的过程非常繁琐,且不能有效地进行预后评估的疾病分层,导致不能辅助临床制定精准分层的治疗方案,不能对患者进行精准治疗。



技术实现要素:

针对现有技术存在的问题,本发明实施例提供了一种用于正常核型急性髓系白血病预后分层的方法及装置,用于解决现有技术中不能有效、简易地对cn-aml患者进行预后评估的疾病分层,导致不能辅助临床制定精准分层的治疗方案,不能对患者进行精准治疗的技术问题。

本发明实施例提供一种用于正常核型急性髓系白血病预后分层的方法,所述方法包括:

获取正常核型急性髓系白血病cn-aml患者的目标评估基因,所述目标评估基因为stab1基因;

根据cn-aml患者目标评估基因的基因表达量对所述cn-aml患者进行分层,将所述cn-aml患者分为预后良好组及预后不良组。

上述方案中,所述根据cn-aml患者目标评估基因的基因表达量对所述cn-aml患者的预后生存时间进行分层,包括:

获取所述目标评估基因在目标样本中的各基因表达量;

确定各基因表达量的中位数;

当所述cn-aml患者目标评估基因的基因表达量大于所述中值时,确定所述cn-aml患者的目标评估基因为高表达基因,将所述当前cn-aml患者分为预后不良组;

当所述cn-aml患者目标评估基因的基因表达量小于所述中值时,确定所述cn-aml患者的目标评估基因为低表达基因,将所述当前cn-aml患者分为预后良好组。

上述方案中,所述根据cn-aml患者目标评估基因的基因表达量对所述cn-aml患者进行分层,将所述cn-aml患者分为预后良好组及预后不良组后,包括:

对处于预后不良组的cn-aml患者指示相应的药物信息。

上述方案中,所述对处于预后不良组的cn-aml患者指示相应的药物信息,包括:

获取对目标药物敏感或耐药的基因以及癌症药物数据库中多个药物的拮抗剂的半抑制浓度ic50值,所述目标药物为临床上的经验药物;

利用皮尔森函数确定所述stab1基因的表达量与所述对药物敏感或者耐药的基因表达量之间的相关性,若所述stab1基因的表达量与所述对药物敏感或者耐药的基因表达量之间的相关性为正相关,则将所述目标药物作为处于预后不良组的cn-aml患者的指示药物;

利用所述皮尔森函数确定癌症药物数据库中的药物拮抗剂的半抑制浓度ic50值与所述stab1基因表达量的相关性,若所述ic50值与所述stab1基因表达量的呈正相关性,则将所述药物作为处于预后不良组的cn-aml患者的指示药物。

上述方案中,所述对处于预后不良组的cn-aml患者指示相应的药物信息,包括:

对处于预后不良组的cn-aml患者指示阿糖胞苷药物、小分子抑制剂nvp-bhg712、小分子抑制剂gsk-j4、小分子抑制剂brd-k30748066和陶扎塞替tozasertib药物信息。

上述方案中,所述方法包括:

从数据库中获取目标样本的基因表达信息,所述目标样本为正常核型急性髓系白血病cn-aml患者的样本;

根据预设的生存时间为分类标准,将所述目标样本分为第一类样本及第二类样本,所述第一类样本为生存时间小于2年的样本,所述第二类样本为生存时间大于2年的样本;

根据预设的第一筛选条件对所述第一类样本及所述第二类样本的基因进行筛选,获取多个差异表达基因;

根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;

从所述数据库中获取影响所述cn-aml预后的临床因子,根据影响所述cn-aml预后的临床因子及影响急性髓系白血病aml生存的经验预后因子对所述多个预后相关差异表达基因进行多因素比例风险cox回归分析,获取各独立预后基因;

根据预设的验证样本集分别对每个独立预后基因进行验证,根据验证结果确定出所述目标评估基因。

上述方案中,所述根据预设的第一筛选条件对所述第一类样本及所述第二类样本的基因进行筛选,获取多个差异表达基因,包括:

根据所述第一筛选条件对所述第一类样本中的所有基因及所述第二类样本中的所有基因进行筛选,获取多个所述差异表达基因;其中,所述第一筛选条件为假阳性基因的假阳性率fdr<0.05且基因的差异倍数fold-change>1.5。

上述方案中,所述根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因,包括:

获取每个差异表达基因分别在所述目标样本中的生存资料,所述生存资料包括:每个差异表达基因的基因表达量、每个差异表达基因对应样本的生存时间及生存状态;

基于所述每个差异表达基因的生存资料,利用km统计工具中的曲线函数对每个差异表达基因进行生存分析,生成各差异表达基因的第一km生存曲线;

从所述各第一km生存曲线获取每个差异表达基因的第一显著值;

根据预设的第二筛选条件对每个差异表达基因的第一显著值进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;其中,所述第二筛选条件为p≤0.05;所述p为显著值。

上述方案中,所述根据影响所述cn-aml预后的临床因子及影响aml生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险cox回归分析,获取各独立预后基因,包括:

根据影响所述cn-aml预后的临床因子及影响所述aml生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险cox回归分析,获取每个所述预后相关差异表达基因的第二显著值;

根据预设的第二筛选条件对所述各所述预后相关差异表达基因的第二显著值进行筛选,获取各独立预后基因;其中,所述第二筛选条件为p≤0.05;所述p为显著值;

所述影响所述cn-aml预后的临床因子包括:年龄age、fms样的酪氨酸激酶3(flt3)突变、dna甲基转移酶3a(dnmt3a)突变、异磷酸脱氢酶1(idh1)突变、异磷酸脱氢酶2(idh2)突变、runt相关转录因子1(runx1)突变及线粒体基因b(mtcyb)突变、核磷蛋白(npm1)突变及威廉姆斯肿瘤抑制因子1(wt1)突变;

所述影响aml生存的经验预后因子包括:npm1突变、idh1突变、idh2突变及wt1突变。

本发明还提供一种用于正常核型急性髓系白血病预后分层的装置,所述装置包括:

获取单元,用于获取正常核型急性髓系白血病cn-aml患者的目标评估基因,所述目标评估基因为stab1基因;

分层单元,用于根据cn-aml患者目标评估基因的基因表达量对所述cn-aml患者进行分层,将所述cn-aml患者分为预后良好组及预后不良组。

本发明实施例提供了一种用于正常核型急性髓系白血病预后分层的方法及装置,所述方法包括:获取正常核型急性髓系白血病cn-aml患者的目标评估基因,所述目标评估基因为stab1基因;根据cn-aml患者目标评估基因的基因表达量对所述cn-aml患者进行分层,将所述cn-aml患者分为预后良好组及预后不良组;如此,根据cn-aml患者的目标评估基因把cn-aml患者划分为预后良好组和预后不良组,确定患者的疾病分层,以能辅助临床对预后良好组及预后不良组分别制定精准的治疗方案,进而能对患者进行精准治疗;这里,因目标评估基因只有一个,因此能简单地对cn-aml患者进行预后评估和疾病分层;另外所述目标评估基因为stab1基因,因stab1基因为膜蛋白基因,因此能利用现有的检测设备快速检测出,提高了检测效率。

附图说明

图1为本发明实施例一提供的用于正常核型急性髓系白血病预后分层的方法流程示意图;

图2为本发明实施例二提供的用于正常核型急性髓系白血病预后分层的装置结构示意图;

图3为本发明实施例三提供的stab1基因在tcgacn-aml预测样本中的km生存曲线示意图;

图4为本发明实施例三提供的stab1基因在gse12417a预测样本中的km生存曲线示意图;

图5为本发明实施例三提供的stab1基因在gse71014预测样本中的km生存曲线示意图;

图6为本发明实施例三提供的stab1基因在gse6891预测样本中的km生存曲线示意图。

具体实施方式

为了解决现有技术中不能有效、简易地对cn-aml患者进行预后评估和疾病分层,导致不能制定精准分层治疗方案,不能对患者进行精准治疗的技术问题,本发明实施例提供了一种正常核型急性髓系白血病预后分层的方法及装置,所述方法包括:获取cn-aml患者的目标评估基因,所述目标评估基因为stab1基因;根据cn-aml患者目标评估基因的基因表达量对所述cn-aml患者进行分层,将所述cn-aml患者分为预后良好组及预后不良组。

下面通过附图及具体实施例对本发明的技术方案做进一步的详细说明。

实施例一

本实施例提供一种用于正常核型急性髓系白血病预后分层的方法,如图1所示,所述方法包括:

s111,获取正常核型急性髓系白血病cn-aml患者的目标评估基因,所述目标评估基因为stab1基因;

本步骤中,获取正常核型急性髓系白血病cn-aml患者的目标评估基因之前,需要先确定出目标评估基因是哪一个基因,具体的确定方式如下:

从数据库中获取目标样本的基因表达信息,所述目标样本为正常核型急性髓系白血病cn-aml患者的样本;

本步骤中,从癌症基因数据库(tcga,thecancergenomeatlas)下载获取预设数量样本的基因表达信息,预设样本包括:正常核型急性髓系白血病cn-aml患者的和异常核型急性髓系白血病患者的基因表达信息,所述基因表达信息包括:基因表达量。

这里,因在数据中,cn-aml患者的和异常核型急性髓系白血病患者的样本标识是不同的,因此可以根据目标样本的样本标识,从所述预设数量样本中提取目标样本的基因表达信息。所述目标样本为cn-aml患者的基因表达信息。

获取到目标样本后,根据预设的生存时间为分类标准,将所述目标样本分为第一类样本及第二类样本;所述预设的生存时间为临床上cn-aml完全缓解的经验指标,具体为2年。本实施中所述第一类样本为生存时间小于2年的样本,所述第二类样本为生存时间大于2年的样本。

获取到第一类样本及第二类样本后,根据所述第一筛选条件,利用统计建模工具r包的deseq函数对所述第一类样本中的所有基因及所述第二类样本中的所有基因进行筛选,获取多个所述差异表达基因;其中,所述第一筛选条件为假阳性基因的假阳性率(fdr)<0.05且基因的差异倍数(fold-change)>1.5。

获取到差异表达基因后,根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因。

具体地,获取每个差异表达基因分别在所述目标样本中的生存资料,所述生存资料包括:每个差异表达基因的基因表达量、每个差异表达基因对应样本的生存时间及生存状态;所述生存状态为生或死的状态,生的状态可以以1对应,死的状态可以以0对应。

基于所述每个差异表达基因的生存资料,利用r包中的曲线函数survival对每个差异表达基因进行生存分析,生成各差异表达基因的第一km生存曲线;

从所述各第一km生存曲线获取每个差异表达基因的第一显著值;

根据预设的第二筛选条件对每个差异表达基因的第一显著值进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;其中,所述第二筛选条件为p≤0.05;所述p为显著值。

比如,以基因a为例,基因a在每个目标样本中都存在一个基因表达量,确定目标样本中基因a的表达量取的中位数(中值),利用km中的logranktest函数将表达量大于中值的样本及表达量小于中值的样本进行区分,生成表格;表达量大于中值的样本为高表达量样本,表达量小于中值的样本为低表达量样本。

然后根据基因a的生存资料,利用r包survival函数生成基因a的第一km生存曲线,并从所述基因a的第一km生存曲线上读取基因a的显著值p值,当基因a的p值≤0.05时,确定基因a为与所述生存时间相关的差异表达基因。

确定出所述生存时间相关的多个预后相关差异表达基因后,根据影响所述cn-aml预后的临床因子及影响急性髓系白血病aml生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险cox回归分析,获取各预后基因。

具体地,首先需要对影响所述cn-aml预后的临床因子进行筛选。

这里还需要从所述数据库中获取影响所述cn-aml预后的临床因子。具体如下:从数据库中获取目标样本的临床信息,利用r包的survival函数,结合目标样本的临床信息,筛选出统计学意义显著的临床因子。当所述临床因子的p≤0.1时,视为该临床因子具有统计学意义,即可以作为影响cn-aml预后的临床因子。本实施例中影响cn-aml预后的临床因子包括:年龄age、fms样的酪氨酸激酶3(flt3)突变、dna甲基转移酶3a(dnmt3a)突变、异磷酸脱氢酶1(idh1)突变、异磷酸脱氢酶2(idh2)突变、runt相关转录因子1(runx1)突变及线粒体基因b(mtcyb)突变、核磷蛋白(npm1)突变及威廉姆斯肿瘤抑制因子1(wt1)突变。

然后再结合文献及临床上认定的影响aml生存的经验预后因子,所述影响aml生存的预后因子包括:核磷蛋白(npm1)突变、异磷酸脱氢酶1(idh1)突变、异磷酸脱氢酶2(idh2)突变及威廉姆斯肿瘤抑制因子1(wt1)突变。

最后根据影响所述cn-aml预后的临床因子及影响急性髓系白血病aml生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险cox回归分析,获取每个所述预后相关差异表达基因的第二显著值。

当第二显著值p≤0.05时,则说明该基因为独立于age、flt3突变、dnmt3a突变、idh1突变、runx1突变、mt_cyb突变、npm1突变、idh2突变及wt1突变的独立预后基因。

获取到独立预后基因后,根据预设的验证样本集分别对每个独立预后基因进行验证,根据验证结果确定一个目标评估基因。所述验证样本集可以从ncbi网站(https://www.ncbi.nlm.nih.gov/)的geo数据平台获取。

具体地,获取每个独立预后基因分别在所述验证样本集中的各基因表达量,所述验证样本集中包括多个验证样本;获取每个独立预后基因分别在每个验证样本中的生存资料,所述生存资料包括:每个独立预后基因的基因表达量、每个独立预后基因对应样本的生存时间及生存状态;基于所述每个独立预后基因在各验证样本中的生存资料,利用km统计工具中的曲线函数对每个预后基因进行生存分析,生成各预后基因分别在各所述验证样本中的第二km生存曲线;从所述各第二km生存曲线获取每个预后基因在各验证样本中的第三显著值;获取符合所述第二筛选条件的每个独立预后基因各验证样本中的第三显著值的数量,符合第二筛选条件的数量最多的第三显著值对应的独立预后基因为所述目标评估基因;所述目标评估基因为stab1基因。

比如,独立预后基因包括基因b、c和d;验证样本包括:a、b和c;以基因b为例来说,获取每个基因b分别在各所述验证样本中的各基因表达量,同时获取在各验证样本中的生存资料。

然后根据基因b在各验证样本中的生存资料,利用r包survival函数分别生成基因b的第三km生存曲线,并从所述基因b在不同验证样本中的第三km生存曲线上读取基因b在不同验证样本中的p值,再统计符合第二筛选条件的p值数量,所述第二筛选条件为显著值p≤0.05。

然后以同样的方法统计基因c和d在各验证样本中p值,确定符合第二筛选条件的p值数量。

假设基因b在各验证样本中的p值符合第二筛选条件的数量是3,基因c在各验证样本中的p值符合第二筛选条件的数量是2,基因d在各验证样本中的p值符合第二筛选条件的数量是1,那么就确定基因b为目标评估基因。

这里,因目标评估基因为stab1基因,可以利用流式检测仪快速获取cn-aml患者的目标评估基因,因stab1基因为膜蛋白基因,因此能利用现有的检测设备快速检测出。

s112,根据cn-aml患者目标评估基因的基因表达量对所述cn-aml患者进行分层,将所述cn-aml患者分为预后良好组及预后不良组。

当目标评估基因确定出之后,获取cn-aml患者的目标评估基因,根据cn-aml患者的目标评估基因的基因表达量对所述cn-aml患者进行分层,将所述cn-aml患者分为预后良好组及预后不良组。

这里,还需要先评估目标评估基因预测生存时间的准确度。具体地,确定目标评估基因在各预测样本中的各基因表达量,确定目标评估基因在各预测样本中的基因表达量的中值,将基因表达量大于该中值的样本确定为评估基因高表达样本,将基因表达量小于该中值的基因确定评估基因低表达样本。

以预设的生存时间为标准,再分别统计出各预测样本中评估基因高表达样本的第一数量,及各预测样本中评估基因低表达样本的第二数量;根据所述第一数量及所述第二数量确定所述目标评估基因在各预测样本中的准确率。其中,所述预测样本包括目标样本及验证样本。

比如,目标评估基因为基因b,在确定基因b在目标样本中的准确率时,先将样本根据基因b分为评估基因高表达样本及评估基因低表达样本,统计出评估基因高表达样本的生存时间小于2年的数量为m,统计出评估基因低表达样本的生存时间大于2年的数量为n,那么在计算目标评估基因b在目标样本的准确率为:(m+n)/s;所述s为目标样本的数量。

当确定出准确率后,当准确率为60%以上时,认为该目标评估基因的准确度是可行的。

那么可认为根据所述目标评估基因的基因表达量评估cn-aml患者的预后生存时间准确度较高。

然后就可以根据cn-aml患者的目标评估基因的基因表达量对所述cn-aml患者进行分层。当所述cn-aml患者目标评估基因的基因表达量大于所述中值时,确定所述cn-aml患者的目标评估基因为高表达基因,将所述当前cn-aml患者分为预后不良组;

当所述cn-aml患者目标评估基因的基因表达量小于所述中值时,确定所述cn-aml患者的目标评估基因为低表达基因,将所述当前cn-aml患者分为预后良好组。

根据目标评估基因表达量将cn-aml患者分为预后良好组和预后不良组别后,可以对处于预后不良组的cn-aml患者指示相应的药物信息,以辅助临床指定精准的分层治疗方案。

具体如下:先需要获取对目标药物敏感或耐药的基因,所述目标药物为临床上的经验药物,比如阿糖胞苷;获得对阿糖胞苷敏感或者耐药的基因后,采用r包的皮尔森函数计算stab1和对阿糖胞苷敏感或者耐药基因的表达量相关性,发现stab1高表达与对阿糖胞苷耐药基因表达呈正相关性,即可说明stab1高表达样本(预后不良组)能揭示这部分患者对阿糖胞苷耐药,即说明在stab1高表达患者群体中需要加大阿糖胞苷剂量或者选择其他治疗方案。

同时分别计算gdsc(drugsensitivityincancer)和ctrp(cancertherapeuticsresponseportal)数据库中药物拮抗剂的半抑制浓度ic50值与stab1表达量的皮尔森相关性,获得p值<0.05(即相关性具有统计学意义)的药物,包括ic50值与stab1表达量呈现正相关性和负相关性的药物。ic50值与stab1呈正相关性表明,stab1高表达样本中,对该类药物具有敏感性,即说明stab1高表达患者(预后不良组)对该类药物敏感,可供临床考虑为候选药物/小分子抑制剂。这里stab1高表达患者对小分子抑制剂nvp-bhg712、小分子抑制剂gsk-j4、小分子抑制brd-k30748066和陶扎塞替(tozasertib)敏感。

这里,cn-aml患者的预后生存时间小于2年时,为stab1高表达的患者,该类型患者对阿糖胞苷具有抗药性,在stab1高表达患者中需要提高阿糖胞苷药物剂量或选择其他替代药物。

同时,stab1高表达患者中,对小分子抑制剂gsk-j4、小分子抑制brd-k30748066和陶扎塞替(tozasertib)较为敏感,,预示着可能这几类药物能在stab1高表达患者中有一定的作用。这样就对stab1高表达患者指示出相应的药物信息,以辅助临床指定精准的分层治疗方案,避免延误治疗时机。

实施例二

相应于实施例一,本实施例提供一种正常核型急性髓系白血病预后的评估装置,如图2所示,所述装置包括:获取单元21、分层单元22及指示单元23;其中,

获取单元21在获取正常核型急性髓系白血病cn-aml患者的目标评估基因之前,需要先确定出目标评估基因是哪一个基因,具体的确定方式如下:

获取单元21用于从癌症基因数据库tcga中下载获取预设数量样本的基因表达信息,预设样本包括:正常核型急性髓系白血病cn-aml患者的和异常核型急性髓系白血病患者的基因表达信息,所述基因表达信息包括:基因表达量。

因在数据中,cn-aml患者的和异常核型急性髓系白血病患者的样本标识是不同的,因此可以根据目标样本的样本标识,从所述预设数量样本中提取目标样本的基因表达信息。所述目标样本即为cn-aml患者的基因表达信息。

当获取到目标样本后,分类单元24用于根据预设的生存时间为分类标准,将所述目标样本分为第一类样本及第二类样本;所述预设的生存时间为临床上cn-aml完全缓解的经验指标,具体为2年。本实施中所述第一类样本为生存时间小于2年的样本,所述第二类样本为生存时间大于2年的样本。

获取到第一类样本及第二类样本后,第一筛选单元25用于根据预设的第一筛选条件,利用r包的deseq函数对所述第一类样本中的所有基因及所述第二类样本中的所有基因进行筛选,获取多个所述差异表达基因;其中,所述第一筛选条件为差异表达基因的假阳性率(fdr)<0.05且差异表达基因的差异倍数(fold-change)>1.5。

获取到差异表达基因后,第二筛选单元26用于根据预设的第二筛选条件对所述多个差异表达基因进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因。

具体地,获取每个差异表达基因分别在所述目标样本中的生存资料,所述生存资料包括:每个差异表达基因的基因表达量、每个差异表达基因对应样本的生存时间及生存状态;所述生存状态为生或死的状态,生的状态可以以0对应,死的状态可以以1对应。

基于所述每个差异表达基因的生存资料,利用r包中的曲线函数survival对每个差异表达基因进行生存分析,生成各差异表达基因的第一km生存曲线;

从所述各第一km生存曲线获取每个差异表达基因的第一显著值;

根据预设的第二筛选条件对每个差异表达基因的第一显著值进行筛选,获取与所述生存时间相关的多个预后相关差异表达基因;其中,所述第二筛选条件为p≤0.05;所述p为显著值。

比如,以基因a为例,基因a在每个目标样本中都存在一个基因表达量,确定目标样本中基因a的表达量取的中值(中位数),利用km中的logranktest函数将表达量大于中值的样本及表达量小于中值的样本进行区分,生成表格;表达量大于中值的样本为高表达量样本,表达量小于中值的样本为低表达量样本。

然后根据基因a的生存资料,利用r包survival函数生成基因a的第一km生存曲线,并从所述基因a的第一km生存曲线上读取基因a的显著值p值,当基因a的p值≤0.05时,确定基因a为与所述生存时间相关的差异表达基因。

确定出所述生存时间相关的多个预后相关差异表达基因后,分析单元27用于根据影响所述cn-aml预后的临床因子及影响aml生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险cox回归分析,获取各预后基因。

具体地,分析单元27首先需要对影响所述cn-aml预后的临床因子进行筛选。

这里还需要从数据库中获取目标样本的临床信息,利用r包的survival函数,结合目标样本的临床信息,筛选出统计学意义显著的临床因子。当所述临床因子的p≤0.1时,视为该临床因子具有统计学意义,即可以作为影响cn-aml预后的临床因子。本实施例中影响cn-aml预后的临床因子包括:年龄age、fms样的酪氨酸激酶3(flt3)突变、dna甲基转移酶3a(dnmt3a)突变、异磷酸脱氢酶1(idh1)突变、异磷酸脱氢酶2(idh2)突变、runt相关转录因子1(runx1)突变及线粒体基因b(mtcyb)突变、核磷蛋白(npm1)突变及威廉姆斯肿瘤抑制因子1(wt1)突变。

然后再结合文献及临床上认定的影响aml生存的预后因子,所述影响aml生存的预后因子包括:核磷蛋白(npm1)突变、异磷酸脱氢酶1(idh1)突变、异磷酸脱氢酶2(idh2)突变及威廉姆斯肿瘤抑制因子1(wt1)突变。

最后分析单元27根据影响所述cn-aml预后的临床因子及影响aml生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险cox回归分析,获取每个所述预后相关差异表达基因的第二显著值。

当第二显著值p≤0.05时,则说明该基因为独立于age、flt3突变、dnmt3a突变、idh1突变、runx1突变、mtcyb突变、npm1突变、idh2突变及wt1mutation突变的独立预后基因。

获取到独立预后基因后,验证单元28用于根据预设的验证样本集分别对每个独立预后基因进行验证,根据验证结果确定一个目标评估基因。所述验证样本集可以从ncbi网站(https://www.ncbi.nlm.nih.gov/)的geo数据平台获取。

具体地,验证单元28获取每个独立预后基因分别在所述验证样本集中的各基因表达量,所述验证样本集中包括多个验证样本;获取每个独立预后基因分别在每个验证样本中的生存资料,所述生存资料包括:每个独立预后基因的基因表达量、每个独立预后基因对应样本的生存时间及生存状态;基于所述每个独立预后基因在各验证样本中的生存资料,利用km统计工具中的曲线函数对每个预后基因进行生存分析,生成各预后基因分别在各所述验证样本中的第二km生存曲线;从所述各第二km生存曲线获取每个预后基因在各验证样本中的第三显著值;获取符合所述第二筛选条件的每个独立预后基因各验证样本中的第三显著值的数量,符合第二筛选条件的数量最多的第三显著值对应的独立预后基因为所述目标评估基因;所述目标评估基因为stab1基因。

比如,独立预后基因包括基因b、c和d;验证样本包括:a、b和c;以基因b为例来说,验证单元28获取每个基因b分别在各所述验证样本中的各基因表达量,同时获取在各验证样本中的生存资料。

然后根据基因b在各验证样本中的生存资料,利用r包survival函数分别生成基因b的第三km生存曲线,并从所述基因b在不同验证样本中的第三km生存曲线上读取基因b在不同验证样本中的p值,再统计符合第二筛选条件的p值数量,所述第二筛选条件为显著值p≤0.05。

然后以同样的方法统计基因c和d在各验证样本中p值,确定符合第二筛选条件的p值数量。

假设基因b在各验证样本中的p值符合第二筛选条件的数量是3,基因c在各验证样本中的p值符合第二筛选条件的数量是2,基因d在各验证样本中的p值符合第二筛选条件的数量是1,那么就确定基因b为目标评估基因。

当确定目标评估基因后,分层单元22用于根据cn-aml患者目标评估基因的基因表达量对所述cn-aml患者进行分层,将所述cn-aml患者分为预后良好组及预后不良组。

这里,评估单元29还需要先评估目标评估基因预测生存时间的准确度。具体地,确定目标评估基因在各预测样本中的各基因表达量,确定目标评估基因在各预测样本中的基因表达量的中值,将基因表达量大于该中值的样本确定为评估基因高表达样本,将基因表达量小于该中值的基因确定评估基因低表达样本。

以预设的生存时间为标准,再分别统计出各预测样本中评估基因高表达样本的第一数量,及各预测样本中评估基因低表达样本的第二数量;根据所述第一数量及所述第二数量确定所述目标评估基因在各预测样本中的准确率。其中,所述预测样本包括目标样本及验证样本。

比如,目标评估基因为基因b,在确定基因b在目标样本中的准确率时,先将样本根据基因b分为评估基因高表达样本及评估基因低表达样本,统计出评估基因高表达样本的生存时间小于2年的数量为m,统计出评估基因低表达样本的生存时间大于2年的数量为n,那么在计算目标评估基因b在目标样本的准确率为:(m+n)/s;所述s为目标样本的数量。

当评估单元29确定出准确率后,当准确率为60%以上时,认为该目标评估基因的准确度是可行的。

那么可认为根据所述目标评估基因的基因表达量评估cn-aml患者的预后生存时间准确度较高。

然后分层单元22就可以根据cn-aml患者的目标评估基因的基因表达量对所述cn-aml患者进行分层。当所述cn-aml患者目标评估基因的基因表达量大于所述中值时,确定所述cn-aml患者的目标评估基因为高表达基因,将所述当前cn-aml患者分为预后不良组;

当所述cn-aml患者目标评估基因的基因表达量小于所述中值时,确定所述cn-aml患者的目标评估基因为低表达基因,将所述当前cn-aml患者分为预后良好组。

分层单元22确定出cn-aml患者的分组后,指示单元23可以对处于预后不良组的cn-aml患者指示相应的药物信息,以辅助临床指定精准的分层治疗方案,避免延误治疗时机。

具体如下:先需要获取对目标药物敏感或耐药的基因,所述目标药物为临床上的经验药物,比如阿糖胞苷;获得对阿糖胞苷敏感或者耐药的基因后,采用r包的皮尔森函数计算stab1和对阿糖胞苷敏感或者耐药基因的表达量相关性,发现stab1高表达与对阿糖胞苷耐药基因表达呈正相关性,即可说明stab1高表达样本(预后不良组)能揭示这部分患者对阿糖胞苷耐药,即说明在stab1高表达患者群体中需要加大阿糖胞苷剂量或者选择其他治疗方案。

同时分别计算gdsc(drugsensitivityincancer)和ctrp(cancertherapeuticsresponseportal)数据库中药物拮抗剂的半抑制浓度ic50值与stab1表达量的皮尔森相关性,获得p值<0.05(即相关性具有统计学意义)的药物,包括ic50值与stab1表达量呈现正相关性和负相关性的药物。ic50值与stab1呈正相关性表明,stab1高表达样本中,对该类药物具有敏感性,即说明stab1高表达患者(预后不良组)对该类药物敏感,可供临床考虑为候选药物/小分子抑制剂。这里stab1高表达患者对小分子抑制剂nvp-bhg712、小分子抑制剂gsk-j4、小分子抑制brd-k30748066和陶扎塞替(tozasertib)敏感。

这里,cn-aml患者的预后生存时间小于2年时,为stab1高表达的患者,该类型患者对阿糖胞苷具有抗药性,在stab1高表达患者中需要提高阿糖胞苷药物剂量或选择其他替代药物。

同时,stab1高表达患者中,对小分子抑制剂gsk-j4、小分子抑制brd-k30748066和陶扎塞替(tozasertib)较为敏感,预示着可能这几类药物能在stab1高表达患者中有一定的作用。这样就对stab1高表达患者指示出相应的药物信息,以辅助临床指定精准的分层治疗方案,避免延误治疗时机。

实施例三

实际应用中,可以根据上述方法及装置确定cn-aml的目标评估基因,并利用该基因对cn-aml进行预后分层,指示相应的药物信息,具体如下:

首先从tcga数据库中下载200例样本的基因表达信息及临床信息,然后根据cn-aml样本的样本标识,从所述预设数量样本中提取cn-aml样本的基因表达信息。所述cn-aml样本的数量为79例。

根据预设的生存时间为分类标准,将所述cn-aml样本分为第一类样本及第二类样本;所述预设的生存时间为临床上cn-aml完全缓解的经验指标,具体为2年。本实施中所述第一类样本为生存时间小于2年的cn-aml样本,所述第二类样本为生存时间大于2年的cn-aml样本。

获取到第一类样本及第二类样本后,用r包的deseq函数对所述第一类样本中的所有基因及所述第二类样本中的所有基因进行筛选,获取多个所述差异表达基因;其中,所述第一筛选条件为差异表达基因的假阳性率(fdr)<0.05且基因的差异倍数(fold-change)>1.5。这里,所述差异表达基因的数量为353。

获取到差异表达基因后,利用r包survival对每个差异表达基因进行生存分析,生成各差异表达基因的第一km生存曲线;基于第一km生存曲线获取每个差异表达基因的第一显著值,筛选出显著值p≤0.05的与所述生存时间相关预后相关差异表达基因,所述预后相关差异表达基因的数量为15个。

然后根据影响所述cn-aml预后的临床因子及影响急性髓系白血病aml生存的预后因子对所述多个预后相关差异表达基因进行多因素比例风险cox回归分析,获取各独立预后基因,所述独立预后基因为6个。

本实施例中影响cn-aml预后的临床因子包括:年龄age、fms样的酪氨酸激酶3(flt3)突变、dna甲基转移酶3a(dnmt3a)突变、异磷酸脱氢酶1(idh1)突变、异磷酸脱氢酶2(idh2)突变、runt相关转录因子1(runx1)突变及线粒体基因b(mtcyb)突变、核磷蛋白(npm1)突变及威廉姆斯肿瘤抑制因子1(wt1)突变。

所述影响aml生存的预后因子包括:核磷蛋白(npm1)突变、异磷酸脱氢酶1(idh1)突变、异磷酸脱氢酶2(idh2)突变及威廉姆斯肿瘤抑制因子1(wt1)突变。

获取到独立预后基因后,根据预设的基因芯片验证样本集分别对每个独立预后基因进行验证,根据验证结果确定一个目标评估基因。所述验证样本集可以从geo平台获取。所述验证样本集包括四组,各验证样本的样本数量分别为:79、163、104和187。

获取每个独立预后基因在各验证样本中的显著值p,确定符合第二筛选条件的p值数量;所述第二筛选条件为显著值p≤0.05。符合第二筛选条件的p值数量最多的独立预后基因即为目标评估基因。本实施例中的目标评估基因为stab1。

然后利用预测样本集来确定stab1的准确率,具体地,确定stab1在各预测样本中的各基因表达量,确定stab1在各预测样本中的基因表达量的中值,将基因表达量大于该中值的基因确定为高表达评估基因,将基因表达量大于该中值的基因确定为低表达基因。

以预设的生存时间为标准,再分别统计出高表达评估基因在各预测样本中的第一数量,及低表达评估基因在各预测样本中的第二数量;根据所述第一数量及所述第二数量确定所述stab1在各预测样本中的准确率。其中,所述预测样本包括目标样本及验证样本。其中,stab1在各预测样本中的准确率如表1所示:

表1

在表1中,tcgacn-aml(79)为目标样本,其余四组为预测样本,以目标样本为例,在计算stab1在目标样本中的准确率时,具体为:(35+22)/79=0.72。

然后再利用同样的方法计算stab1在其他验证样本中的准确率,由表1可以看出,stab1在预测样本中的准确率为60%以上,证明stab1的准确度是可行的。

进一步地,还可根据stab1在各预测样本中的km生存曲线来预测stab1的可行性,stab1基因在tcgacn-aml样本km生存曲线如图3所示,stab1基因在gse12417a(79)样本km生存曲线如图4所示,stab1基因在gse71014(104)样本km生存曲线如图5所示,stab1基因在gse6891(187)样本km生存曲线如图6所示。其中,在图3、图4、图5及图6中,上方的曲线代表的是低表达stab1对应的km生存曲线,下方的曲线代表的是高表达stab1对应的km生存曲线,对应的n分别代表的是低表达样本的数量及高表达样本的数量。

需要说明的是,图3、图4、图5及图6是根据stab1的中值来确定低表达样本的数量及高表达样本的数量。而表1中同样以stab1的中值来确定stab1高表达组和stab1低表达组,但是统计的是stab1低表达样本中生存时间大于2年的样本数量以及stab1高表达样本中生存时间小于2年的样本数量,因此数量会出现不一致的情况。

由图3、图4、图5及图6可以看出,在四个预测样本中,stab1基因的p值均小于0.05,也进一步说明stab1基因的准确度是可行的。

然后就可以根据cn-aml患者的目标评估基因的基因表达量对所述cn-aml患者进行分层。当所述cn-aml患者目标评估基因的基因表达量大于所述中值时,确定所述cn-aml患者的目标评估基因为高表达基因,将所述当前cn-aml患者分为预后不良组;预后不良组cn-aml患者的预后生存时间小于2年;

当所述cn-aml患者目标评估基因的基因表达量小于所述中值时,确定所述cn-aml患者的目标评估基因为低表达基因,将所述当前cn-aml患者分为预后良好组;预后良好组cn-aml患者的预后生存时间大于2年。

根据目标评估基因表达量将cn-aml患者分为预后良好组和预后不良组别后,可以对处于预后不良组的cn-aml患者指示相应的药物信息,以辅助临床指定精准的分层治疗方案,避免延误治疗时机。

具体如下:先需要获取对目标药物敏感或耐药的基因,所述目标药物为临床上的经验药物,比如阿糖胞苷;获得对阿糖胞苷敏感或者耐药的基因后,采用r包的皮尔森函数计算stab1和对阿糖胞苷敏感或者耐药基因的表达量相关性,发现stab1高表达与对阿糖胞苷耐药基因表达呈正相关性,即可说明stab1高表达样本(预后不良组)能揭示这部分患者对阿糖胞苷耐药,即说明在stab1高表达患者群体中需要加大阿糖胞苷剂量或者选择其他治疗方案。

同时分别计算gdsc(drugsensitivityincancer)和ctrp(cancertherapeuticsresponseportal)数据库中药物拮抗剂的半抑制浓度ic50值与stab1表达量的皮尔森相关性,获得p值<0.05(即相关性具有统计学意义)的药物,包括ic50值与stab1表达量呈现正相关性和负相关性的药物。ic50值与stab1呈正相关性表明,stab1高表达样本中,对该类药物具有敏感性,即说明stab1高表达患者(预后不良组)对该类药物敏感,可供临床考虑为候选药物/小分子抑制剂。这里stab1高表达患者对小分子抑制剂nvp-bhg712、小分子抑制剂gsk-j4、小分子抑制brd-k30748066和陶扎塞替(tozasertib)敏感。

综上,cn-aml患者的预后生存时间小于2年时,为stab1高表达的患者,该类型患者对阿糖胞苷具有抗药性,在stab1高表达患者中需要提高阿糖胞苷药物剂量或选择其他替代药物。

同时,stab1高表达患者中,对小分子抑制剂nvp-bhg712、gsk-j4,brd-k30748066和陶扎塞替(tozasertib)较为敏感,预示着可能这几类药物能在stab1高表达患者中有一定的作用。这样就对stab1高表达患者指示出相应的药物信息,以辅助临床指定精准的分层治疗方案,以能对患者进行精准治疗,避免延误治疗时机。

本发明实施例提供的正常核型急性髓系白血病预后的评估装置能带来的有益效果至少是:

本发明实施例提供了一种用于正常核型急性髓系白血病预后分层的方法及装置,所述方法包括:获取正常核型急性髓系白血病cn-aml患者的目标评估基因,所述目标评估基因为stab1基因;根据cn-aml患者目标评估基因的基因表达量对所述cn-aml患者进行分层,将所述cn-aml患者分为预后良好组及预后不良组;如此,根据筛选出目标样本中的差异表达基因,再对差异表达基因进行筛选,获取与生存时间相关的多个预后相关差异表达基因,再结合临床信息筛选出多个预后基因,然后利用验证样本集中的多组样本数据分别对每个预后基因进行验证,确定出一个目标评估基因,根据cn-aml患者的目标评估基因把cn-aml患者划分为预后良好组和预后不良组,确定患者的疾病分层;然后还可以对预后不良组的cn-aml患者指示相应的药物信息,以辅助临床制定精准分层的治疗方案,能对患者进行精准治疗,避免延误治疗时机;这里,因确定的目标评估基因只有一个,因此能简单地对cn-aml患者进行预后评估和疾病分层;另外所述目标评估基因为stab1基因,因stab1基因为膜蛋白基因,因此能利用现有的rt-pcr或流式细胞仪易于快速检测出,提高了检测效率,进一步提高了预后分层过程的简便性。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的网关、代理服务器、系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1