一种基于遗传物质特异性的肿瘤细胞药物敏感性评估方法

文档序号:9288509阅读:507来源:国知局
一种基于遗传物质特异性的肿瘤细胞药物敏感性评估方法
【技术领域】
[0001] 本发明涉及肿瘤细胞药物敏感性检测与评价技术领域,具体是一种基于遗传物质 特异性的肿瘤细胞药物敏感性评估方法。
【背景技术】
[0002] 肿瘤已经成为人类的"头号杀手",严重威胁着人类的健康,根据世界卫生组织的 报道,过去10年间全球肿瘤的发病率和死亡率均增长了约22%,预计到2020年新发病例将 达到2000万,约有1200万人将死于肿瘤。在我国,近10年来,由于环境污染恶化,出现了 许多癌症村、癌症县等肿瘤高发区,肿瘤患者数量增长迅速,其死亡率也已居中年人死亡的 首位。如何有效治疗癌症是一项世界性的难题,也是我国医疗卫生事业的一项紧迫性课题。
[0003] 化学疗法是肿瘤临床治疗的主要方式之一,当前,对同种类型的肿瘤患者个体往 往施用相同的化疗方案。然而,临床应用表明,不同的肿瘤患者个体,甚至同一分期的患者, 对药物的反应或疗效显著不同,有的甚至发生严重的毒副作用。最新医学研究证实,不同个 体的肿瘤化疗疗效不同的根本原因在于其遗传物质的差异性。因此,相对于现有的理化指 标或组织病理学的方法,如何基于遗传物质的特异性对肿瘤细胞的药物敏感性进行评估成 为一项亟待解决的问题。

【发明内容】

[0004] 本发明的目的在于提供一种基于遗传物质特异性的肿瘤细胞药物敏感性评估方 法,采用极限学习机识别与药物敏感性相关的肿瘤细胞基因突变谱特征,通过建模基因突 变谱与药物IC50值之间的关联关系,实现基于遗传物质特异性的肿瘤细胞药物敏感性评 估。
[0005] 本发明的技术方案为:
[0006] -种基于遗传物质特异性的肿瘤细胞药物敏感性评估方法,包括以下步骤:
[0007] (1)按一定比例将肿瘤细胞样本集分割为训练样本子集和测试样本子集,所述肿 瘤细胞样本集数据包括各个肿瘤细胞样本的基因突变谱和药物IC50值;
[0008] (2)采用训练样本子集训练并获得不同参数条件下的肿瘤细胞药物IC50值极限 学习机预测模型集合;
[0009] (3)采用测试样本子集逐个测试所述肿瘤细胞药物IC50值极限学习机预测模型, 选择性能最佳的肿瘤细胞药物IC50值极限学习机预测模型作为肿瘤细胞药物敏感性评估 丰旲型;
[0010] (4)将待测肿瘤细胞的基因突变谱输入所述肿瘤细胞药物敏感性评估模型,计算 得到所述待测肿瘤细胞的药物IC50值,作为其药物敏感性评估值。
[0011] 所述的基于遗传物质特异性的肿瘤细胞药物敏感性评估方法,所述步骤(1)中, 具体按照3:2的比例将肿瘤细胞样本集分割为训练样本子集和测试样本子集。
[0012] 所述的基于遗传物质特异性的肿瘤细胞药物敏感性评估方法,所述步骤(2),具体 包括:
[0013] (21)根据基因突变谱维数设置极限学习机隐含层节点数,所述极限学习机隐含层 节点数分为Q种情况:
[0014] Nq= 2p+5q,q = 1,2,…,Q
[0015] 其中,Nq表示极限学习机隐含层节点数,p表示基因突变谱维数;
[0016] (22)对每种情况的极限学习机隐含层节点数,分别执行步骤(23)~(26);
[0017] (23)随机赋值每个隐含层节点的输入权重向量以及输出偏置;
[0018] (24)计算对应训练样本数据的隐含层输出矩阵:
[0019]
[0020] 其中,H表示隐含层输出矩阵,X1表示第i,i = 1,2,…,L个训练样本的 基因突变谱,Wk表示第k,k = 1,2,…,Nq个隐含层节点的输入权重向量,bk表示第 k,k = 1,2,…,Nq个隐含层节点的输出偏置,g(wkXi+bk)表示隐含层节点激励函数,
[0021] (25)采用最小二乘法求解隐含层输出矩阵的Moore-Penrose广义逆矩阵;
[0022] (26)计算隐含层输出权重:
[0023] β = H 1T
[0024] 其中,β表示隐含层输出权重,H 1表示隐含层输出矩阵的Moore-Penrose广义逆 矩阵,T表示所有训练样本的药物IC50值标签;
[0025] (27)获得Q个肿瘤细胞药物IC50值极限学习机预测模型:
[0026]
[0027] 其中,Γ(χ)表示基于第q个预测模型得到的肿瘤细胞药物IC50值,1?表示第q 个预测模型的第k个隐含层节点的输出权重,表示第q个预测模型的第k个隐含层节 点的输入权重,表示第q个预测模型的第k个隐含层节点的输出偏置。
[0028] 所述的基于遗传物质特异性的肿瘤细胞药物敏感性评估方法,所述步骤(3),具体 包括:
[0029] (31)对测试样本子集中的所有测试样本,依次采用所获得的每个预测模型计算得 到其药物IC50预测值;
[0030] (32)根据测试样本的药物IC50实际值和预测值,计算每个预测模型在所有测试 样本上的预测总误差:
[0031] (33)选择预测总误差最小的预测模型,将其作为肿瘤细胞药物敏感性评估模型。
[0032] 由上述技术方案可知,本发明采用极限学习机来学习基因突变谱模式特征与药物 敏感性关系模型,然后使用所获得的模型对待测肿瘤细胞的药物IC50值进行预测,实现了 在基因遗传水平上的肿瘤细胞药物敏感性评估,同时药物IC50值的使用能够避免人工主 观性影响,使得药物敏感性判别更加客观、可靠,采用极限学习机学习无需迭代,待调节参 数少且能保证全局最优,使得肿瘤细胞药物敏感性检测更加方便快捷、高效实用。
【附图说明】
[0033] 图1是本发明的方法流程图;
[0034] 图2是本发明中肿瘤细胞药物IC50值极限学习机预测模型学习流程图;
[0035] 图3是本发明中肿瘤细胞药物IC50值极限学习机预测模型评估流程图;
[0036] 图4是本发明所获得的肿瘤细胞药物敏感性极限学习机网络结构示意图。
【具体实施方式】
[0037] 下面结合附图和具体实施例进一步说明本发明。
[0038] 如图1所示,一种基于遗传物质特异性的肿瘤细胞药物敏感性评估方法,包括以 下步骤:
[0039] S1、按一定比例(如3:2)将肿瘤细胞样本集分割为训练样本子集和测试样本子 集,其中,训练样本子集用于学习基因突变谱与药物IC50值指标间的关系模型,测试样本 子集用于选择最佳肿瘤细胞药物IC50值极限学习机预测模型,作为肿瘤细胞药物敏感性 评估模型。
[0040] 训练样本子集数据可以表示为:
[0041] Xtr= {x i, tilxje Rp, R, i = I, ---L}
[0042] 其中,X1表示第i个训练样本的基因突变谱,P表示基因突变谱维数,t i表示第i 个训练样本的药物IC50值,L表示训练样本总数。
[0043] 测试样本子集数据可以表示为:
[0044] Xte= {x .j,tjlxje Rp,tjG R,j = 1,...M}
[0045] 其中,Xj表示第j个测试样本的基因突变谱,t j表示第j个测试样本的药物IC50 值,M表示测试样本总数。
[0046] S2、采用训练样本子集训练并获得不同参数条件下的肿瘤细胞药物IC50值极限 学习机预测模型集合,作为候选肿
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1