基于免疫相关细胞对的黑素瘤预后预测方法及系统

文档序号:31787403发布日期:2022-10-12 14:23阅读:155来源:国知局
基于免疫相关细胞对的黑素瘤预后预测方法及系统

1.本发明涉计算机辅助诊断技术领域,尤其基于免疫相关细胞对的黑素瘤预后预测方法及系统。


背景技术:

2.黑色素瘤患者的预后预测是指通过黑色素瘤患者的症状、体征或者生理参数来预测黑色素瘤患者的生存曲线或者病情发展过程。
3.现有的黑色素瘤患者的预后预测一般利用黑素瘤免疫微环境相关特征基因进行预测,该方法从tcga官网收集黑色素瘤患者表达谱,并使用estimate算法计算免疫浸润评分,将黑色素瘤患者分为高低两组,并使用r包limma,以基因变化倍数》1.5,p值小于0.05为临界值,筛选得到差异基因。剔除无生存信息样本,将53个与免疫微环境相关的基因进行单因素 cox回归分析,多因素cox回归分析,确认了4个与生存期相关的基因,并进行lasso回归,得到cr1,cd97两个基因;在利用多因素cox风险回归分析得到两个基因的相关系数,构建出预后评分riskscore=系数
cr1
*表达量
cr1
+系数
cd97
*表达量
cd97
[1]。
[0004]
该方法虽然能预测黑色素瘤患者的生存概率,但仍存在以下缺陷:
[0005]

生存曲线p值小于0.05为有统计学差异,由图2可知该模型在某些验证集在生存曲线中并不能满足上述条件,且roc曲线的auc在tcga—skcm的评估中,auc均未大于0.7,预测效果较差。
[0006]

作者推断上述基因通过增强b细胞浸润,提高抗肿瘤能力,并未涉及免疫微环境其他免疫细胞的分析,从肿瘤浸润细胞角度预测生存率的能力有限。
[0007]

riskscore的指标仅为两个基因的表达量乘以相关系数,如果取自两批不同的测序实验,则会有批次效应产生的误差,运用在临床上则会产生较大误差。且可能受到测量方法不同和基因注释带来的误差。
[0008]
为了解决预测效果差的问题,有学者提出:将从tcga中提取的471例样本,随机分为训练集(314例)和测试集(154例),提取29个免疫细胞相关基因集,即707个与免疫微环境相关的基因。利用ssgsea分析29个免疫相关基因集的相对丰度,运用层次聚类,将样本分为三个亚型,高免疫浸润,中免疫浸润,低免疫浸润。使用r包limma进行高组和低组之间的差异基因分析,筛选指标为基因变化倍数》1.5,假阳性率<0.01。筛选出的差异基因采用单因素cox 回归,筛选指标为p小于0.05,筛选出与预后相关的260个差异基因,使用lasso回归,参数设置nfold=10,maxit=1000,确定5个核心基因klrk1、kir2dl4、il18rap、kir3dl1和il27, riskscore的计算公式如下:
[0009]
riskscore=(-0.223747467348802
×
表达量
klrk1
)+(-0.0396703042539578
×
表达量
kir2dl4
)+(-0.0188532070987305
×
表达量
il18rap
)+(-0.280680702726008
×
表达量
kir3dl1
)+(-0.32145755755514
×
表达量
il27
).
[0010]
在tcga数据库中提取了skcm患者的临床病理信息,进行单因素cox回归和多因素 cox回归以p《0.05为筛选条件,选取与预后相关的临床指标,利用临床指标和riskscore构
建 nomogram模型,预测生存率[2]。
[0011]
该方案虽然能一定程度提高预后预测的准确率,却仍然不能解决批次效应产生的误差,且可能受到测量方法不同和基因注释带来的误差。
[0012]
[1]田毅,潘意,向丽萍,刘宁,刘文,魏露,杨志波.黑素瘤免疫微环境相关特征基因预后风险评分模型的构建[j/ol].中国皮肤性病学杂志 1-14[2022-05-08].doi:10.13735/j.cjdv.1001-7089.202110166.
[0013]
[2]tianq,gaoh,zhao w,zhouy,yang j.developmentandvalidationofan immune gene set-basedprognostic signature incutaneous melanoma.future oncol.2021nov;17(31):4115-4129. doi:10.2217/fon-2021-0104.epub 2021jul 22.pmid:34291650.


技术实现要素:

[0014]
本发明提供了基于免疫相关细胞对的黑素瘤预后预测方法及系统,用于解决现有的黑素瘤预后预测方法不能解决批次效应产生的误差,准确率低的技术问题。
[0015]
为解决上述技术问题,本发明提出的技术方案为:
[0016]
一种基于免疫相关细胞对的黑素瘤预后预测方法,包括以下步骤:
[0017]
从免疫微环境中筛选出与黑色瘤预后效果相关的免疫关键特征;其中,所述免疫关键特征包括免疫相关细胞对的免疫相关风险;
[0018]
以减少特征冗余,并提高准确率为目的,从所述临床预后信息中筛选与所述免疫关键特征配合使用的临床关键特征;将所述免疫关键特征与所述临床关键特征进行合并,构建关键特征集;
[0019]
从历史数据中获取多个黑色素瘤患者的关键特征集及对应的预后效果值,并根据多个黑色素瘤患者的关键特征集及对应的预后效果值构建预后预测模型;
[0020]
获取目标对象的关键特征集,并将所述关键特征集输入到所述预后预测模型中,得到目标对象的预后效果。
[0021]
优选的,所述免疫相关细胞对的免疫相关风险通过以下公式计算得到:
[0022]
irrs=∑scorea|b
×
coef_a|b
[0023]
其中,irrs为免疫相关细胞对的免疫相关风险,scorea|b为免疫细胞对评分,a、b分别为体内两种不同的免疫细胞,细胞对a|b中,当a的表达量》b的表达量时,scorea|b记作1,当a的表达量《b的表达量时,scorea|b记作0;coef_a|b为相关细胞对系数。
[0024]
优选的,所述相关细胞对系数具体为:
[0025]
当细胞对为效应记忆cd8+t细胞|cd56暗自然杀伤细胞时,所述相关细胞对系数为
ꢀ‑
0.201895537;
[0026]
当细胞对为2型辅助t细胞|效应记忆cd8+t细胞时,所述相关细胞对系数为0.162775185;
[0027]
当细胞对为未成熟b细胞|效应记忆cd4+t细胞时,所述相关细胞对系数为-0.167620476;
[0028]
当细胞对为自然杀伤t细胞|未成熟b细胞时,所述相关细胞对系数为0.376203094;
[0029]
当细胞对为髓样抑制细胞|单核细胞时,所述相关细胞对系数为-0.146018787;
[0030]
当细胞对为效应记忆自然杀伤细胞|中心记忆cd8+t细胞时,所述相关细胞对系数为
ꢀ‑
0.32046159。
[0031]
优选的,所述相关细胞对系数的计算方法如下:
[0032]
收集黑色素瘤患者的表达谱,去除无生存信息患者的表达谱,并收集所述黑色素瘤患者的临床信息;
[0033]
基于ssgsea算法计算28种免疫细胞的丰度,利用单因素cox回归筛选出与预后相关的免疫细胞,其中,有预后意义的免疫细胞是指单因素coxp小于预设第一阈值的免疫细胞;
[0034]
设有n种与预后相关的免疫细胞集,记为x1,x2,x3,...,xn,n≤28,每种免疫细胞集均包括多个同类型的免疫细胞;所有的28种免疫细胞集记为x1,x2,x3,...,xn,...,x
28

[0035]
将与预后相关的n种免疫细胞分别与所有的28种免疫细胞集进行配对,形成多个细胞集对,记为:x1|x1,x1|x2,...,x1x
28
,...,xn|x1,xn|x2,...,xn|x
28

[0036]
分别计算每个细胞集对的集配对值:
[0037]
其中,对于由任意两种免疫细胞集构成的细胞集对xi|xi′
={x
1i
|x
1i

,x
1i
|x
2i

,...,x
1i
|x
mi

,...,x
mi
|xm′i′
};
[0038]
其集配对值为:scorex
1i
|x
1i

+scorex
1i
|x
2i

+,...,+scorex
1i
|xm′i′
+,...,+scorex
mi
|xm′i′

[0039]
其中,分别为免疫细胞集xi内的第1,2,3,...,m个免疫细胞,分别为免疫细胞集xi内的第1,2,3,...,m

个免疫细胞,m、m

分别为免疫细胞集xi内免疫细胞总数,i、i

为免疫细胞的类别,取值范围为1,2,3,...,n;
[0040]
判断每个细胞集对的集配对值是否处于预设的区间内:
[0041]
当存在任意细胞集对的集配对值不处于预设的区间内,则剔除掉所述细胞集对,保留集配对值处于预设区间内的细胞集对;
[0042]
通过单因素cox回归分析,以p《预设阈值为截断值,从保留的细胞集对中筛选出有显著统计学意义的细胞对,之后进行lasso回归,输出细胞对,再采用多因素cox回归的方式,计算出相关细胞对系数。
[0043]
优选的,所述预后预测模型为列线图预测模型,所述预后效果为黑素瘤患者的生存概率,根据多个黑色素瘤患者的关键特征集及对应的预后效果值构建预后预测模型,包括以下步骤:
[0044]
对tcga的临床信息进行单因素cox分析,保留有预后意义的临床变量,筛选的临床变量和irrs作为关键特征值纳入多因素cox回归分析,并构建每个关键特征值的多元cox回归模型;通过r包rms将上述多因素cox回归分析绘制为列线图。
[0045]
优选的,所述临床关键特征包括年龄、溃疡、breslow厚度以及淋巴结分期;
[0046]
所述免疫相关细胞对的免疫相关风险的多元cox回归模型系数为0.889690055;
[0047]
所述年龄的多元cox回归模型系数为0.011632926;
[0048]
当不存在溃疡时,所述溃疡的多元cox回归模型系数为0;当存在溃疡时,所述溃疡的多元cox回归模型系数为0.492972497;
[0049]
所述breslow厚度的多元cox回归模型系数为0.010817322;
[0050]
当所述淋巴结分期为n0时,所述淋巴结分期的多元cox回归模型系数为0;
[0051]
当所述淋巴结分期为n1时,所述淋巴结分期的多元cox回归模型系数为0.54422863;
[0052]
当所述淋巴结分期为n2时,所述淋巴结分期的多元cox回归模型系数为1.014801065;
[0053]
当所述淋巴结分期为n3时,所述淋巴结分期的多元cox回归模型系数为1.315284101;
[0054]
每个多元cox回归模型的常数均为-0.645602725。
[0055]
优选的,所述列线图预测模型包括:免疫相关细胞对的免疫相关风险分值标尺、年龄分值标尺、溃疡分值标尺、深度分值标尺、淋巴结分期分值标尺以及总分值标尺,总分值标尺对应的预测对象为目标对象的生存概率;获取目标对象的关键特征值,并将所述关键特征值输入到所述预后预测模型中,得到目标对象的预后效果,具体包括:
[0056]
将目标对象的关键特征值分别与其对应的分值标尺进行比较,得到各个关键特征的评分值,将各个关键特征的评分值相加,得到总评分值,将所述总评分值与总分值标尺进行比较,得到目标对象的生存概率。
[0057]
一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。
[0058]
本发明具有以下有益效果:
[0059]
1、本发明中的基于免疫相关细胞对的黑素瘤预后预测方法及系统,通过用免疫相关细胞对的免疫相关风险替代基因表达谱,结合剔除冗余特征的临床预后信息,从临床指标和免疫微环境两个层面建立预后预测模型,再以该预后预测模型进行预测。相比现有技术,由于免疫相关细胞对的免疫相关风险在进行免疫微环境评估时,用相对大小代替绝对大小,一方面可以避免批次效应产生的误差,使得不同患者免疫细胞对评分之间具有可比较性;另一方面也不会受到肿瘤免疫浸润细胞测量方法的不同和基因注释的更新所造成的绝对值差异,因而,使用本发明中的预后预测模型,能有效解决批次效应产生的误差。
[0060]
2、在优选方案中,本发明还从多个临床预后信息中筛选出特征冗余的关键特征(即年龄、溃疡与否、breslow深度以及tnm分期中的淋巴结分期)与所述免疫相关细胞对的免疫相关风险配合使用,能以最少的特征数据实现高准确率的预后预测,进一步减少预测的计算机资源消耗。
[0061]
3、在优选方案中,本发明中的于免疫相关细胞对的免疫相关风险评分时,以肿瘤浸润细胞为核心,充分考虑免疫细胞组分不同导致的预后结果不同,能进一步提高预测准确性。
[0062]
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照附图,对本发明作进一步详细的说明。
附图说明
[0063]
构成本技术的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0064]
图1为本发明实施例提供的一种基于免疫相关细胞对的黑素瘤预后预测方法的流
程图;
[0065]
图2为本发明实施例提供的免疫细胞配对图;
[0066]
图3为本发明实施例提供的nomogram模型;
[0067]
图4为本发明实施例提供的nomogram模型网页图;
[0068]
图5为本发明实施例提供的nomogram模型的受试者工作特征曲线(receiver operating characteristic curve,简称roc曲线)图;
[0069]
图6为本发明实施例提供的nomogram模型的生存分析图;
[0070]
图7为本发明实施例提供的nomogram模型的校准曲线图;
[0071]
图8为本发明实施例提供的nomogram模型的决策曲线分析法(decision curve analysis,dca)图;
[0072]
图9为本发明实施例提供的nomogram模型对gse54467队列的生存分析图;
[0073]
图10为本发明实施例提供的nomogram模型对gse65904队列的生存分析图;
[0074]
图11为本发明实施例提供的nomogram模型对gse91061,gse115821,liu et al三个队列的验证免疫治疗效果预测图。
具体实施方式
[0075]
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
[0076]
实施例一:
[0077]
如图1所示,本实施中公开了一种基于免疫相关细胞对的黑素瘤预后预测方法,包括:
[0078]
从免疫微环境中筛选出与黑色瘤预后效果相关的免疫关键特征;其中,所述免疫关键特征包括免疫相关细胞对的免疫相关风险;
[0079]
以减少特征冗余,并提高准确率为目的,从所述临床预后信息中筛选与所述免疫关键特征配合使用的临床关键特征;将所述免疫关键特征与所述临床关键特征进行合并,构建关键特征集;
[0080]
从历史数据中获取多个黑色素瘤患者的关键特征集及对应的预后效果值,并根据多个黑色素瘤患者的关键特征集及对应的预后效果值构建预后预测模型;
[0081]
获取目标对象的关键特征集,并将所述关键特征集输入到所述预后预测模型中,得到目标对象的预后效果。
[0082]
在本实施例中,所述预后预测模型可以是机器学习模型、回归模型中的任意一种。其中,机器学习模型可采用深度神经网络模型,回归模型可采用线性拟合模型或列线图。
[0083]
此外,在本实施例中,还公开了一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。
[0084]
本发明中的基于免疫相关细胞对的黑素瘤预后预测方法及系统,通过用免疫相关细胞对的免疫相关风险替代基因表达谱,结合剔除冗余特征的临床预后信息,从临床指标和免疫微环境两个层面建立预后预测模型,再以该预后预测模型进行预测。相比现有技术,由于免疫相关细胞对的免疫相关风险在进行免疫微环境评估时,用相对大小代替绝对大
小,一方面可以避免批次效应产生的误差,使得不同患者免疫细胞对评分之间具有可比较性;另一方面也不会受到肿瘤免疫浸润细胞测量方法的不同和基因注释的更新所造成的绝对值差异,因而,使用本发明中的预后预测模型,能有效解决批次效应产生的误差。
[0085]
实施例二:
[0086]
实施例二是实施例一的优选实施例,其与实施例一的不同之处,对基于免疫相关细胞对的黑素瘤预后预测方法的具体步骤进行了介绍:
[0087]
本实施例中公开了一种基于免疫相关细胞对的黑素瘤预后预测方法,包括以下步骤:
[0088]
步骤一、构建细胞对算法计算黑素瘤预后的免疫相关风险
[0089]
我们构建的细胞对算法,即基于免疫相关细胞对的免疫相关风险评分(immune related risk score,irrs),计算公式如下:
[0090]
irrs=∑scorea|b
×
coef_a|b
[0091]
其中:细胞对a|b中,当a的表达量》b的表达量时,scorea|b记作1,当a的表达量 《b的表达量时,scorea|b记作0,我们采用的细胞对和细胞对系数coef如下所示:
[0092][0093]
具体的,irrs的细胞对的筛选方法如下:
[0094]

收集tcga中黑色素瘤患者的表达谱,去除无生存信息的患者,共458例,并收集其临床信息。
[0095]

基于ssgsea算法计算28个免疫细胞的丰度,利用单因素cox回归筛选出有预后意义的细胞。
[0096]

如图2所示,将与预后相关的免疫细胞分别与除自身以外的其余细胞进行配对,记作a|b,当a的表达量》b的表达量时,记作1,当a的表达量《b的表达量时,记作0,构建出0或1的矩阵,将0或1占总数的80%以上的细胞对去除,留下其余细胞对。
[0097]
设有总共三个细胞a b c,赋值方式a大于b则a|b为1,b|a为0
[0098]
集合a包括a,b
[0099]
集合b包括a,b,c(即整个原集合)
[0100]
矩阵形式如下:
[0101][0102]
将a|b细胞对那一列的全部样本的值相加得到总数sum,假如总样本为400个,预设比例为80%和20%,那么sum值大于320或sum小于20,则将该细胞对去除。
[0103]

通过单因素cox回归分析,以p《0.05为截断值,筛选出有显著统计学意义的细胞对,之后进行lasso回归,输出细胞对,再采用多因素cox回归的方式,计算出相关细胞对系数。
[0104]
步骤二、基于所述黑素瘤预后的免疫相关风险构建nomogram预后模型
[0105]
s21、nomogram预后模型的构建
[0106]
对tcga的临床信息进行单因素cox分析,保留有预后意义的临床变量,筛选的临床变量和irrs作为关键特征值纳入多因素cox回归分析,并构建每个关键特征值的多元cox回归模型;通过r包rms将上述多因素cox回归分析绘制为列线图。
[0107]
我们整合irrs和临床指标,从肿瘤浸润性免疫细胞和临床特征双方向来进行预后预测,以保证预测效果。引入的临床指标包括:年龄(age)、溃疡与否(ulceration)、breslow深度(breslow depth)、和tnm分期中的淋巴结分期(n),建立的如图3所示的列线图(即 nomogram)
[0108]
其中,所述免疫相关细胞对的免疫相关风险的多元cox回归模型系数为0.889690055;
[0109]
其中,所述年龄的多元cox回归模型系数为0.011632926;
[0110]
其中,当不存在溃疡时,所述溃疡的多元cox回归模型系数为0;当存在溃疡时,所述溃疡的多元cox回归模型系数为0.492972497;
[0111]
其中,所述breslow厚度的多元cox回归模型系数为0.010817322;
[0112]
其中,当所述淋巴结分期为n0时,所述淋巴结分期的多元cox回归模型系数为0;
[0113]
当所述淋巴结分期为n1时,所述淋巴结分期的多元cox回归模型系数为0.54422863;
[0114]
当所述淋巴结分期为n2时,所述淋巴结分期的多元cox回归模型系数为1.014801065;
[0115]
当所述淋巴结分期为n3时,所述淋巴结分期的多元cox回归模型系数为1.315284101;
[0116]
每个多元cox回归模型的常数均为-0.645602725。
[0117]
s22、nomogram模型的进一步可视化
[0118]
常规的nomogram需要医生用尺子对照,得到患者的风险预测,且可能受到打印模糊的影响,所以为了实现进一步的可视化,我们将其开发为如图4所示的网页模式,仅需输入患者的各项指标即可获得1年、3年、6年的生存预测。
[0119]
s23、irrs验证
[0120]
分析本发明的nomogram模型的roc曲线、校准曲线、dca以及生存分析,其中, nomogram模型的roc曲线、校准曲线、dca以及生存分析如图5-8所示,通过gse54467, gse65904两个队列验证预后预测效果,其中两个队列验证预后预测效果如图9、图10所示,并通过gse91061,gse115821,liu et al三个队列验证免疫治疗效果预测效果,其中,免疫治疗效果预测效果如图11所示,从图5-11可以看出,本发明的nomogram模型roc曲线和生存分析都证明了本发明中的nomogram模型具有良好的预后预测能力。
[0121]
综上所示,本发明在构建模型时,以肿瘤浸润细胞为核心,充分考虑免疫细胞组分不同导致的预后结果不同,并采用免疫细胞对评分,比较两种免疫细胞大小,并以0或1赋
值,用相对大小代替绝对大小,如此只需要样本内部进行比较,得到细胞对赋值为0或1,一方面可以避免批次效应产生的误差,使得不同患者免疫细胞对评分之间具有可比较性;另一方面也不会受到肿瘤免疫浸润细胞测量方法的不同和基因注释的更新所造成的绝对值差异,并在免疫细胞对算法的基础上,结合临床预后信息,从临床指标和免疫微环境两个层面建立 nomogram预后模型,以保证预测效果。
[0122]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1