基于肿瘤新抗原特征值的新抗原活性预测和排序方法与流程

文档序号:13736359阅读:3303来源:国知局

本发明涉及肿瘤免疫治疗领域,具体地,涉及一种基于肿瘤新抗原特征值的新抗原活性打分和排序方法。



背景技术:

近年来,肿瘤免疫治疗大放异彩,临床试验不断取得特破,治愈率和有效缓解率持续提升。肿瘤新抗原的高效精准筛选在肿瘤免疫疗法中是极其重要而基础的工作,特别是对tcr-t/til、个体化疫苗等肿瘤免疫疗法尤为重要。

目前,对于肿瘤新抗原的筛选方法目前通行的方案是两个步骤:步骤一、基于肿瘤-正常组织的wgs/wes数据,调用mutect/varscan等工具计算肿瘤细胞的基因突变;步骤二、调用netmhcpan等算法预测mhc-i结合新抗原。

目前还没有有效的方法基于抗原的活性进行排序,以提升抗原筛选效率。上述方案中由于没有对预测得到的mhc-i结合新抗原进行活性排序,因此会给实验验证的带来巨大的工作量,造成肿瘤新抗原的筛选效率的低下。



技术实现要素:

本发明针对上述现有技术中存在的不足,提供了一种基于肿瘤新抗原特征值的新抗原活性打分和排序方法,可大大降低实验验证的工作量,并进一步实现肿瘤新抗原的高效精准筛选。

本发明的技术方案是这样实现的:

基于肿瘤新抗原特征值的新抗原免疫活性预测和排序方法,其特征在于,包括以下步骤:

(1),肿瘤-正常样本的wgs/wes、rna-seq测序数据的输入:输入肿瘤-正常样本的全基因测序数据wgs或全外显子组测序数据wes、转录组测序数据rna-seq;

(2),肿瘤体细胞突变的预测及注释、相关特征值的计算:基于步骤(1)输入的测序数据,调用varscan或mutect工具分析计算出肿瘤体细胞突变,调用vep(varianteffectprediction)工具完成突变注释,调用pyclone、kallisto、varscan或mutect工具计算出如下特征值:突变基因克隆比、突变基因表达值tpm、等位基因突变频率vaf;

(3)基于肿瘤体细胞突变的mhc-i结合新抗原预测、相关特征值的计算:基于步骤(2)中的肿瘤体细胞突变及注释数据,调用netmhcpan、netchop、optitype工具预测mhc-i结合新抗原,并计算出如下特征值:突变肽段与mhc亲和力排序百分比、未突变肽段与mhc亲和力排序百分比、肽段剪切呈递效率;

(4)新抗原所有相关特征值的提取:针对步骤(3)中预测的mhc-i结合新抗原,提取出肿瘤新抗原的所有相关特征值;

(5)新抗原活性打分函数的设定:针对步骤(4)中提取的新抗原特征值,设定新抗原活性打分函数;

(6)基于新抗原活性打分函数的新抗原排序:通过新抗原活性打分函数对新抗原进行排序。

作为优选,步骤(4)中,新抗原相关特征值包括rm、a、rn、e、nc、cl,其中:

rm—突变肽段与mhc亲和力排序百分比,由netmhcpan计算得出;

a—等位基因突变频率vaf,由varscan/mutect/strelka2计算得到;

rn—未突变肽段与mhc亲和力排序百分比,由netmhcpan计算得出;

e—突变基因表达值tpm,由kallisto计算;

nc—肽段剪切呈递效率,由netchop计算得出;

cl—突变基因克隆比,由pyclone计算得出。

作为优选,步骤(5)中,提出的新抗原活性预测打分函数为:

neo_score=abundance·dissimilarity·clonality;

clonality=nc·cl;

abundance=l(rm)·a·tanh(e/k);

dissimilarity=(1-l(rn)/2));

其中:l(x)=1/(1+e5(x-2)),tanh(x)为双曲正切函数;

k为转录本表达丰度阈值,默认值为1。

作为优选,步骤(6)中,通过新抗原活性预测函数对新抗原进行排序算法过程如下:

a),对于所有预测的mhc-i结合新抗原,调用新抗原活性预测函数neo_score计算出新抗原活性的预测值;

b),基于新抗原活性的预测值,采用快速排序算法对新抗原进行排序;

c),输出新抗原排序结果。

采用了上述技术方案的本发明的设计思想及有益效果是:

本发明的技术方案,提出了一种肿瘤新抗原活性预测打分函数,基于新抗原活性预测函数对所预测的mhc-i结合新抗原进行活性排序,从而实现高效精准的肿瘤新抗原筛选。

此函数基于肿瘤新抗原生成、切割转运、新抗原与mhc结合这个完整过程设计,打分函数分为3个部分,其中,克隆性(clonality)衡量新抗原由突变至短肽的效率nc及新抗原在所有肿瘤细胞中分布的比例cl,是影响肿瘤疫苗疗效的重要因素;丰度(abundance)衡量新抗原表达量及新抗原与mhc-i结合并形成pmhc复合物的效率,新抗原突变基因表达量e越高,等位基因突变频率a越高,复合物间结合亲和力rm越高(ic50值越小),免疫原性则越强;不相似度(dissimilarity)衡量突变肽段与对应正常肽段亲和力的差异rn,由于中枢耐受机制存在,二者差异越大,新抗原的特异性就越强,用于治疗的副作用也越小。函数中两个映射函数用于归一化(0到1)计算值,l(x)中阈值2为肽段-mhc结合亲和力筛选阈值,tanh(x/k)保证新抗原表达丰度超过设定阈值k时,函数值变化趋于平缓。

此活性预测函数考虑了新抗原产生过程中的综合影响因素,排序后的抗原更有意义与应用价值。

附图说明

图1是本发明实施例所述的基于肿瘤新抗原特征值的新抗原活性方法和排序方法示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

实施例一:

如图1所示,一种基于肿瘤新抗原特征值的新抗原活性方法和排序方法,包括以下步骤:

步骤101:肿瘤-正常样本的wgs/wes、rna-seq测序数据的输入(使用黑色素瘤病人样本一mel_21,science2015:carrenobm,magriniv,beckerhapakm,etal.cancerimmunotherapy.adendriticcellvaccineincreasesthebreadthanddiversityofmelanomaneoantigen-specifictcells.[j].science,2015,348(6236):803-8.)

步骤102:肿瘤体细胞突变的预测及注释、相关特征值的计算:基于肿瘤-正常样本的wgs/wes、rna-seq测序数据,调用varscan/mutect等工具分析计算出肿瘤体细胞突变,调用vep(varianteffectprediction)工具完成突变注释,调用pyclone、kallisto、varscan/mutect工具计算出如下特征值:突变基因克隆比cl、突变基因表达值tpm、等位基因突变频率vaf。以文献中有活性肽段对应的特征值为例,病人样本一mel_21的3个肽段对应计算出的e(tpm)和a(vaf)值如下:

表1

步骤103:基于肿瘤体细胞突变的mhc-i结合新抗原预测、相关特征值的计算:基于步骤(1)中的肿瘤体细胞突变及注释数据,调用netmhcpan、netchop、optitype工具预测mhc-i结合新抗原,并计算出如下特征值:突变肽段与mhc亲和力排序百分比rm、未突变肽段与mhc亲和力排序百分比rn、肽段剪切呈递效率nc。以文献中有活性肽段对应的特征值为例,病人样本一mel_21的3个肽段对应计算出的rm,rn和nc值如下:

表2

步骤104:新抗原相关特征值的提取:针对步骤103中预测的mhc-i结合新抗原,提取出肿瘤新抗原的所有相关特征值,病人样本一mel_21的新抗原及特征值见表1、表2;

步骤105:新抗原活性打分函数的设定:针对步骤104中提取的新抗原特征值,设定新抗原活性打分函数;

步骤106:基于新抗原活性打分函数的新抗原排序:通过新抗原活性打分函数对新抗原进行排序,表3给出了病人样本一mel_21中经pmhc活性实验验证的新抗原的打分(neo_score)以及在全集中的排序(rank)。

表3

在3个鉴定出的新抗原中,clneyhlfl为使用肿瘤疫苗刺激dc细胞之前就表现出可激活cd8+t细胞的免疫活性,其余2个则是在使用疫苗增强免疫系统能力后,具备不同程度的免疫活性。我们看到,kmignhlwv和clneyhlfl处于排序top3(总候选新抗原数94)位置。而amfwsvpts无论是在体外实验还是人体肿瘤微环境中,由于表达量偏低,决定其免疫原性和免疫应答偏弱,在我们的排序结果中处于33位,实验结果与我们的预测排序相当吻合。

实施例二:

如图1所示,一种基于肿瘤新抗原特征值的新抗原活性方法和排序方法,包括以下步骤:

步骤101:肿瘤-正常样本的wgs/wes、rna-seq测序数据的输入(使用黑色素瘤病人样本二mel_38,science2015:carrenobm,magriniv,beckerhapakm,etal.cancerimmunotherapy.adendriticcellvaccineincreasesthebreadthanddiversityofmelanomaneoantigen-specifictcells.[j].science,2015,348(6236):803-8.)

步骤102:肿瘤体细胞突变的预测及注释、相关特征值的计算:基于肿瘤-正常样本的wgs/wes、rna-seq测序数据,调用varscan/mutect等工具分析计算出肿瘤体细胞突变,调用vep(varianteffectprediction)工具完成突变注释,调用pyclone、kallisto、varscan/mutect工具计算出如下特征值:突变基因克隆比cl、突变基因表达值tpm、等位基因突变频率vaf;以文献中有活性肽段对应的特征值为例,病人样本二mel_38的3个肽段对应计算出的e(tpm)和a(vaf)值如下:

表4

步骤103:基于肿瘤体细胞突变的mhc-i结合新抗原预测、相关特征值的计算:基于步骤(1)中的肿瘤体细胞突变及注释数据,调用netmhcpan、netchop、optitype工具预测mhc-i结合新抗原,并计算出如下特征值:突变肽段与mhc亲和力排序百分比rm、未突变肽段与mhc亲和力排序百分比rn、肽段剪切呈递效率nc;以文献中有活性肽段对应的特征值为例,病人样本二mel_38的3个肽段对应计算出的rm,rn和nc值如下:

表5

步骤104:新抗原相关特征值的提取:针对步骤(2)中预测的mhc-i结合新抗原,提取出肿瘤新抗原的所有相关特征值,病人样本二mel_38的新抗原及特征值见表4、表5;

步骤105:新抗原活性打分函数的设定:针对步骤(3)中提取的新抗原特征值,设定新抗原活性打分函数;

步骤106:基于新抗原活性打分函数的新抗原排序:通过新抗原活性打分函数对新抗原进行排序,表6给出了病人样本二mel_38中经pmhc活性实验验证的新抗原的打分(neo_score)以及在全集中的排序(rank)

表6

在3个鉴定出的新抗原中,flynlltrvy为使用肿瘤疫苗刺激dc细胞之前就表现出可激活cd8+t细胞的免疫活性,其余2个则是在使用疫苗增强免疫系统能力后,具备不同程度的免疫活性。我们看到qlscistyv和flynlltrvy处于top20(总候选新抗原数117)。而klmniqqkl无论是在体外实验还是人体肿瘤微环境中,由于表达量偏低,决定其免疫原性和免疫应答偏弱,在我们的排序结果中处于66位,实验结果与我们的预测排序相当吻合。

综上所述,我们提出的新抗原免疫活性打分函数,可以很有效的衡量新抗原的免疫活性,为临床实验与肿瘤研究与免疫治疗提供帮助。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1