整合空间转录组、单细胞转录组预测肿瘤新抗原的方法与流程

文档序号:35816830发布日期:2023-10-22 07:39阅读:55来源:国知局

本技术涉及生物医学工程领域,具体属于整合空间转录组、单细胞转录组预测肿瘤新抗原的方法。


背景技术:

1、长期以来,肿瘤特异性抗原的缺乏是阻碍恶性实体肿瘤免疫治疗的瓶颈,基于肿瘤新抗原的疫苗是一种真正的个性化治疗方案,不仅能激发和增强特异性抗肿瘤免疫反应,还可降低或彻底规避脱靶效应的风险,疫苗中所包含的肿瘤特异性新抗原被免疫细胞提呈、识别,并激发特异性抗肿瘤免疫应答。肿瘤治疗性疫苗是指在肿瘤患者体内,通过诱导机体自身的特异性的细胞或体液免疫应答,达到控制或清除肿瘤的天然、人工合成或用基因重组技术表达的产品或制品。肿瘤疫苗由于其主动性和特异性,被认为是最安全、有效的肿瘤免疫治疗手段,其关键要素是获取疫苗中的个性化肿瘤特异性新生抗原突变序列信息。

2、肿瘤新抗原是指由肿瘤细胞体突变基因编码产生的,并能被免疫细胞所识别,激活机体免疫应答的一类异常蛋白质。其具有以下特点:

3、(1)高度特异性,与传统的肿瘤相关抗原相比,新抗原只表达于肿瘤组织而不表达于正常组织,具有高度特异性;

4、(2)显著外源性,肿瘤细胞突变产生的新抗原,通常未经胸腺阴性选择,具有显著的外源性;

5、(3)突变随机性,目前研究认为,肿瘤突变的位点和类型是随机的,并无规律可循,这也给新抗原的预测带来了极大的困难和不确定性;

6、(4)分布集落性,大多数的肿瘤细胞都存在新抗原的表达,由于突变随机性的存在,并非所有肿瘤细胞表达的新抗原是相同的,因此,新抗原在肿瘤中的分布通常是集落性或克隆性的。

7、与早期靶向肿瘤相关抗原(taa)的治疗性疫苗不同,个体化新抗原癌症疫苗是靶向肿瘤细胞所特有、而正常细胞中不表达的特异性新抗原,可诱导机体自身产生强烈的、持续有效的特异性免疫应答,精准杀伤肿瘤细胞,重新恢复机体正常的抗肿瘤免疫反应,从而成为一种具有特殊价值的、具备有“治愈潜力”的新型个体化精准癌症免疫治疗方法,是肿瘤免疫治疗的最理想的靶标。

8、目前主流的肿瘤新抗原鉴定方法一种是根据基因测序结果进行比对,找到非同义突变的位点,通过计算机算法和分析,预测该位点可能形成的新抗原表位。迄今为止,新抗原预测主要关注mhcⅰ类分子结合表位,mhcⅱ类分子结合表位由于其弹性较大、复杂性更强而甚少进行预测,并且普通测序预测的抗原突变数量多,不能有效、准确预测肿瘤组织内部功能性抗原突变。

9、另一种是新抗原鉴定方法是基于质谱测序的筛选预测模型,其原理是将细胞表面的抗原肽从hla分子上洗脱下来进行质谱测序。这种方法的优势是极大地缩小了新抗原的候选范围,且不具偏向性,其显著缺点是灵敏度低,一些低丰度的肽段容易被忽略,但一些低丰度的抗原分子往往具有较高的免疫原性,可能是潜在的肿瘤治疗靶点。此外,肿瘤组织的空间异质性、患者hla异质性等为个性化肿瘤新抗原预测带来挑战。总之,目前肿瘤新抗原的预测方法都具有一定的局限性,不能高效、准确的全面解析实体瘤中可以特异性引起免疫应答的新抗原,从而筛选出功能性新抗原靶点。

10、单细胞测序技术和空间转录组学的出现为解决上述问题提供了可能,尤其是空间转录组可以从时空维度准确定位到功能性的抗原突变序列和高结合力的tcr序列的物理位置,可以更高效的预测具有高免疫原性的肿瘤新抗原序列。单细胞测序是指是指在单个细胞水平上对转录组或基因组进行扩增并测序,以检测单细胞在基因组(结构变异-structuralvariations-svs;拷贝数变异-copynumbervariants-cnvs;单核苷酸变异-singlenucleotidevariants-snvs等),转录组学(rna表达水平,转录本的选择性剪接),表观组学(dna甲基化等),蛋白组学等多个组学的数据。空间转录组学是指从空间层面上解析rna-seq数据的技术,从而解析单个组织切片中的所有mrna,从而能够定位和区分功能基因在特定组织区域内的表达信息。目前这两种技术已经被广泛用于解析肿瘤异质性、癌症发生发展和基因在空间位置表达等。


技术实现思路

1、本发明的目的是提供一种整合空间转录组、单细胞转录组预测肿瘤新抗原的方法,将空间转录组学和单细胞多组学等新兴科学技术用于高效预测恶性实体肿瘤的个性化肿瘤新抗原。

2、为实现上述目的,本发明采用如下技术方案:

3、整合空间转录组、单细胞转录组预测肿瘤新抗原的方法,其特征在于,包括以下步骤:

4、s1,建立空间转录组文库:建立癌症患者的肿瘤组织和非肿瘤组织空间转录组文库和肿瘤组织中t细胞的tcr文库,非肿瘤组织包括癌旁部位和正常组织;

5、s2,建立单细胞转录组文库:建立癌症患者的肿瘤组织和非肿瘤组织、pbmc的单细胞转录组文库和t细胞的tcr文库,非肿瘤组织包括癌旁部位和正常组织;

6、s3,高通量测序:针对癌症患者癌组织、癌旁部位和正常组织进行rna高通量测序和全外显子测序;

7、s4,筛选肿瘤新抗原:整合空间转录组和单细胞转录组、全外显子测序数据、rna高通量测序数据多组学技术筛选高免疫原性的肿瘤新抗原,具体包括:

8、s41、获取肿瘤基因突变信息:基于全外显子序列数据和rna高通量测序数据,使用pcawg variants calling pipeline进行体细胞突变识别,获取大量肿瘤基因突变信息;

9、s42、hla分型:通过athlates,hlathena等工具基于全外显子测序数据和rna测序数据结果获取个体肿瘤病人的mhc信息;

10、s43、单细胞测序分析获取单个肿瘤细胞的突变基因表达和t细胞的tcr信息:利用r语言的seurat4.0包分析肿瘤组织的单细胞测序数据,通过数据质控,得到标准化数据,使用共享最近邻的社区发现算法对标准化数据进行初始的降维聚类,得到的不同细胞亚群,同时利用the in silico human surfaceome数据库,将不同细胞亚群定义为不同细胞,最后利用相关性分析或者通过随机森林法将s41获取的大量肿瘤基因突变信息映射到不同细胞的亚群(cluster),明确肿瘤单细胞聚类和基因表达情况,结合外显子测序数据和rna转录组数据,筛选潜在的单个肿瘤细胞的突变基因,同时利用cell ranger vdj分析获取单个t细胞的tcr信息;

11、s44、筛选潜在肿瘤新抗原和特异性t细胞的tcr信息:利用r语言的seurat4.0包对空间转录组文库的rna数据分析,首先对数据进行标准化处理,之后通过降维和聚类,检测空间高变基因变化,通过spatialfeature plot可视化基因表达,最后利用去卷积法、映射方法与s43中的单个肿瘤细胞的突变基因和单个t细胞的tcr信息进行数据整合分析,而获取真正与免疫细胞相互作用的肿瘤细胞突变基因信息和t细胞的tcr信息,其中肿瘤组织炎症反应区的肿瘤细胞群体产生的基因突变,作为潜在肿瘤新抗原候选,并预测潜在肿瘤新抗原氨基酸序列,同时利用cell ranger vdj获取与肿瘤细胞互相作用的t细胞,也即特异性识别肿瘤新抗原的t细胞表面的tcr信息;

12、s45、筛选出具有免疫原性的新抗原信息:对潜在肿瘤新抗原氨基酸序列和mhc结合亲和力、以及该复合物与特异性t细胞的tcr结合力、相对空间位置进行综合分析打分,从而获取具有高免疫原性的新抗原氨基酸序列信息组合。

13、进一步优选地,所述步骤s45具体为:基于tcrprofile数据与pmhc的结合特异性,预测s44分析获得特殊位置的肿瘤细胞突变基因的氨基酸序列与mhc结合亲和力(包括mhc-i型亲和力和mhc-ii型亲和力)及与t细胞tcr结合力和相对空间位置,对这些潜在的突变短肽序列进行综合系统性打分,同时结合体外验证试验,筛选出高免疫原性的肿瘤新抗原,特殊位置的肿瘤细胞突变基因即为所述真正与免疫细胞相互作用的肿瘤细胞突变基因信息。

14、更加优选地,癌症患者为肝癌、肺癌或者结直肠癌患者。

15、与现有技术相比本发明具有以下特点和有益效果:

16、本技术整合空间转录组、单细胞转录组等高通量测序技术,同时应用人工智能神经网络学习模型等预测肿瘤新抗原的方法,探究肺癌、肝癌和结直肠癌的肿瘤新抗原表位,从而筛选出高免疫原性的肿瘤新抗原表位序列,用于研发多靶点、个性化肿瘤新抗原治疗性疫苗。具体地,本技术技术路线在基于高通量测序(全外显子及rna测序)、hla分型、单细胞rna测序、tcr测序的基础上,优先引入了最新技术——空间转录组分析,首次在单个细胞水平,同时从时间和空间维度上解析复杂的实体瘤肿瘤微环境的基因表达模式和肿瘤中浸润的免疫细胞的tcrprofile,创新性的提高了肿瘤新抗原预测的精确度。t细胞识别新抗原的最基本要求是突变肽具有与患者的至少一个mhc等位基因结合的能力。与mhci结合的是8-11个氨基酸的肽段,mhcii结合的是15-24个氨基酸的肽段。基于以上多组学分析获得的dna突变信息(wes)、rna表达信息、hla分型、单细胞基因表达、tcrprofile等多层次信息,通过生物学信息学分析(optitype、maria、ascat、netmhc、nettcr、maxquant等多个软件)及人工智能算法等工具,对每一位实体瘤患者进行新抗原表位的预测,并优先筛选出具有高免疫原性,且可正向刺激免疫系统杀伤肿瘤的20-30个肿瘤特异性新抗原表位肽序列。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1