本发明涉及医疗器械领域,尤其涉及一种食管鳞癌预后评估模型装置及其建模方法。
背景技术:
食管鳞癌(esophagealsquamouscellcarcinoma,escc)在全球范围内最为常见的癌症类型之一,也是造成癌症相关死亡率较高的常见原因。尽管在诊断方法、化疗、放疗和手术等方面取得了进展,escc发病率及死亡率仍较高,晚期患者的预后仍然很差。目前escc的预后评估主要根据诊断时肿瘤的tnm分期状况预测预后结局。尽管tnm分期是一种稳定有效的预后评价体系,然而在临床中其精确度有待提高。因此,临床上迫切需要一个新的、更具针对性的escc预后评估指标或模型。
肿瘤免疫微环境(tumorimmunemicroenvironment,time)是肿瘤细胞生存的环境,其中浸润各种免疫细胞,包括自然杀伤细胞(naturalkillercell,nk)、调节性t细胞(regulatorytcell,tregs)、树突状细胞(dendriticcell,dc)、中性粒细胞(neutrophils)、cd8+t细胞等。这些肿瘤组织中浸润的淋巴细胞可影响肿瘤的发生发展。迄今为止,已证实肿瘤浸润性免疫细胞的含量与肺癌、食管鳞癌、乳腺癌和卵巢癌等恶性肿瘤的临床结局有关。
目前,国内外有许多新的基于time的免疫预后评价体系的建立。但是,研究者多以一两个免疫细胞为着眼点,探究其与癌症预后的关系,所建立的预后模型也存在较大的完善空间。
技术实现要素:
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种食管鳞癌预后评估模型装置及其建模方法。
为了实现上述目的,本发明采用了如下技术方案:
一种食管鳞癌预后评估模型装置,包括geo数据库模块、数据获取模块、数据预处理模块、含量特征提取模块、特征变量提取模块、预后模型建立模块;
所述数据获取模块用于获取所述geo数据库模块中的食管鳞癌相关的基因表达数据及预后数据;
所述数据预处理模块用于对食管鳞癌相关的基因表达数据及预后数据进行预处理;
所述含量特征提取模块用于提取所述数据预处理模块处理后数据的含量特征;
所述特征变量提取模块用于提取所述含量特征提取模块提取的含量中的特征变量;
所述预后模型建立模块用于建立预后评估模型,所述预后评估模型为:os风险值(risk)=3.02memorybcells-0.004cd8tcells-4.04cd4memorytcells(resting)-3.55tregs+2.36gammadeltatcells-3.74nkcells(activated)+10.15dendriticcells(resting)+2.59dendriticcells(activated)-1.54mastcells(resting)。
优选的,所述数据预处理模块包括数据赋值单元、缺失值补充单元和批次差去除单元。
优选的,所述含量特征提取模块采用cibersort分析方法进行分析提取。
优选的,所述特征变量提取模块采用lasso-cox算法进行提取。
一种食管鳞癌预后评估模型装置的建模方法,具体包括以下步骤:
s1:从geo数据库中获取食管鳞癌相关的基因表达数据及预后数据共n=179例;
s2:对s1中的临床数据进行数字赋值,使临床数据以数字形式展示;
s3:利用r语言对临床数据进行缺失值补充;
s4:对补充后的数据进行归一化处理去除批次差;
s5:利用cibersort分析得到22种肿瘤浸润淋巴细胞亚型的含量特征;
s6:利用lasso-cox算法对22种肿瘤浸润淋巴细胞亚型的含量进行特征选择并建模,得到肿瘤浸润淋巴细胞预后模型。
优选的,所述步骤s6中构建所得的肿瘤浸润淋巴细胞预后模型为:os风险值(risk)=3.02memorybcells-0.004cd8tcells-4.04cd4memorytcells(resting)-3.55tregs+2.36gammadeltatcells-3.74nkcells(activated)+10.15dendriticcells(resting)+2.59dendriticcells(activated)-1.54mastcells(resting)。
本发明从geneexpressionomnibus(geo)公共数据库获取食管鳞癌mrna表达谱的数据为研究对象,利用cibersort分析得到22种肿瘤浸润淋巴细胞亚型的含量特征,采用lasso(leastabsoluteshrinkageandselectionoperator,最小绝对值收敛和选择算子)-cox回归方法,筛选与生存时间相关的肿瘤浸润淋巴细胞亚型并建立预后模型,当有新的特征数据时,只要输入这些特征数据的值到回归模型当中就可以得到癌症患者的生存时间概率,对癌症的预后具有重要的意义。
附图说明
图1为本发明的流程示意图。
图2为本发明的22种肿瘤浸润淋巴细胞亚型的含量特征示意图。
图3为本发明的肿瘤浸润淋巴细胞预后模型建立过程示意图。
图4为本发明的低风险组和高风险组示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
参照图1-4一种食管鳞癌预后评估模型装置,包括geo数据库模块、数据获取模块、数据预处理模块、含量特征提取模块、特征变量提取模块、预后模型建立模块;
所述数据获取模块用于获取所述geo数据库模块中的食管鳞癌相关的基因表达数据及预后数据;
所述数据预处理模块用于对食管鳞癌相关的基因表达数据及预后数据进行预处理;
所述含量特征提取模块用于提取所述数据预处理模块处理后数据的含量特征;
所述特征变量提取模块用于提取所述含量特征提取模块提取的含量中的特征变量;
所述预后模型建立模块用于建立预后评估模型,所述预后评估模型为:os风险值(risk)=3.02memorybcells-0.004cd8tcells-4.04cd4memorytcells(resting)-3.55tregs+2.36gammadeltatcells-3.74nkcells(activated)+10.15dendriticcells(resting)+2.59dendriticcells(activated)-1.54mastcells(resting)。
所述数据预处理模块包括数据赋值单元、缺失值补充单元和批次差去除单元,所述含量特征提取模块采用cibersort分析方法进行分析提取,所述特征变量提取模块采用lasso-cox算法进行提取。
一种食管鳞癌预后评估模型装置的建模方法,具体包括以下步骤:
s1:从geo数据库中获取食管鳞癌相关的基因表达数据及预后数据共n=179例;
s2:对s1中的临床数据进行数字赋值,使临床数据以数字形式展示;
s3:利用r语言对临床数据进行缺失值补充;
s4:对补充后的数据进行归一化处理去除批次差;
s5:利用cibersort分析得到22种肿瘤浸润淋巴细胞亚型的含量特征(过程如图2);
s6:利用lasso-cox算法对22种肿瘤浸润淋巴细胞亚型的含量进行特征选择并建模,得到肿瘤浸润淋巴细胞预后模型(过程如图3)。
本实施方式中,所述步骤s6中构建所得的肿瘤浸润淋巴细胞预后模型为:os风险值(risk)=3.02memorybcells-0.004cd8tcells-4.04cd4memorytcells(resting)-3.55tregs+2.36gammadeltatcells-3.74nkcells(activated)+10.15dendriticcells(resting)+2.59dendriticcells(activated)-1.54mastcells(resting)。
验证模型的可靠性:
我们通过从thecancergenomeatlas(tcga)公共数据库中,下载escc患者的mrna表达数据及预后信息(共n=81例),按照以上步骤进行预后分析。计算测试队列中每个患者的risk值,通过roc曲线分析,取曲线下面积最大处为截断值,将患者分为低风险组和高风险组(如图4)。
根据截断值,在验证队列中,km生存分析发现高风险组在测试对列中预后较差(os:hr=1.956,95%ci:1.152to3.368,logrankp=0.014)。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。