一种多模态癌症识别装置及应用

文档序号:32453653发布日期:2022-12-07 02:22阅读:31来源:国知局
一种多模态癌症识别装置及应用

1.本发明涉及医学人工智能领域,尤其涉及一种基于代谢指纹图谱和临床检测标志物的多模态癌症识别方法、装置及应用。


背景技术:

2.癌症指细胞异常增殖分裂,侵入、转移到其他组织、器官,是由于细胞分裂增殖机制异常而引起的疾病。多数癌症发现即晚期,癌症早筛是提升患者存活率的有效手段。但是,除结直肠癌、乳腺癌、宫颈癌、上消化道肿瘤(如食管癌、胃癌)、肝癌以外,目前多数癌症早期没有一个准确的识别手段。
3.代谢组学测量生命活动的终端产物。代谢组学分析同基因组学、蛋白组学相比,同疾病表型更相近,作为新兴的癌症早筛工具正在被广泛应用。代谢组学数据以质谱数据为代表,通过分子质荷比和相应丰度检测待分析样本,生成对应的代谢指纹图谱,用于癌症识别。但是,癌症的发展和形成是复杂的,代谢分析只能提供代谢层面的信息,在复杂疾病体系(如:癌症)检测中准确率有限。
4.临床信息包括性别、年龄、葡萄糖、氨基酸心肌肌钙蛋白i、癌胚抗原等,分别从基本信息、代谢检测指标和蛋白检测指标提供不同类型的标志物。其中基本信息、蛋白检测指标从与代谢组学正交的角度提供生命体相关的信息。正交信息同代谢信息的融合有望提升癌症早筛的准确率,提升病人存活机会。
5.因此,本领域的技术人员致力于开发一种癌症早期的准确的识别手段和装置。


技术实现要素:

6.有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种癌症早期的准确的识别手段和装置。
7.为实现上述目的,本发明提供了一种多模态癌症识别装置,包括数据输入模块、特征处理模块和定量分析模块;其中,输入模块的输出作为所述特征处理模块的输入,特征处理模块的输出作为所述定量分析模块的输入,定量分析模块采用定量分析网络计算癌症的概率。
8.进一步地,输入模块采用不同的映射网络将不同模态数据映射成相同维度的向量,拼接后作为所述特征处理模块的输入;定量分析模块采用深度残差连接网络结构进行分类。
9.本发明还提供了一种多模态癌症识别装置装置在代谢指纹图谱和临床检测标志物的数据分析中的应用。
10.进一步地,上述应用的方法包括以下步骤:
11.步骤1、输入模块对多模态输入进行处理:采用不同的映射网络将不同模态数据映射成相同维度的向量,拼接后所述输入模块的输出;
12.步骤2、特征处理模块对步骤1得到的输入模块的输出进行处理:采用多层特征处
理网络进行非线性转换,得到所述特征处理模块的输出;
13.步骤3、定量分析模块采用深度残差连接网络结构进行分类:以步骤3得到的特征处理模块的输出为输入,采用定量分析网络计算癌症的概率。
14.进一步地,步骤1还包括:
15.映射网络由第一线性转换层、第一批次标准化(batch normalization)层、第一非线性激活函数层组成;其中第一线性转换层将不同维度数据转换到相同维度空间;第一batch normalization层对线性映射后的数据进行标准化,加速训练过程;第一非线性激活函数提供非线性转换能力;其中第一批次标准化层,是一种标准化技术,对数据输入进行归一化,同时加速人工神经网络训练。
16.进一步地,输入模块中的不同模态数据包括以下多模态数据组合:代谢指纹图谱+基本信息、或/和代谢指纹图谱+蛋白标志物、或/和代谢指纹图谱+基本信息+蛋白标志物。
17.进一步地,输入模块中不同模态数据包括以下多模态数据组合的一种或者多种:代谢指纹图谱和基本信息、代谢指纹图谱和蛋白标志物、代谢指纹图谱和基本信息和蛋白标志物。
18.进一步地,步骤2还包括:特征处理网络由第二线性转换层、第二batch normalization层、第二非线性激活函数层、正则化技术(dropout)层组成;其中第二线性转换层将不同维度数据转换到相同维度空间;第二batch normalization层对线性映射后的数据进行标准化,加速训练过程;第二非线性激活函数则是提供非线性转换能力;dropout层随机将神经结点输出置为零,缓解过拟合问题;其中正则化技术(dropout)层是一种正则化技术,指在神经网络中随机丢弃部分神经元,用于对抗过拟合。
19.进一步地,步骤3还包括:定量分析网络由第三线性转换层和归一化指数函数(softmax)激活层组成;其中第三线性转换层将特征处理模块的输出转换到癌症、健康对照的2维向量空间中,通过softmax激活层将癌症、健康对照预测值映射到0-1之间;其中归一化指数函数激活层,将每一个元素取值范围归一化到0和1之间,且所有元素的和为1。
20.进一步地,代谢指纹图谱包括质谱数据,通过分子质荷比和相应丰度检测待分析样本,生成对应的代谢指纹图谱。
21.进一步地,基本信息包括性别、或/和年龄、或/和葡萄糖、或/和氨基酸心肌肌钙蛋白i、或/和癌胚抗原。
22.在本发明的较佳实施方式中,详细说明一种基于代谢指纹图谱和临床检测标志物的多模态量化分析癌症识别装置的应用过程。
23.本发明有益的技术效果为:
24.提供了一种基于代谢指纹图谱和临床检测标志物的多模态癌症识别方法、装置、计算设备和应用,结合代谢以及代谢的正交信息准确识别早期癌症,快速判别癌症相关的代谢标志物,为癌症早筛、标志物筛选提供更好的解决方案。
25.以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
26.图1是本发明的一个较佳实施例的基于代谢指纹图谱和临床检测标志物的多模态
量化分析系统结构示意图。
具体实施方式
27.以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
28.本技术提供了一个基于代谢指纹图谱和临床检测标志物的多模态量化分析癌症识别装置系统,如图1所示,该系统包括:输入模块、特征处理模块、定量分析模块。
29.输入模块对多模态输入进行处理,具体做法如下:采用不同的映射网络将不同模态数据映射成相同维度的向量,拼接后作为特征处理模块的输入。映射网络由第一线性转换层、第一batch normalization层、第一非线性激活函数层组成。其中第一线性转换层将不同维度数据转换到相同维度空间;第一batch normalization层对线性映射后的数据进行标准化,加速训练过程;第一非线性激活函数则是提供非线性转换能力。输入模块中的多模态数据组合包括:代谢指纹图谱+基本信息、代谢指纹图谱+蛋白标志物、代谢指纹图谱+基本信息+蛋白标志物。
30.特征处理模块对输入模块的输出进行处理,具体做法如下:采用多层特征处理网络进行非线性转换,输出作为定量分析模块的输入。特征处理网络由第二线性转换层、第二batch normalization层、第二非线性激活函数层、dropout层组成。其中第二线性转换层将不同维度数据转换到相同维度空间;第二batch normalization层对线性映射后的数据进行标准化,加速训练过程;第二非线性激活函数则是提供非线性转换能力;dropout层随机将神经结点输出置为零,缓解过拟合问题。
31.定量分析模块采用深度残差连接网络结构进行分类:以特征处理模块的输出为输入,采用定量分析网络计算癌症的概率。定量分析网络由第三线性转换层和softmax激活层组成。其中第三线性转换层将特征处理模块的输出转换到癌症、健康对照的2维向量空间中,通过softmax将癌症、健康对照预测值映射到0-1之间。
32.以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1