基于先验引导特征增强的小样本结直肠癌分析方法及系统

文档序号:36831044发布日期:2024-01-26 16:45阅读:25来源:国知局
基于先验引导特征增强的小样本结直肠癌分析方法及系统

本发明属于医学图像的分类领域,具体涉及基于先验引导特征增强的小样本结直肠癌分析方法及系统。


背景技术:

1、从近十几年的研究中得出,深度神经网络在医学图像分类领域表现出灵活性和鲁棒性上的优势。与传统手工标注方法不同,深度神经模型能学习自动提取图像特征并迭代更新网络的偏差和权重以达到最佳状态,从而实现图像处理任务所需的精度。其中,结直肠癌的分期诊断是一项重要分类任务,正确的术前分期对指导临床辅助治疗具有显著的参考意义。

2、然而,从临床中生成大量带注释的样本进行模型的训练是较为艰巨的。一方面,医学图像标注的成本昂贵,需要相关领域的专门设备和专业知识;另一方面,由于上述模型通常要求训练集和测试集具有相似的特征分布,对于不同医疗部门数据分布有偏差的情况下,预先训练的神经模型在不进行微调下会造成许多困难。

3、由此,基于深度学习模型的小样本学习成为医学图像分类研究领域的前景,其中,生成对抗网络(gan)来增加数据集大小,迁移学习和模仿人类学习行为的元学习等成为了较为突出的小样本学习方法,能够弥合小型数据集和医疗分析任务所需的高精度之间的差距。本发明着重在于结合转导学习范式,以解决小样本医学图像分类中的局限性。


技术实现思路

1、为解决一般深度学习方法优化依赖于大量标记数据的问题,本发明提出了基于先验引导特征增强的小样本结直肠癌分析方法及系统,采用双编码器结构来利用公开的图像数据集和目标结直肠癌医学图像数据集中的特定模式,从而提取增强的特征表示以提高性能,并减轻手动标注的成本。为了实现上述目的,本发明的技术方案为:

2、基于先验引导特征增强的小样本结直肠癌分析方法,包括步骤如下:

3、步骤1、采用双编码器,在支持集和查询集上训练特征提取器,进行特征提取,得到一般特征和特定特征;进行特征连接,使用先验引导vae模块,将合并后的特征向量进行特征增强;所述vae模块为自动编码器模块;所述支持集为公共数据集,所述查询集为目标结直肠癌图像集;

4、步骤2、构建幂变换模块优化大小,将不规则分布转化为类高斯分布和归一化;

5、步骤3、应用最大后验概率,使用最优运输求解各类聚类中心的最佳预测,并根据估计的中心对查询样本进行分类。

6、作为优选,所述步骤1中特征提取和特征增强的具体步骤为:

7、分为基于cnn的特征提取和连接的fec模块,以及先验引导vae模块;双编码器共享相同的模型结构,但权重不同,在编码器1上训练mini-imagenet公共数据集,后固定权重作为一般特征提取器,并使用相同参数初始化编码器2,在base医学图像数据集上进行训练,以提取novel数据中的特定特征;

8、为小样本数据集,则eg(zg|x)和es(zs|x)分别对应一般特征提取器和特定特征提取器,而提取的特征为zg和zs,并一定规整后进行连接,通过全连接层得到特征1,输入vae模块中,编码器将特征1投影为两个低维embedding,再通过解码器将特征1重构为特征2;

9、先验分支使用大小都为1的伪输入通过全连接层映射输出为先验信息,收敛到小样本结直肠癌图像数据的最优类中心,以pt(z(i))来表示第i类的后验分布,pλ(z((i)))表示先验分布;

10、其中训练过程的损失函数由四个部分组成:特征分类损失lloss是分类器p(y|zs)上的掩码交叉熵损失来优化es(zs|x);特征排斥损失lrepul:为避免一般特征zg和特定特征zs中包含冗余信息;采用mse损失的特征重建损失lrecon来约束重建特征f2和输入特征f1:以及特征分布损失ldistri将两组特征嵌入(后验和先验)约束到预期分布,通过减少两种模态之间的冗余信息并将特征矢量与其在潜在空间中的先验对齐,vae模块实现了对于双编码器中提取的特征向量的增强。

11、作为优选,所述步骤2中的幂变换的具体步骤为:

12、步骤2.1、将经过fec和vae之后支持集和查询集的特征向量,由不规则分布转为类高斯分布f;

13、步骤2.2、进行qr分解;

14、步骤2.3、进行归一化。

15、作为优选,所述步骤3中的最大后验概率的过程为:

16、步骤3.1、使用sinkhorn算法处理最佳运输问题,最小化元素和对应中心的距离,以达成对于未知实例的高精度分类;

17、步骤3.2、初始化,计算支持特征的相互特征中心cj;

18、步骤3.3、循环计算输入特征向量和相互特征中心的emd距离li,j,应用sinkhorn映射来计算实例属于某个类的概率:

19、

20、步骤3.4、重新计算下一个相互类中心:uj=g(m*,j);

21、步骤3.5、使用缓冲因子进行更新,直到完成nsteps轮循环,根据m*矩阵得到结直肠癌期数的概率分数和期预测,以acc指标为基准。

22、基于先验引导特征增强的小样本结直肠癌分析系统,用于实现如上所述的结直肠癌分析方法,包括:

23、第一模块,被设置为采用双编码器,在公共数据集和目标结直肠癌图像集上训练特征提取器,进行特征提取,得到一般特征和特定特征;进行特征连接,使用先验引导vae模块,将合并后的特征向量进行特征增强;所述vae模块为自动编码器模块;

24、第二模块,被设置为构建幂变换模块优化大小,将不规则分布转化为类高斯分布和归一化;

25、第三模块,被设置为应用最大后验概率,使用最优运输求解各类聚类中心的最佳预测,并根据估计的中心对查询样本进行分类。

26、本发明的有益效果为:

27、1、本发明通过步骤1新的编码器架构,使用公开图像数据集和目标小样本结直肠癌图像数据集中的特定模式,从而提取增强的特征表示以在小样本医学图像分类任务上提高性能;

28、2、本发明步骤2具有先验分支和自定义损失函数的vae模型,以有效合并和增强从双编码器块中提取的特征矢量,通过减少两种模态之间的冗余信息并将特征矢量与其在潜在空间中的先验对齐来实现;

29、3、本发明应用k均值聚类和三元组损失将vae模块中计算的先验初始化为预期分布,从而达成聚拢相同类别的样本。



技术特征:

1.基于先验引导特征增强的小样本结直肠癌分析方法,其特征在于,包括步骤如下:

2.根据权利要求1所述的基于先验引导特征增强的小样本结直肠癌分析方法,其特征在于,所述步骤1中特征提取和特征增强的具体步骤为:

3.根据权利要求1所述的基于先验引导特征增强的小样本结直肠癌分析方法,其特征在于,所述步骤2中的幂变换的具体步骤为:

4.根据权利要求1所述的基于先验引导特征增强的小样本结直肠癌分析方法,其特征在于,所述步骤3中的最大后验概率的过程为:

5.基于先验引导特征增强的小样本结直肠癌分析系统,用于实现如权利要求1至4中任意一项所述的结直肠癌分析方法,其特征在于,包括:


技术总结
本发明属于医学图像的分类领域,具体涉及基于先验引导特征增强的小样本结直肠癌分析方法及系统。在高质量医学数据集缺乏的情况下,利用少量样本的方式构建结直肠癌分期算法。本发明采用双编码器结构,分别在公共图像上和目标医学数据上训练,从结直肠癌医学图像中提取一般特征和特定特征。引入先验引导变分自动编码器(VAE)模块,将特征矢量与其在潜在空间中的先验对齐,增强了目标特征的稳健性。对支持和查询集中样本提取的目标特征进行基于最大后验概率(MAP)算法进行匹配,并预测查询样本的所属癌症期数。本发明能够显著提高小样本结直肠癌医学图像分期的准确性,一定程度上解决了小样本医学分类算法的局限性,并减轻了人工标注的代价。

技术研发人员:高阳,鲍军,杨柳,吴志平,何克磊,司呈帅,邵鹏,曹月鹏,徐盈飞
受保护的技术使用者:南京大学
技术研发日:
技术公布日:2024/1/25
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1