基于自编码器网络的肿瘤细胞切片高光谱图像分类方法

文档序号:34111892发布日期:2023-05-10 22:30阅读:118来源:国知局
基于自编码器网络的肿瘤细胞切片高光谱图像分类方法

本发明属于肿瘤细胞切片高光谱图像领域,涉及一种病变组织的病理切片高光谱图像分类方法,具体涉及一种基于高光谱成像、非线性区域探测、稀疏自编码器网络和卷积神经网络的高光谱病理图像分类方法。


背景技术:

1、癌症是全球发病率高且较难治愈的恶性肿瘤疾病。目前,检测癌症的主要方法仍是对病变组织切片进行显微镜扫查,并作出病理诊断。传统的病理诊断方法需要专家观察切片的组织结构、细胞形态和染色情况等,并结合临床情况和其他检查结果做出诊断。这一过程往往需要一定时间才能得到准确结果,并且易受诊断专家主观经验等因素的影响。现在随着人工智能技术的发展,机器学习等方法被广泛用于医学领域研究。在肿瘤病理智能诊断领域,一般的人工智能方法是拍摄肿瘤组织病理切片在显微镜下的二维光学图像,训练分类模型,实现肿瘤细胞图像的分类。

2、而随着医学成像技术的发展,高光谱成像技术融合了光谱分析和光学成像两种诊断技术。相比于二维病理图像,高光谱病理图像可以得到具有图像信息和光谱信息的三维高光谱图像数据,其中的光谱维信息能够反映切片细胞组织的特征。对此高光谱病理图像数据进行解混可以得到不同细胞组织端元的丰度分布,基于这些丰度分布训练卷积神经网络模型,可以实现肿瘤细胞切片的分类诊断。同时,高光谱图像的空间分辨率一般低于二维彩色图片(这主要是由于高光谱成像仪前置的滤光环节大大降低了通光量,因此成像传感器不宜采取较大的分辨率),但可以实现较高的光谱分辨率,有利于获得细胞组织的光谱特征。并且较低的空间分辨率可以获得更大的图像视野,缩短病理切片扫描的时间,进一步提高病理诊断的效率。

3、自编码器网络是一种典型的网络结构,其中的编码器能够对输入数据进行降维处理,以提取输入数据的内在特征,而解码器能够通过所提取的特征还原出原始数据,使还原出的数据和输入的原始数据尽可能相同。高光谱数据的内在特征就是每个像元中的端元组成及其所占的比例,即丰度。而高光谱解混的本质就是将端元和丰度不断组合,以得到最接近实际混合光谱的组合结果。因此,通过自编码器网络可以实现高光谱数据的解混和重构。

4、高光谱解混算法根据混合方式的不同可以分为线性模型和非线性模型。线性解混模型的物理意义明确,有计算复杂但精度低的特点。非线性解混模型需要考虑不同物质间的反射,模型较复杂,有计算复杂但精度高的特点。

5、粗糙集理论作为一种处理不精确、不确定、不完备知识的表示、分类、学习方法,已逐渐成为人工智能理论基础方向研究的重要分支,在机器学习、模式识别、医疗诊断等诸多领域有着丰富应用。粗糙集理论的核心思想是利用分类方法,将等价关系确定的等价类当作已知的知识集合,进而利用这些知识来表示任意的对象集。通过一对集值函数:上下接近算子,考虑已知知识包含于对象集还是至少与对象集相交不空,得到对象集在该已知知识框架下的近似范围。然而这种包含关系在现实应用中往往过于苛刻,基于此,ziarko提出了基于一定包含程度的变精度粗糙集模型。变精度粗糙集模型的核心思想是在经典粗糙集中给出一个阈值,即允许在一定阈值范围内的错误分类率存在,因而变精度粗糙集是经典粗糙集的推广。

6、目前基于神经网络的图像分类算法应用广泛,特别是在医学图像分类方法研究中,卷积神经网络实现了较高的分类准确率。相比于其他卷积神经网络,googlenet网络在模型的深度(层数)和宽度(层核或者神经元数)上进行了创新。在深度上,googlenet的网络层数达到了22层。在宽度上,网络增加了多种卷积核为1*1、3*3、5*5的卷积层和最大池化层,同时采用集成化的模块设计,在增加的卷积层前和最大池化层后分别加上了1*1的卷积核进行降维处理,以达到减少数据量,增加计算效率的目的。


技术实现思路

1、为了克服传统肿瘤细胞切片病理诊断过程繁琐费时和诊断结果易受人为经验影响的问题,本发明提供了一种基于自编码器网络的肿瘤细胞切片高光谱图像分类方法。该方法通过基于最小二乘拟合估计和高斯拟合估计的非线性探测将高光谱图像数据中各像元按线性和非线性混合程度进行划分,再基于变精度的粗糙集方法进行处理,然后将高光谱数据输入稀疏自编码器网络进行无监督的线性或非线性解混,这样既提高了解混精度,又降低了整体的计算量,保证了解混效率,并且使用高光谱图像解混结果作为神经网络训练数据,可以降低切片图像空间分辨率要求,提高切片扫描效率,又可以提高光谱分辨率,有利于细胞特征提取。

2、本发明的目的是通过以下技术方案实现的:

3、一种基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,包括如下步骤:

4、步骤一:通过显微镜和高光谱成像仪得到肿瘤细胞切片的高光谱图像;

5、步骤二:基于高光谱图像数据,分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计,通过滑动窗口设置和三次样条插值法,将混合像元按线性和非线性混合程度进行区域划分;

6、步骤三:基于变精度粗糙集方法处理高光谱图像解混数据,构建稀疏自编码器网络进行解混;

7、步骤四:基于优化的卷积神经网络,对解混得到的端元及丰度结果进行分类,实现肿瘤细胞切片高光谱图像分类。

8、相比于现有技术,本发明具有如下优点:

9、1)本发明采用高光谱成像仪拍摄肿瘤细胞切片图像,可以得到细胞切片在不同光谱波段下的图像信息,实现较高的光谱分辨率,从而可以降低图像在空间分辨率上的精度要求,提高切片扫描效率,进一步缩短分析诊断时间。

10、2)本发明采用基于高斯拟合估计和最小二乘拟合估计的非线性混合区域探测算法对高光谱数据进行拟合误差估计,同时设置滑动窗口,对混合像元按区域进行线性和非线性混合程度划分,既实现了高光谱数据的混合区域探测,又防止了探测算法过拟合的现象。

11、3)本发明基于非线性混合区域探测算法,对高光谱图像数据进行了预处理,结合了线性和非线性解混模型的优点,既可以提高解混精度,又可以提高解混效率。同时,自编码器网络在满足丰度约束时不需额外加入惩罚项,减少了损失函数的复杂性,提高了网络的收敛速度。

12、4)本发明在对非线性混合区域探测算法划分好区域的高光谱数据进行解混前,使用基于变精度的粗糙集方法对不确定混合区域的像元先进行近似处理,从而构建稀疏自编码器网络进行解混。

13、5)本发明将高光谱图像用于肿瘤细胞病理诊断,相比于传统的二维光学图像,高光谱数据带有生物组织光谱维信息,利用解混得到的端元及丰度结果训练卷积神经网络,分类精度较高。



技术特征:

1.一种基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述方法包括如下步骤:

2.根据权利要求1所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述步骤一的具体步骤如下:

3.根据权利要求1所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述步骤二的具体步骤如下:

4.根据权利要求3所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述步骤二二中,统计量t定义为:

5.根据权利要求4所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述最小二乘拟合估计误差定义为:

6.根据权利要求3所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述步骤二二中,利用三次样条插值法,计算滑动窗口区域对应的统计量的具体步骤如下:

7.根据权利要求3所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述步骤二三的具体步骤如下:

8.根据权利要求1所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述步骤三的具体步骤如下:

9.根据权利要求8所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述步骤三一中,变精度的粗糙集方法如下:

10.根据权利要求8所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,其特征在于所述步骤三二中,稀疏约束的表达式为:


技术总结
本发明公开了一种基于自编码器网络的肿瘤细胞切片高光谱图像分类方法,所述方法包括如下步骤:步骤一:通过显微镜和高光谱成像仪得到肿瘤细胞切片的高光谱图像;步骤二:基于高光谱图像数据,分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计,通过滑动窗口设置和三次样条插值法,将混合像元按线性和非线性混合程度进行区域划分;步骤三:基于变精度粗糙集方法处理高光谱图像解混数据,构建稀疏自编码器网络进行解混;步骤四:基于优化的卷积神经网络,对解混得到的端元及丰度结果进行分类,实现肿瘤细胞切片高光谱图像分类。本发明可以降低图像在空间分辨率上的精度要求,提高切片扫描效率,进一步缩短分析诊断时间。

技术研发人员:张淼,赵虹博,邹春柳,梁瑞东,王艳,沈毅
受保护的技术使用者:哈尔滨工业大学
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1