一种基于深度网络模型的图像聚类方法

文档序号:35528533发布日期:2023-09-21 04:53阅读:32来源:国知局
一种基于深度网络模型的图像聚类方法

本发明属于图像处理,尤其涉及一种基于深度网络模型的图像聚类方法 。


背景技术:

1、聚类是机器学习领域一种重要的无监督算法,是将给定的一批数据划分成两两不相干子集的过程。经过划分后的每个类中数据应该尽可能相似,不同类间差异性应尽可能大。通过划分数据集的过程寻找数据内在的分布结构与性质。经典的聚类算法有k-means和高斯混合模型等,计算效率较低,在高维数据上的性能较差。因此提出利用了降维技术,将原始数据映射到低维特征空间,可以有效提高聚类效率和效果。降维技术分为线性变换和非线性变换。线性变换如主成分分析和多维缩放,将数据从高维转至低维空间,然而线性模型难以深刻描述实际数据中蕴含的复杂分布结构。非线性映射主要有谱聚类、核方法和深度神经网络等。早期的深度聚类网络大多是利用自动编码器结构学习嵌入特征,再对嵌入特征进行聚类。近年来,自监督对比学习得到了广泛关注,它生成输入样本的增强版本,通过最小化两个增强数据点间距离,最大化与其他数据点的距离,学习到样本最具有代表性的特征表示。对比学习在很多领域,特别是计算机视觉方面得到了较大的成功,因此一些研究也尝试将对比学习用于聚类任务。例如cc,scan等。

2、利用自监督对比学习进行的聚类仍面临另一个明显的问题:遵循对比学习的基本框架,仅假设样本及其增幅在特征空间中应该是相似的,没有将潜在的类别信息纳入聚类,没有考虑到属于同一个类的不同图片之间的特征的相关性。对于聚类等无监督下游任务来讲,会比有监督的下游任务造成更严重的后果。因为拉远负对时拉远了实际上应该属于一个类的样本,可能会造成类间冲突,导致聚类效果不佳。


技术实现思路

1、本发明的目的在于提供一种基于深度网络模型的图像聚类方法 ,旨在解决上述背景技术中提出的问题。

2、为实现上述目的,本发明提供如下技术方案:

3、一种基于深度网络模型的图像聚类方法 ,包括以下步骤:

4、步骤a、将采集的待聚类数据作为数据集,进行数据预处理:进行灰度归一化预处理,将像素值统一到[0,1]区间,裁剪为统一大小的图片;

5、步骤b、把步骤a处理后的图像数据集分成三个部分,即训练集、验证集和测试集,增强步骤a处理后的图像,制作数据增强后的数据集视图,每个图像数据通过两种不同的增强方式生成两种增强视图,构建伪标签;

6、步骤c、构建深度网络模型;

7、步骤d、使用步骤b的训练集增强后视图对深度网络模型进行训练,生成训练模型;

8、步骤e、使用步骤b的测试集增强后视图对步骤d中生成的训练模型进行测试。

9、进一步的,所述步骤b中,增强方式包括进行水平翻转、旋转不同的角度、随机裁剪和缩放,每个图像数据随机选取两种增强方式生成两种增强视图。

10、进一步的,所述步骤c中,深度网络模型包括特征提取模块、类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块。

11、进一步的,所述类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块之间共享参数。

12、进一步的,所述步骤c的具体操作为:图像通过特征提取模块进行特征提取,将提取的特征送入类间差异性增强器头模块,类内紧密性增强器头模块提取特征,聚类头模块通过与类间差异性增强器头模块及类内紧密性增强器头模块共享参数的方式利用提取到的特征得到聚类分配。

13、进一步的,所述步骤c中:

14、在特征提取模块中,输入数据首先经过一个7x7的卷积层,卷积层的步长为2,填充为3,输出通道数为64;卷积层的输出进入一个批归一化层和relu层;relu层的输出进入池化层,池化方式为最大池化,池化窗口大小为2;然后经过4个重复的残差块,每个残差块包括首先是一个3x3的卷积层,步长为1,输出通道数为64;紧接着是一个批归一化层和relu激活函数;接下来是一个3x3的卷积层,步长为1,输出通道数为64;紧接着是一个批归一化层;经过两个卷积层之后将输入与第二个卷积层的输出相加,形成残差连接,并对残差连接的结果进行relu激活;最后一个残差块的输出进入池化层,池化方式为全局平均池化,最终得到局部特征;然后该局部特征输入到类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块中;

15、在类间差异性增强器头模块和类内紧密性增强器头模块中,输入特征的处理方式相同,具体为:输入特征首先经过一个线性层和一个relu层,relu层的输出再进入一个bn层和一个线性层;线性层的输出进入一个归一化层,得到局部特征;

16、在聚类头模块中,输入特征首先经过一个线性层和一个relu层,relu层的输出再进入一个线性层,线性层的输出进入一个归一化层,归一化层的输出进入全连接层,使用softmax激活函数生成聚类分配。

17、进一步的,所述步骤d的具体操作为:

18、d1、使用步骤b中得到的训练集增强视图,对深度网络模型进行训练,设置初始学习率0.4,学习率衰减系数为0.0001,batch_size为256;优化器为sgd优化器。

19、进一步的,所述步骤e的具体操作为:

20、使用步骤b的测试集增强后视图,对已经训练好的模型进行测试,预测聚类分配。

21、与现有技术相比,本发明的有益效果是:

22、该基于深度网络模型的图像聚类方法,通过设置由四个模块组成的深度网络模型,分别是特征提取模块、类间差异性增强器头模块、类内紧密性增强器头模块和聚类头模块。特征提取模块可以高效地通过卷积提取局部特征,类间差异性增强器头模块和类内紧密性增强器头模块进一步提取特征,聚类头模块得到聚类分配。深度网络模型将类内紧密性与类间差异性相互融合,得到更多尺度、更丰富的特征,在聚类头模块最终实现精准的聚类分配。该模型可以实现准确地进行层次相似性的提取,减少了因缺少相似性信息导致的类间冲突从而导致聚类性能不佳,提高聚类效率与聚类效果。



技术特征:

1.一种基于深度网络模型的图像聚类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤b中,增强方式包括进行水平翻转、旋转不同的角度、随机裁剪和缩放,每个图像数据随机选取两种增强方式生成两种增强视图。

3.根据权利要求1所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤c中,深度网络模型包括特征提取模块、类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块。

4.根据权利要求3所述的基于深度网络模型的图像聚类方法,其特征在于,所述类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块之间共享参数。

5.根据权利要求4所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤c的具体操作为:图像通过特征提取模块进行特征提取,将提取的特征送入类间差异性增强器头模块,类内紧密性增强器头模块提取特征,聚类头模块通过与类间差异性增强器头模块及类内紧密性增强器头模块共享参数的方式利用提取到的特征得到聚类分配。

6.根据权利要求3所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤c中:

7.根据权利要求1所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤d的具体操作为:

8.根据权利要求1所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤e的具体操作为:


技术总结
本发明适用于图像处理技术领域,提供了一种基于深度网络模型的图像聚类方法,包括以下步骤:对数据集进行灰度归一化预处理,将像素值统一,裁剪为统一大小;把处理后的图像数据集分成训练集、验证集和测试集,增强图像,制作数据集视图,将每个图像数据生成两种增强视图,为数据赋予伪标签;构建深度网络模型;训练深度网络模型,生成训练模型;对训练模型进行测试。本发明中深度网络模型将类内紧密性与类间差异性相互融合,得到更多尺度、更丰富的特征,在聚类头模块实现精准的聚类分配;可以准确地进行层次相似性的提取,减少了因缺少相似性信息导致的类间冲突从而导致聚类性能不佳,提高聚类效率与聚类效果。

技术研发人员:周柚,李沅书,王鏐璞,杜伟,肖钰彬,吴翾,赵鹏
受保护的技术使用者:吉林大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1