图像分类方法、装置、设备、介质和产品与流程

文档序号：36958280发布日期：2024-02-07 13:01阅读：17来源：国知局

本申请涉及人工智能，特别是涉及一种图像分类方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术：

1、vgg模型(visual geometry group，视觉几何组)为一种深度卷积神经网络模型，在现有的vgg模型中，使用最大池化层来提取特征中响应最大、最强烈的部分来输入到下一层。但是在网络较深的地方，特征尺寸比较小，包含的语义信息比较多，因此，在进入全连接层之前的最后一个最大池化层的特征提取能力和降维能力就比较弱，导致后面需要更多的全连接层来提升模型效果，从而使得模型中需要学习的参数数量增加，降低模型的工作效率。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够提高模型工作效率的图像分类方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面，本申请提供了一种图像分类方法，所述方法包括：

3、获取历史图像数据集和预构建的卷积神经网络，利用所述历史图像数据集对所述预构建的卷积神经网络进行训练，所述预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层；

4、获取目标图像数据，将所述目标图像数据输入训练后的卷积神经网络，得到所述目标图像数据相应的特征向量；

5、基于所述全连接层和所述特征向量，确定目标图像的目标图像类别。

6、在其中一个实施例中，所述卷积层的总层数比所述最大池化层的总层数多一层，每两层卷积层间存在一层最大池化层，所述全局平均池化层位于最后一层卷积层之后，所述全连接层位于所述全局平均池化层之后。

7、在其中一个实施例中，所述将所述目标图像数据输入训练后的卷积神经网络，得到所述目标图像数据相应的特征向量，包括：

8、获取目标图像数据经过多层卷积层的卷积操作处理后得到的多张特征图，每层卷积层对应一张特征图；

9、将所有特征图输入全局平均池化层，得到每张特征图中所有像素的像素平均值；

10、将所有像素平均值按照相应的卷积层在卷积神经网络中的顺序进行排列，得到所述特征向量。

11、在其中一个实施例中，所述基于所述全连接层和所述特征向量，确定目标图像的目标图像类别，包括：

12、获取所述全连接层中的权重矩阵，所述权重矩阵中的权重参数与所述特征向量中的元素一一对应；

13、计算每个元素与相应的权重参数间的乘积，基于所有乘积之和，确定线性变换结果；

14、利用非线性激活函数，对所述线性变换结果进行非线性处理，得到预测类别向量；

15、基于所述预测类别向量和归一化指数函数，确定所述目标图像类别。

16、在其中一个实施例中，所述基于所述预测类别向量和归一化指数函数，确定目标图像的目标图像类别，包括：

17、基于所述归一化指数函数对所述预测类别向量中的所有元素进行转化，预测类别向量中的元素和图像类别一一对应；

18、将每个元素的转化结果与所有元素的转化结果之和间的比值，确定为所述元素对应的目标概率；

19、将最大目标概率相应的图像类别确定为所述目标图像类别。

20、在其中一个实施例中，所述利用所述历史图像数据集对所述预构建的卷积神经网络进行训练之后，还包括：

21、判断当前训练轮数是否达到预设训练轮数，若达到，则停止所述预构建的卷积神经网络的训练过程。

22、第二方面，本申请还提供了一种图像分类装置，所述装置包括：

23、第一获取模块，用于获取历史图像数据集和预构建的卷积神经网络，利用所述历史图像数据集对所述预构建的卷积神经网络进行训练，所述预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层；

24、第二获取模块，用于获取目标图像数据，将所述目标图像数据输入训练后的卷积神经网络，得到所述目标图像数据相应的特征向量；

25、确定模块，用于基于所述全连接层和所述特征向量，确定目标图像的目标图像类别。

26、第三方面，本申请还提供了一种计算机设备。计算机设备包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述的任意一个实施例中的方法的步骤。

27、第四方面，本申请还提供了一种计算机可读存储介质。计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。

28、第五方面，本申请还提供了一种计算机程序产品。计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。

29、上述图像分类方法、装置、计算机设备、存储介质和计算机程序产品，获取历史图像数据集和预构建的卷积神经网络，利用历史图像数据集对预构建的卷积神经网络进行训练，预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层；获取目标图像数据，将目标图像数据输入训练后的卷积神经网络，得到目标图像数据相应的特征向量；基于全连接层和特征向量，确定目标图像的目标图像类别。本申请提供的方法，由于在模型中设置一层全局平均池化层，因此只需要设置一层全连接层即可完成对目标图像的图像分类，能够大幅度减少模型中需要学习的参数，从而提升模型的工作效率。

技术特征：

1.一种图像分类方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述卷积层的总层数比所述最大池化层的总层数多一层，每两层卷积层间存在一层最大池化层，所述全局平均池化层位于最后一层卷积层之后，所述全连接层位于所述全局平均池化层之后。

3.根据权利要求1所述的方法，其特征在于，所述将所述目标图像数据输入训练后的卷积神经网络，得到所述目标图像数据相应的特征向量，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述全连接层和所述特征向量，确定目标图像的目标图像类别，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述预测类别向量和归一化指数函数，确定目标图像的目标图像类别，包括：

6.根据权利要求1所述的方法，其特征在于，所述利用所述历史图像数据集对所述预构建的卷积神经网络进行训练之后，还包括：

7.一种图像分类装置，其特征在于，所述装置包括：

8.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

技术总结
本申请涉及一种图像分类方法、装置、计算机设备、存储介质和计算机程序产品，可用于人工智能技术领域。所述方法包括：获取历史图像数据集和预构建的卷积神经网络，利用历史图像数据集对预构建的卷积神经网络进行训练，预构建的卷积神经网络包括多层卷积层、多层最大池化层、一层全局平均池化层以及一层全连接层；获取目标图像数据，将目标图像数据输入训练后的卷积神经网络，得到目标图像数据相应的特征向量；基于全连接层和特征向量，确定目标图像的目标图像类别。本申请提供的方法，能够大幅度减少模型中需要学习的参数，从而提升模型的工作效率。

技术研发人员：刘景怡
受保护的技术使用者：中国银行股份有限公司
技术研发日：
技术公布日：2024/2/6

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘景怡
技术所有人：中国银行股份有限公司
我是此专利的发明人

上一篇：固体发动机的细观图像获取方法及相关装置
上一篇：一种圆织机用筒布卷收的辅助设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。