一种基于深度学习的图像识别模型建立方法与流程

文档序号：36329126发布日期：2023-12-10 00:43阅读：40来源：国知局

本发明涉及计算机视觉领域，尤其涉及一种基于深度学习的图像识别模型建立方法。

背景技术：

1、随着计算机技术的快速发展，计算机视觉领域也取得了巨大的进步。图像分类是计算机视觉中的一个重要任务，它通过对图像进行分类，实现对图像中物体的识别。在图像分类领域，深度学习已经成为了一种非常有效的技术，已经得到了广泛的应用。

2、现有技术中，图像识别的实现主要依赖于深度学习算法。其中，最流行的深度学习算法是卷积神经网络(convolutional neural network,cnn)。cnn算法通过对图像的卷积、池化等操作，实现对图像的识别。

3、然而，现有cnn算法工具存在一些缺点。首先，cnn算法需要大量的训练数据和计算资源，否则识别效果会很差。其次，cnn算法的识别精度受到训练数据的限制，当训练数据不足或者数据质量不好时，识别精度会下降。最后，缺乏结合云计算的较优的整体实现方案。

4、现有cnn算法存在以下缺点:

5、1.需要大量的训练数据和计算资源

6、cnn算法需要大量的训练数据和计算资源，否则识别效果会很差。这也使得cnn算法的应用场景受到了很大的限制，无法在一些需要实时响应的场合使用。

7、2.识别精度受到训练数据的限制

8、cnn算法的识别精度受到训练数据的限制，当训练数据不足或者数据质量不好时，识别精度会下降。这也限制了cnn算法在某些复杂场景下的使用。

技术实现思路

1、鉴于上述问题，提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种基于深度学习的图像识别模型建立方法。

2、根据本发明的一个方面，提供了一种基于深度学习的图像识别模型建立方法，所述建立方法包括：

3、数据准备，收集并准备图像数据集；

4、构建cnn基本模型，定义cnn的基本结构，包括卷积层、池化层和激活函数；

5、构建残差块，定义残差块的结构；

6、构建resnet模型，使用多个残差块堆叠构建resnet模型；

7、添加全局平均池化层，在resnet的最后添加一个全局平均池化层，将特征图转换为向量；

8、添加全连接层，在全局平均池化层之后添加全连接层，用于对特征向量进行分类；

9、定义损失函数，选择交叉熵损失函数作为图像分类任务的损失函数；

10、优化器选择adam，用于更新模型参数以最小化损失函数；

11、训练模型，使用训练集对模型进行训练；

12、模型评估，使用测试集来评估模型的性能；

13、模型部署。

14、可选的，所述收集并准备图像数据集具体包括：训练集、验证集和测试集；

15、对图像进行预处理，进行调整大小、归一化和数据增强的处理。

16、可选的，所述构建cnn基本模型，定义cnn的基本结构具体包括：

17、cnn基本模型中有三种主要类型的层：卷积层、池化层、完全连接层；

18、所述卷积层是卷积网络的第一层；

19、层位于另一个卷积层或池化层之后；

20、完全连接层是网络中的最后一层；

21、随着层数的增加，模型的复杂性也会增加，模型识别更大的图像部分；

22、随着图像数据在cnn的层层推进，网络开始识别物体中更复杂的元素或形状；最后，标识预期的对象；

23、输入层主要负责接受输入图像；

24、采用了全卷积神经网络算法，将图像进行卷积操作，并将结果进行上采样，以得到合适的输入大小；

25、输出层负责将输入的图像进行识别，将cnn算法输出的结果映射到类别标签上；

26、采用了softmax函数作为输出层，将cnn算法输出的结果进行归一化处理，并计算各个类别的概率，最终输出最高概率的类别作为最终识别结果。

27、可选的，所述构建残差块，定义残差块的结构具体包括：

28、每个残差块包括多个卷积层；

29、使用跳跃连接将输入直接与输出相加。

30、可选的，所述构建resnet模型，使用多个残差块堆叠构建resnet模型具体包括：所述resnet模型包括多个层，根据任务复杂性和计算资源来调整合适的深度。

31、可选的，所述训练模型，使用训练集对模型进行训练具体包括：

32、不断调整模型参数以优化性能；

33、在训练过程中，使用验证集来监控模型的性能，并进行超参数调整。

34、可选的，所述模型评估，使用测试集来评估模型的性能具体包括：计算准确率、精确率、召回率的指标。

35、可选的，所述模型部署具体包括：将训练好的模型部署到应用中，进行图像识别任务。

36、本发明提供的一种基于深度学习的图像识别模型建立方法，所述建立方法包括：数据准备，收集并准备图像数据集；构建cnn基本模型，定义cnn的基本结构；构建残差块，定义残差块的结构；构建resnet模型，使用多个残差块堆叠构建resnet模型；添加全局平均池化层，在resnet的最后添加一个全局平均池化层，将特征图转换为向量；添加全连接层，在全局平均池化层之后添加全连接层，用于对特征向量进行分类；定义损失函数，选择交叉熵损失函数作为图像分类任务的损失函数；优化器选择adam，用于更新模型参数以最小化损失函数；训练模型，使用训练集对模型进行训练；模型评估，使用测试集来评估模型的性能；模型部署。采用了卷积神经网络cnn和残差连接resnet算法，解决了现有技术中cnn算法需要大量的训练数据和计算资源以及识别精度受到训练数据限制的问题。

37、上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

技术特征：

1.一种基于深度学习的图像识别模型建立方法，其特征在于，所述建立方法包括：

2.根据权利要求1所述的一种基于深度学习的图像识别模型建立方法，其特征在于，所述收集并准备图像数据集具体包括：训练集、验证集和测试集；

3.根据权利要求1所述的一种基于深度学习的图像识别模型建立方法，其特征在于，所述构建cnn基本模型，定义cnn的基本结构具体包括：

4.根据权利要求1所述的一种基于深度学习的图像识别模型建立方法，其特征在于，所述构建残差块，定义残差块的结构具体包括：

5.根据权利要求1所述的一种基于深度学习的图像识别模型建立方法，其特征在于，所述构建resnet模型，使用多个残差块堆叠构建resnet模型具体包括：所述resnet模型包括多个层，根据任务复杂性和计算资源来调整合适的深度。

6.根据权利要求1所述的一种基于深度学习的图像识别模型建立方法，其特征在于，所述训练模型，使用训练集对模型进行训练具体包括：

7.根据权利要求1所述的一种基于深度学习的图像识别模型建立方法，其特征在于，所述模型评估，使用测试集来评估模型的性能具体包括：计算准确率、精确率、召回率的指标。

8.根据权利要求1所述的一种基于深度学习的图像识别模型建立方法，其特征在于，所述模型部署具体包括：将训练好的模型部署到应用中，进行图像识别任务。

技术总结
本发明提供的一种基于深度学习的图像识别模型建立方法，所述建立方法包括：数据准备，收集并准备图像数据集；构建CNN基本模型，定义CNN的基本结构；构建残差块，定义残差块的结构；构建ResNet模型；添加全局平均池化层，在ResNet的最后添加一个全局平均池化层，将特征图转换为向量；添加全连接层，在全局平均池化层之后添加全连接层，用于对特征向量进行分类；定义损失函数，选择交叉熵损失函数作为图像分类任务的损失函数；优化器选择Adam，用于更新模型参数以最小化损失函数；训练模型；模型评估；模型部署。解决了现有技术中CNN算法需要大量的训练数据和计算资源以及识别精度受到训练数据限制的问题。

技术研发人员：徐平
受保护的技术使用者：北银金融科技有限责任公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐平
技术所有人：北银金融科技有限责任公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。