基于YOLOv3的图像标识识别方法、装置及设备

文档序号：36811486发布日期：2024-01-26 16:13阅读：16来源：国知局

本申请涉及图像识别，特别是涉及一种基于yolov3的图像标识识别方法、装置及设备。

背景技术：

1、标识图像识别在许多领域都有广泛应用，包括自动驾驶、物体识别、医学图像分析等，识别图像上的标识可以帮助自动化处理。标识图像识别方法旨在通过计算机视觉和图像处理技术来识别和理解图像中的标识、符号、或特定图案，模板匹配是一种基本的识别方法，它涉及将一个已知的图像模板与待识别图像进行比较。当模板与图像的某个区域高度匹配时，就可以识别出标识，这种方法适用于简单的标识，无法有效识别复杂标识图像中的标识。使用机器学习技术，可以训练模型来自动提取图像中的特征并进行标识识别，这在复杂的标识图像中非常有效。

2、然而，传统方法无法有效识别图像中的密集标识，在进行目标定位时存在误差，导致标识的位置不够准确，并且在小尺寸且标识密集的图像中，标识有可能被其他物体遮挡，在这种情况下，传统方法无法正确检测和识别标识，从而无法实现标识信息的自动化处理。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种基于yolov3的图像标识识别方法、装置及设备。

2、一种基于yolov3的图像标识识别方法，所述方法包括：

3、获取若干经预处理的标识图像样本；所述标识图像样本通过标签对样本上的标识进行标记；

4、构建标识识别模型；所述标识识别模型采用yolov3模型作为基础框架；所述标识识别模型包括依次连接的特征提取单元、特征金字塔以及空间特征融合单元；所述特征提取单元中的每一特征提取模块包括空间注意力层和残差块，用于对输入的特征图进行空间特征提取，输出空间特征图；所述特征金字塔用于对输入的每一空间特征图进行增强处理，得到增强特征图；所述空间特征融合单元用于对每一增强特征图进行空间特征融合，得到对应的融合特征图；所述融合特征图输入所述标识识别模型的检测头以输出对应的标识识别结果；

5、根据标识图像样本的标签和将标识图像样本输入到所述标识识别模型得到的预测结果对标识识别模型进行训练，得到训练好的标识识别模型；

6、将待检测标识图像输入所述训练好的标识识别模型，得到待检测标识图像的标识识别结果，根据所述标识识别结果进行标识图像信息录入。

7、在其中一个实施例中，还包括：对每一标识图像样本上标识区域对应的边界框进行聚类，得到先验框；根据所述先验框指导所述标识识别模型的训练。

8、在其中一个实施例中，还包括：所述标识识别模型包括残差网络；所述残差网络包括依次连接的上层残差块、中上层残差块和所述特征提取单元；所述特征提取单元包括依次连接的中间层特征提取模块、中下层特征提取模块和底层特征提取模块。

9、在其中一个实施例中，还包括：对所述底层特征提取模块输出的底层空间特征图进行多次卷积处理，输出底层增强特征图；对所述底层增强特征图进行卷积和上采样处理后与所述中下层特征提取模块输出的中下层空间特征图进行拼接，输出中下层增强特征图；对所述中下层增强特征图进行卷积和上采样处理后与所述中间层特征提取模块输出的中间层空间特征图进行拼接，输出中间层增强特征图。

10、在其中一个实施例中，还包括：根据目标层增强特征图的尺寸调整其他两层对应的增强特征图尺寸，根据每层增强特征图的权重对尺寸一致的增强特征图进行融合，得到目标层对应的融合特征图。

11、在其中一个实施例中，还包括：所述标识识别模型的损失函数为giou。

12、一种基于yolov3的图像标识识别装置，所述装置包括：

13、样本获取模块，用于获取标识图像样本；所述标识图像样本通过标签进行标记；

14、模型构建模块，用于构建标识识别模型；所述标识识别模型采用yolov3模型作为基础框架；所述标识识别模型包括依次连接的特征提取单元、特征金字塔以及空间特征融合单元；所述特征提取单元中的每一特征提取模块包括空间注意力层和残差块，用于对输入的特征图进行空间特征提取，输出空间特征图；所述特征金字塔用于对输入的每一空间特征图进行增强处理，得到增强特征图；所述空间特征融合单元用于对每一增强特征图进行空间特征融合，得到对应的融合特征图；所述融合特征图输入所述标识识别模型的检测头以输出对应的标识识别结果；

15、模型训练模块，用于根据标识图像样本的标签和将标识图像样本输入到所述标识识别模型得到的预测结果对标识识别模型进行训练，得到训练好的标识识别模型；

16、标识识别模块，用于将待检测标识图像输入所述训练好的标识识别模型，得到待检测标识图像的标识识别结果。

17、一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

18、获取标识图像样本；所述标识图像样本通过标签进行标记；

19、构建标识识别模型；所述标识识别模型采用yolov3模型作为基础框架；所述标识识别模型包括依次连接的特征提取单元、特征金字塔以及空间特征融合单元；所述特征提取单元中的每一特征提取模块包括空间注意力层和残差块，用于对输入的特征图进行空间特征提取，输出空间特征图；所述特征金字塔用于对输入的每一空间特征图进行增强处理，得到增强特征图；所述空间特征融合单元用于对每一增强特征图进行空间特征融合，得到对应的融合特征图；所述融合特征图输入所述标识识别模型的检测头以输出对应的标识识别结果；

20、根据标识图像样本的标签和将标识图像样本输入到所述标识识别模型得到的预测结果对标识识别模型进行训练，得到训练好的标识识别模型；

21、将待检测标识图像输入所述训练好的标识识别模型，得到待检测标识图像的标识识别结果。

22、上述基于yolov3的图像标识识别方法、装置及设备，通过获取标识图像样本，对标识图像样本进行标签标识，从而对标识识别模型进行训练，标识识别模型采用yolov3模型作为基础框架，标识识别模型包括依次连接的特征提取单元、特征金字塔以及空间特征融合单元，特征提取单元中的每一特征提取模块包括空间注意力层和残差块，用于对输入的特征图进行空间特征提取，输出空间特征图，通过特征提取单元探测标识区域的关键特征，从而减少目标定位时存在的误差，准确识别标识位置，特征金字塔用于对输入的每一空间特征图进行增强处理，得到增强特征图，空间特征融合单元用于对每一增强特征图进行空间特征融合，得到对应的融合特征图，通过空间特征融合单元对多个增强特征图进行适应性空间特征融合，能够过滤无用信息、保留有用信息，从而提高预测标识信息的准确性，融合特征图输入标识识别模型的检测头以输出对应的标识识别结果，利用训练好标识识别模型对待检测标识图像进行标识识别。本发明实施例，能够实现高效识别标识图像上的标识信息。

技术特征：

1.一种基于yolov3的图像标识识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述标识识别模型包括残差网络；所述残差网络包括依次连接的上层残差块、中上层残差块和所述特征提取单元；所述特征提取单元包括依次连接的中间层特征提取模块、中下层特征提取模块和底层特征提取模块。

3.根据权利要求1或2所述的方法，其特征在于，所述对输入的每一空间特征图进行增强处理，得到增强特征图包括：

4.根据权利要求3所述的方法，其特征在于，所述对每一增强特征图进行空间特征融合，得到对应的融合特征图包括：

5.根据权利要求4所述的方法，其特征在于，所述标识识别模型的损失函数为giou。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

7.一种基于yolov3的图像标识识别装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述模型构建模块还用于标识识别模型包括残差网络；所述残差网络包括依次连接的上层残差块、中上层残差块和所述特征提取单元；所述特征提取单元包括依次连接的中间层特征提取模块、中下层特征提取模块和底层特征提取模块。

9.根据权利要求7所述的装置，其特征在于，所述模型构建模块还用于对所述底层特征提取模块输出的底层空间特征图进行多次卷积处理，输出底层增强特征图；对所述底层增强特征图进行卷积和上采样处理后与所述中下层特征提取模块输出的中下层空间特征图进行拼接，输出中下层增强特征图；对所述中下层增强特征图进行卷积和上采样处理后与所述中间层特征提取模块输出的中间层空间特征图进行拼接，输出中间层增强特征图。

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

技术总结
本申请涉及一种基于YOLOv3的图像标识识别方法、装置及设备。所述方法包括：构建标识识别模型，标识识别模型包括依次连接的特征提取单元、特征金字塔以及空间特征融合单元，特征提取单元中的每一特征提取模块包括空间注意力层和残差块，用于对输入的特征图进行空间特征提取，输出空间特征图，特征金字塔用于对输入的每一空间特征图进行增强处理，得到增强特征图，空间特征融合单元用于对每一增强特征图进行空间特征融合，得到对应的融合特征图，融合特征图输入标识识别模型的检测头以输出对应的标识识别结果，利用训练好的标识识别模型对待检测标识图像进行标识识别。采用本方法能够对标识图像信息进行准确识别。

技术研发人员：王君至,沈大勇,姚锋,张忠山,王涛,程力,王沛,闫俊刚,潘雨,杜永浩,陈英武,吕济民,陈宇宁,陈盈果,刘晓路
受保护的技术使用者：中国人民解放军国防科技大学
技术研发日：
技术公布日：2024/1/25

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王君至,沈大勇,姚锋,张忠山,王涛,程力,王沛,闫俊刚,潘雨,杜永浩,陈英武,吕济民,陈宇宁,陈盈果,刘晓路
技术所有人：中国人民解放军国防科技大学
我是此专利的发明人

上一篇：放大器信号的处理方法及装置、电子设备及存储介质与流程
上一篇：一种矿体块段三维建模方法及系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。