一种基于深度卷积神经网络的目标物识别方法、装置及车辆与流程

文档序号：36995993发布日期：2024-02-09 12:37阅读：30来源：国知局

本发明涉及辅助驾驶，尤其是涉及一种基于深度卷积神经网络的目标物识别方法、装置及车辆。

背景技术：

1、随着汽车智能化的不断发展，以及市场需求的逐渐提升，辅助（自动）驾驶逐渐成为了国内外汽车领域研究的热点。车辆前方目标物检测是辅助（自动）驾驶系统中的一个重要环节，在真实的交通场景下，目标检测受到很多因素，例如:光照、遮挡等的影响。而为了对复杂交通场景下的车辆前方目标进行有效识别和定位，如今已不再是简单采用激光雷达、毫米波雷达及多传感器融合等几种方案可以达到，而是通过结合摄像以及利用卷积神经网络对视觉传感器信息进行图像提取、分类等工作，较好地提高了车辆前方目标的识别率。

2、相关技术中，基于卷积神经网络的目标识别方法中，通过收集大量图像（如车辆图像、行人图像及其他类别的交通相关图像），并对各图像进行标签分类以及训练，得到原始的卷积神经网络训练集，当车辆再次采集到前方目标物图像时，通过对采集的图像进行灰度化、以及多次特征图提取并对特征图进行降维再提取，最后再将处理后得到的信息进行分类并与预设的卷积神经网络训练集进行比对拟合以识别目标物，同时，在识别过程还包括对卷积神经网络训练集进行优化，但是，该现有技术方法在对采集的图像进行识别过程，由于每次采集的图像信息除了进行识别还需要进行判断是否为更优目标物信息，对于预设的训练集样本还需要进行权值更新，因此，在识别过程识别速度慢，为了保证识别的准确率，其每次检测的视野范围也相对较小。

技术实现思路

1、本技术旨在解决现有技术车辆基于卷积神经网络的目标识别方法中，对车道前方目标物的识别处理过程，识别速度慢以及每次检测的视野范围相对较小问题，基于此，本技术提出了一种基于深度卷积神经网络的目标物识别方法、装置及车辆。

2、第一方面，本技术实施例提供一种基于深度卷积神经网络的目标物识别方法，包括：

3、获取目标物数据参数，根据所述目标物数据参数搭建目标物数据模型，其中，所述目标物数据模型包括车辆数据模型、行人数据模型以及路牌数据模型；

4、持续性采集目标车辆前方图像信息，对所述图像信息进行预处理得到待识别图像信息，其中，所述预处理包括对图像分辨率及rgb颜色进行定义；

5、根据所述待识别图像信息，调取预设的换算系数对所述待识别图像信息进行单元格划分得到输出单元格，所述输出单元格包括多个待识别数据模型；

6、基于所述目标物数据模型，对多个所述待识别数据模型降序排列进行非最大值抑制以及交并比筛选删除处理，得到最终目标物种类，完成目标物识别。

7、根据本技术的一些实施例，所述获取目标物数据集，根据所述目标物数据集搭建目标物数据模型步骤中，包括：

8、确定待识别目标物种类，根据目标物种类获取每一目标物对应的历史图像信息；

9、根据所述历史图像信息对图像中目标物进行边界框标定，根据标定的边界框位置及类别，得到目标物数据参数；

10、根据所述目标物数据参数构建目标物数据集，其中所述目标物数据集定义为，式中，表示候选框内对象置信度，表示待检测目标在预设坐标系中的位置，表示待检测目标的高度及宽度，表示待检测目标的种类；

11、基于所述目标物数据集，搭建目标物数据模型，其中，搭建目标物数据模型过程包括特征提取部分、特征融合部分和预测部分，并对其特征提取部分和特征融合部分进行优化。

12、根据本技术的一些实施例，所述持续性采集目标车辆前方图像信息，对所述图像信息进行预处理得到待识别图像信息，其中，所述预处理包括对图像分辨率及rgb颜色进行定义步骤中，包括：

13、根据采集的前方图像信息，对所述图像信息中的图像进行切片得到分辨率为608*608的输入图像，定义输入图像使用rgb颜色的通道数量，基于预处理后的图像分辨率及rgb颜色得到待识别图像信息。

14、根据本技术的一些实施例，所述根据所述待识别图像信息，调取预设的换算系数对所述待识别图像信息进行单元格划分得到输出单元格，所述输出单元格包括多个待识别数据模型步骤中，包括：

15、根据所述待识别图像信息，调取预设的深度卷积神经网络对所述待识别图像信息进行卷积处理，其中，卷积处理包括：调取预设的换算系数，对所述待识别图像信息的原始卷积层经过换算系数的运算并得到输出单元格。

16、根据本技术的一些实施例，所述根据所述待识别图像信息，对调取预设的深度卷积神经网络对所述待识别图像信息进行卷积处理，其中，卷积处理包括：调取预设的换算系数，对所述待识别图像信息的原始卷积层经过换算系数的运算并得到输出单元格步骤中，包括：

17、根据得到的输出单元格，每一输出单元格包括多个待识别数据模型，所述待识别数据模型包括预设的锚框信息，每一锚框信息包括含归一化后的目标坐标x、y、归一化后的候选框的宽w和高h以及网格检测此类别目标的置信度；

18、根据本技术的一些实施例，所述基于所述目标物数据模型，对多个所述待识别数据模型降序排列进行预筛选以及非最大值抑制交并比处理，得到最终目标物种类，完成目标物识别的步骤中，包括：

19、根据所述目标物数据模型，对每一所述待识别数据模型计算提取置信度，根据所述置信度大小对所述待识别数据模型进行降序排列；

20、利用非最大值抑制从降序排列的所述待识别数据模型中选择置信度最高的锚框，得到目标输出锚框；

21、根据所述目标输出锚框的坐标参数信息以及预设候选框的宽度和高度参数，对剩余的待识别数据模型进行迭代删除处理，得到最终的目标物种类。

22、根据本技术的一些实施例，所述根据所述目标输出锚框的坐标参数以及预设候选框的宽度和高度参数信息，对剩余待识别数据模型进行迭代删除处理，得到最终的目标物种类的步骤中，包括：

23、根据所述目标输出锚框坐标参数以及预设候选框的宽度和高度参数信息，得到所述目标输出锚框的面积s1；

24、根据剩余的待识别数据模型对应的锚框坐标参数以及预设候选框的宽度和高度参数信息，得到剩余待识别数据模型对应的锚框面积s2；

25、根据目标输出锚框的面积s1以及剩余待识别数据模型对应的锚框面积s2，计算目标输出锚框与剩余待识别数据模型对应的锚框交并比，其中，交并比计算公式为:，式中，iou表示交并比，s1表示目标输出锚框的面积，s2表示剩余待识别数据模型对应的锚框面积。

26、根据本技术的一些实施例，所述根据所述目标输出锚框的坐标参数以及预设候选框的宽度和高度参数信息，对剩余待识别数据模型进行迭代删除处理，得到最终的目标物种类的步骤中，还包括：

27、调取预设的交并比阈值，根据计算目标输出锚框与剩余待识别数据模型对应的锚框交并比iou，判断所述锚框交并比iou是否大于所述交并比阈值；

28、若所述锚框交并比iou大于所述交并比阈值，则对该剩余待识别数据模型进行删除；

29、若所述锚框交并比iou小于所述交并比阈值，则对该剩余待识别数据模型进行重复迭代计算，直至得到最后一个待识别数据模型对应最终输出锚框；

30、根据所述最终输出锚框以及搭建目标物数据模型，得到最终的目标物种类。

31、第二方面，本技术实施例提供一种基于深度卷积神经网络的目标物识别装置，所述装置包括：

32、模型搭建模块，被配置为根据目标物种类获取每一目标物对应的历史图像信息；根据所述历史图像信息对图像中目标物进行边界框标定，根据标定的边界框位置及类别，得到目标物数据参数；根据所述目标物数据参数构建目标物数据集，基于所述目标物数据集，搭建目标物数据模型；

33、获取模块，被配置为根据目标车辆设置的单目摄像头持续性采集目标车辆前方图像信息；

34、图像预处理模块，被配置为根据所述获取模块采集的图像信息，对所述图像信息中的图像进行切片得到分辨率为608*608的输入图像，定义输入图像使用rgb颜色的通道数量，基于预处理后的图像分辨率及rgb颜色得到待识别图像信息；

35、卷积处理模块，被配置为根据所述图像预处理模块得到的待识别图像信息，调取预设的深度卷积神经网络对所述待识别图像信息进行卷积处理，其中，卷积处理包括：调取预设的换算系数，对所述待识别图像信息的原始卷积层经过换算系数的运算并得到输出单元格，每一输出单元格包括多个待识别数据模型，所述待识别数据模型包括预设的锚框信息，每一锚框信息包括含归一化后的目标坐标x、y、归一化后的候选框的宽w和高h以及网格检测此类别目标的置信度；

36、第一数据处理模块，被配置为根据所述卷积处理模块得到的待识别数据模型，对每一所述待识别数据模型计算提取置信度，根据所述置信度大小对所述待识别数据模型进行降序排列；利用非最大值抑制从降序排列的所述待识别数据模型中选择置信度最高的锚框，得到目标输出锚框；

37、第二数据处理模块，被配置为根据所述卷积处理模块得到的待识别数据模型以及第一数据处理模块得到目标输出锚框，得到目标输出锚框的面积s1以及剩余待识别数据模型对应的锚框面积s2，计算目标输出锚框与剩余待识别数据模型对应的锚框交并比，其中，交并比计算公式为:，式中，iou表示交并比，s1表示目标输出锚框的面积，s2表示剩余待识别数据模型对应的锚框面积；

38、判断模块，被配置为根据所述第二数据处理模块得到的交并比iou，调取预设的交并比阈值，根据交并比iou与调取预设的交并比阈值，判断所述锚框交并比iou是否大于所述交并比阈值；

39、确定模块，被配置为根据所述判断模块的判断结果，对剩余待识别数据模型进行重复迭代计算，直至得到最后一个待识别数据模型对应最终输出锚框；根据最终输出锚框以及搭建目标物数据模型，确定最终的目标物种类。

40、第三方面，本技术实施例提供一种车辆，包括：

41、处理器；

42、用于存储所述处理器可执行指令的存储器；

43、其中，所述处理器被配置为：

44、实现如上述第一方面实施例任一项所述的一种基于深度卷积神经网络的目标物识别方法的步骤。

45、第四方面，本技术实施例提供还提供一种可读存储介质，所述可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面任一实施例所述的基于深度卷积神经网络的目标物识别方法的步骤。

46、与现有技术相比，本技术实施例提供的技术方案至少包括以下有益效果：

47、建立基于单目摄像头和深度卷积神经网络的汽车目标识别检测模型，持续性采集目标车辆前方图像信息，对图像信息进行图像分辨率及rgb颜色进行定义预处理得到待识别图像信息，预处理便于对图像进行统一网格化，以及对图像进行特征提取部分、特征融合部分，以便提高目标物识别效率，根据待识别图像信息，调取预设的换算系数对单元格划分进行单元格划分得到输出单元格，输出单元格包括多个待识别数据模型；通过对待识别图像信息进行单元格划分，实现对更大视野范围图像处理，同时每一个输出单元格包含的数据参数包括若干个存储数据量待识别数据模型，以便于提高后续的锚框进行降序排列以及非最大值抑制交并比处理效率，基于待识别数据模型的锚框进行降序排列进行预筛选以及非最大值抑制交并比处理，以识别得到最终目标物，通过降序排列进行预筛选以及非最大值抑制交并比处理，可以使待识别参数进行一次性单向处理，提高了识别的效率以及保证识别的准确率。

48、本技术的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实践了解到。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪永恩,汤杰,曾小艺,童磊,李建武,谢小华,张洪姣
技术所有人：江铃汽车股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。