一种基于多尺度检测的深度神经网络的制作方法

文档序号：11200368阅读：1553来源：国知局

本发明专利属于测距领域，尤其涉及一种基于多尺度检测的深度神经网络。

背景技术：

随着中国汽车抱有辆的增多，中国的车祸也随之增多。因此adas(高级行车辅助系统)应运而生，并大大提高了行车的安全性。但是传统的adas有其先天的缺陷：对环境感知的性能不佳，只能感知有限的物体。近年来随着深度学习的发展，其强大的环境认知能力得到了越来越多研究者和工程师的认可，并将越来越广泛的得到应用。在汽车领域，环境感知也是也是其系统的重要组成部分，深度学习其强大的感知能力也应用到汽车系统上。但是汽车有其特殊的需求：1.车载相机为了实时性，其分辨率比常用的相机分辨率小，2.在相机视野范围内，很多不同大小的目标，最小的只有不到16x16个像素，最大的目标可以覆盖整个画面。这些都为检测提出了非常高的需求。本发明就是为了解决这样的尺度问题，并着重解决小目标的检测问题。

发明专利内容

本发明旨在解决adas中的环境感知问题，并且尤其解决的是深度神经网络中对尺度变化的物体效果较差，尤其在物体上的性能最差。传统的深度神经网络为了能应用于物体检测，将目标定位和目标分类分为2个子网络进行。首先使用一个简单的定位网络，对图像中的目标进行定位，然后使用roipooling技术，使用第一个字网络的输出从共享层中提取物体的特征，然后送入第二个子网中进行识别。这里就有一个问题目标识别的精度取决于特征的分辨率。传统的算法中，使用的是下采16x16的特征层进行特征提取，因此理论上识别物体的最小大小为16x16个像素，再加上特征的误差，因此实际上物体最小大小可能为24x24或者32x32。综上所述，深度神经网络在检测小目标物体中性能较差。此问题大大制约了深度神经网络在adas中的应用。

一种基于多尺度检测的深度神经网络，在不同的网络层上设置多个检测网络，这样就解决了尺度变化的问题，即可以检测出小物体也可以检测大物体；在同一个网络层上设置多个不同大小不同形状的检测器，这样就解决了形状变化的问题；设置一个全新的合并层，将上面多个检测结果进行合并，共下面的分类网络使用；为了同时保留低层的细节信息和高层的全局信息，使用了一个特殊的反卷积层，对高层的特征层进行升维处理，并和低层的特征层进行特征合并，形成了新的特征图，然后对这个新的特征层进行roipooling处理。

结构为一个典型的倒金字塔结构，越靠近输入端的网络层，其特征图越大，越靠近输出层的网络层，其特征图越小。

深度神经网络中，越靠近输入层的网络层，特征图对目标的细节保留的越好，越靠近输出层的网络层，特征图越表达高层信息，对大目标描述的越细致。

本发明的有益效果在于：1、本发明使用了不同尺度的检测器，可以在不同尺度的特征层上进行目标定位，这样便解决了尺度变化的问题。

2.本发明在也使用了不同形状的检测器，可以对不同的形状的物体进行定位，解决了物体的形变问题。

3.使用了特殊的反卷积层，对高层特征层进行升维处理，并和低层的特征层进行特征合并，这样生成的新的特征层即保留了高层的全局信息，也保留了低层的细节信息，这样进一步的提升检测的性能。

附图说明

图1为本发明专利一种基于多尺度检测的深度神经网络测距算法示意图。

具体实施方式

实施例：本发明旨在解决adas中的环境感知问题，并且尤其解决的是深度神经网络中对尺度变化的物体效果较差，尤其在物体上的性能最差。传统的深度神经网络为了能应用于物体检测，将目标定位和目标分类分为2个子网络进行。首先使用一个简单的定位网络，对图像中的目标进行定位，然后使用roipooling技术，使用第一个字网络的输出从共享层中提取物体的特征，然后送入第二个子网中进行识别。这里就有一个问题目标识别的精度取决于特征的分辨率。传统的算法中，使用的是下采16x16的特征层进行特征提取，因此理论上识别物体的最小大小为16x16个像素，再加上特征的误差，因此实际上物体最小大小可能为24x24或者32x32。综上所述，深度神经网络在检测小目标物体中性能较差。此问题大大制约了深度神经网络在adas中的应用。

结构为一个典型的倒金字塔结构，越靠近输入端的网络层，其特征图越大，越靠近输出层的网络层，其特征图越小。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

技术特征：

技术总结
本发明一种基于多尺度检测的深度神经网络，在不同的网络层上设置多个检测网络，这样就解决了尺度变化的问题，即可以检测出小物体也可以检测大物体；在同一个网络层上设置多个不同大小不同形状的检测器，这样就解决了形状变化的问题；设置一个全新的合并层，将上面多个检测结果进行合并，共下面的分类网络使用；为了同时保留低层的细节信息和高层的全局信息，使用了一个特殊的反卷积层，对高层的特征层进行升维处理，并和低层的特征层进行特征合并，形成了新的特征图，然后对这个新的特征层进行ROI Pooling处理，本发明大大缓解了深度神经网络在ADAS中的应用。

技术研发人员：王曦;周冕;谢晓靓;宋健明;赵贵平;王震
受保护的技术使用者：恩泊泰（天津）科技有限公司
技术研发日：2016.12.29
技术公布日：2017.09.29

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王曦;周冕;谢晓靓;宋健明;赵贵平;王震
技术所有人：恩泊泰（天津）科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。