一种基于darknet框架的物体检测系统的制作方法

文档序号：13575391阅读：1597来源：国知局

本发明涉及一种检测系统，具体是一种基于darknet框架的物体检测系统。

背景技术：

物体识别是计算机视觉中的一个研究方向，也是当前比较热门的研究领域。在人们的需求不断增长的今天，物体识别在安全、科技、经济方面正在起着举足轻重的作用，安防领域和交通监管部门也对物体识别提出了迫切的要求，所以研究物体识别对社会的未来有非常重要的意义。

传统目标检测系统采用deformablepartsmodels(dpm)方法，通过滑动框方法提出目标区域，然后采用分类器来实现识别。近期的r-cnn类方法采用regionproposalmethods，首先生成潜在的边界盒，然后采用分类器识别边界盒所包含物体的类别。最后通过后处理方式来去除重复边界盒来进行优化。这类方法流程复杂，存在速度慢和训练困难的问题。

技术实现要素：

本发明要解决的技术问题是提供一种基于darknet框架的物体检测系统，以解决背景技术中提到的问题。

为实现上述目的，本发明提供如下技术方案：

一种基于darknet框架的物体检测系统，包括

模型训练单元，用于设计darknet网络模型,darknet网络模型为卷积层和池化层的交替连接，对训练参数(包括学习率、)进行调整，利用数据集训练得到模型的权重参数；

预处理单元，用于收集合适的图片集，对图片集中的每一张图片进行物体标注，然后将标注信息转换成darknet训练所需的标注格式，并按照一定的比例生成相应的训练、验证、测试图片集；和定位识别单元所述；

定位识别单元；对预处理单元收集到的图片进行识别处理；模型训练单元分别连接预处理单元和定位识别单元。

作为本发明的优选方案：所述定位识别单元的识别处理步骤具体是：首先将图像分割成s*s的格子，每个格子预测b个边界盒和边界盒的置信值c，置信值代表box包含一个目标的置信度，如果没有目标，置信值为零。每一个边界盒包含5个值：x，y，w，h和confidence。(x，y)代表与格子相关的盒子的中心。(w，h)为与全图信息相关的盒子的宽和高。confidence代表预测盒子的iou和groundtruth，最终输出s*s*(b*5+c)维向量。

作为本发明的优选方案：所述向量包含对图片预测的边界盒坐标信息，置信值以及每个格子的类别概率，每个边界盒的置信分数通过对应格子的类别概率和盒子的置信度相乘得到，该分数衡量了该类别出现在盒子中的概率以及该盒子与目标的吻合程度。针对网络的输出框信息和类别概率，对其进行非极大抑制处理和阈值处理舍弃重复框，得到最终的检测结果。

与现有技术相比，本发明的有益效果是：本系统模型训练简单，整个系统是端到端(输入图片，输出检测框)的，并且可以实现实时检测。该系统采用全图信息来进行预测。与滑动窗口方法和regionproposal-based方法不同，网络模型在训练和预测过程中可以利用全图信息，对目标框的定位更加准确。系统可以学习到目标的概括信息，并具有一定普适性。采用自然图片训练网络模型，然后采用艺术图像来预测，与比其它目标检测方法而言准确率高很多。该系统可以适应于不同的应用场景和检测目标，只需要用相应的数据集对系统进行训练即可。

附图说明

图1是一种基于darknet框架的物体检测系统和交互平台结构框图。

图2是卷积神经网络结构的示意图。

图3是一种基于darknet框架的物体检测系统和交互平台流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-3，一种基于darknet框架的物体检测系统，其包括预处理单元、模型训练单元和定位识别单元。

预处理单元：此步骤主要包括收集合适的图片集，对图片集中的每一张图片进行物体标注，然后将标注信息转换成darknet训练所需的标注格式，并按照一定的比例生成相应的训练、验证、测试图片集。

模型训练单元：设计darknet网络模型,darknet网络模型为卷积层和池化层的交替连接(具体可见2.2.2部分)，对训练参数(包括学习率、)进行调整，利用数据集训练得到模型的权重参数。

定位识别单元：对于任意分辨率的一张图片，系统首先将图像分割成s*s的格子，每个格子预测b个边界盒和边界盒的置信值c，置信值代表box包含一个目标的置信度，如果没有目标，置信值为零。每一个边界盒包含5个值：x，y，w，h和confidence。(x，y)代表与格子相关的盒子的中心。(w，h)为与全图信息相关的盒子的宽和高。confidence代表预测盒子的iou和groundtruth，最终输出s*s*(b*5+c)维向量。该向量包含对图片预测的边界盒坐标信息，置信值以及每个格子的类别概率，每个边界盒的置信分数通过对应格子的类别概率和盒子的置信度相乘得到，该分数衡量了该类别出现在盒子中的概率以及该盒子与目标的吻合程度。针对网络的输出框信息和类别概率，对其进行非极大抑制处理和阈值处理舍弃重复框，得到最终的检测结果。

本发明的工作原理是：如图2所示，网络模型采用前几层为卷积层和池化层的交替连接，后跟三个卷积层的方式，不采用全连接层。模型主要的计算量在于网络预测，而不同的计算层执行的计算如下：

卷积层计算：离散卷积的计算过程是利用卷积模板(卷积核、滤波器)在原图像上滑动，把对应位置上的元素相乘后加起来，得到最终的结果，即实现滑动-相乘-叠加的操作。

池化层计算：池化层主要是对图像不同位置的特征进行聚合统计，例如，人们可以计算图像一个区域上的某个特定特征的平均值(或最大值)。根据不同的计算池化的方法，又分为平均池化和最大池化。并且池化层一般位于卷积层之后。

根据网络输出信息整合数据得到一系列盒子,并设置阈值，滤掉得分低的盒子,最后对保留的盒子进行非极大抑制处理，去除重复框，得到最终的检测结果。

基于darknet框架的物体检测系统，能够进行高准确率快速检测以及实时目标检测。整个系统采用端到端的设计思想，输入图片，经过系统计算推断，即可得到图片的目标框及其所属类别；计算过程中，充分利用图片的全局信息进行计算推理，对检测框的定位准确，且针对不同数据集，利用数据集的先验信息，每个格子可预测多个目标框，最后选择置信度最高的目标框作为输出，该思想在训练中可加速模型收敛。

技术特征：

技术总结
本发明公开了一种基于darknet框架的物体检测系统，包括预处理单元、模型训练单元和定位识别单元，本系统模型训练简单，整个系统是端到端(输入图片，输出检测框)的，并且可以实现实时检测。该系统采用全图信息来进行预测。与滑动窗口方法和region proposal‑based方法不同，网络模型在训练和预测过程中可以利用全图信息，对目标框的定位更加准确。系统可以学习到目标的概括信息，并具有一定普适性。采用自然图片训练网络模型，然后采用艺术图像来预测，与比其它目标检测方法而言准确率高很多。该系统可以适应于不同的应用场景和检测目标，只需要用相应的数据集对系统进行训练即可。

技术研发人员：周海明;林绿德;庄永军
受保护的技术使用者：旗瀚科技有限公司
技术研发日：2017.09.30
技术公布日：2018.01.30

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周海明;林绿德;庄永军
技术所有人：旗瀚科技有限公司
我是此专利的发明人

上一篇：一种适合建筑垃圾筛分的弛张筛的制作方法
上一篇：一种生产加工用机械筛选机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。