一种大焦距监控场景下多尺度目标的快速精准识别方法与流程

文档序号：20841630发布日期：2020-05-22 17:34阅读：534来源：国知局

本发明涉及人工智能领域和计算机视觉领域，特别是大焦距监控场景下多尺度目标的快速精准识别方法。

背景技术：

目标检测与识别在生活中多个领域中有着广泛的应用，它是将图像或者视频中的目标与不感兴趣的部分区分开，判断是否存在目标。若存在目标则确定目标的位置，识别目标是一种计算机视觉任务。目标检测与识别是计算机视觉领域中一个非常重要的研究方向，随着互联网，人工智能技术，智能硬件的迅猛发展，人类生活中存在着大量的图像和视频数据，这使得计算机视觉技术在人类生活中起到的作用越来越大，对计算机视觉的研究也越来越火热。目标检测与识别，作为计算机视觉领域的基石，也越来越受到重视。在实际生活中应用也越来越广泛，例如目标跟踪，视频监控，信息安全，自动驾驶，图像检索，医学图像分析，网络数据挖掘，无人机导航，遥感图像分析，国防系统等。

目标检测也就成为了近年来理论和应用的研究热点，它是图像处理和计算机视觉学科的重要分支，也是智能监控系统的核心部分，同时目标检测也是泛身份识别领域的一个基础性的算法，对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。因此，提升目标检测的准确率以及降低目标的漏检率有着重要的实际意义。

目前，目标检测与识别的研究方法主要有两大类：基于传统图像处理和机器学习算法的目标检测与识别方法、基于深度学习的目标检测与识别方法。

1、基于传统图像处理和机器学习算法的目标检测与识别方法：

传统的目标检测与识别方法可以表示为：目标特征提取->目标识别->目标定位。这里所用到的特征都是人为设计的，例如sift(尺度不变特征变换匹配算法scaleinvariantfeaturetransform),hog(方向梯度直方图特征histogramoforientedgradient),surf(加速稳健特征speededuprobustfeatures)等。通过这些特征对目标进行识别，然后再结合相应的策略对目标进行定位。

2、基于深度学习的目标检测与识别方法：

如今，基于深度学习的目标检测与识别成为主流方法，可以表示为：图像的深度特征提取->基于深度神经网络的目标识别与定位，其中用到深度神经网络模型是卷积神经网络cnn。目前可以将现有的基于深度学习的目标检测与识别算法大致分为以下三大类：

1）基于区域建议的目标检测与识别算法，如r-cnn,fast-r-cnn,faster-r-cnn。

2）基于回归的目标检测与识别算法，如yolo,ssd。

3）基于搜索的目标检测与识别算法，如基于视觉注意的attentionnet，基于强化学习的算法。

上述现有技术还存在的不足有：

1、基于传统图像处理和机器学习算法的目标检测算法存在的缺陷：

(1)当遇到大焦距监控场景时，近端的目标与远端的目标差异会非常的大，同一场景下会存在多个尺度的目标。在选取目标预测区域时，采用滑动窗口的方式无法有效的设定滑动窗口大小和长宽比，因此滑动窗口的穷举方式，耗时长，冗余大。

(2)在大焦距监控场景下，目标离摄像机近时比较大，距离摄像机比较远时比较小，目标尺度变化较大，利用传统方法无法准确的识别大焦距场景下近端与远端的目标，泛化能力差。

2、基于深度学习的目标检测与识别方法存在的缺陷:

(1)目前基于深度学习的目标检测方法大部分都是利用基于固定anchor回归的方式，当遇到大焦距监控场景时，存在多个尺度大小的目标，固定的anchor无法有效的兼顾目标大小差别比较大的情况，造成检测网络无法收敛或者训练网络的质量较低，很容易造成目标的漏检与误检。

(2)用深度学习网络做目标检测时需要设定超参阈值来实现对目标的检出，只有当网络预测目标的置信度大于设定的超参阈值时才认为该预测框为目标，因此该超参阈值对目标的检出率与准确率有着很大的影响，在实际应用中往往设定经验值。但是当阈值设定较高就会造成漏检，当阈值设定较低就会造成误检，无法充分利用训练的网络模型实现对目标的识别。

技术实现要素：

针对上述现有技术中存在的不足，本发明的目的是提供一种大焦距监控场景下多尺度目标的快速精准识别方法。它通过动态anchor能有效提升大焦距监控场景下多尺度目标的检出率，通过分割与动态anchor检测相结合的网络结构能有效提升目标检测的准确率，进而有效的提升目标识别的整体效果。

为了达到上述发明目的，本发明的技术方案以如下方式实现：

一种大焦距监控场景下多尺度目标的快速精准识别方法，其方法步骤为：

1）动态anchor设定：

获取训练数据，并对训练的目标进行数据拟合，通过大数据拟合来分析anchor的特性，动态的设定anchor的值。

2）设计网络结构danchornet：

设计danchornet中目标检测分支与目标分割分支，通过目标检测分支与分割分支的结合来解决目标检测超参阈值的设定。

3）设计danchornet的损失函数：

通过动态权重设计方案来优化训练过程中的损失函数，融合目标注意力机制，重点关注目标区域的平均概率值来对总的损失进行调整。

本发明由于采用了上述方法，同现有技术相比具有如下优点：

1.根据目标所在的位置动态的设定anchor值，该方法能够有效的提升目标检测中anchor的利用率，有效的兼顾大焦距场景下的大、小目标，同时该方法使网络更容易收敛，有效的提升大焦距场景下多尺度目标的检测率。

2.danchornet中采用融合分割分支损失函数的结合方式，融合分割的网络会无疑增加了网络训练的难度，本文提出动态权重设计方案来优化训练过程中的损失函数，融合目标注意力机制，重点关注目标区域的平均概率值来对总的损失进行调整。当目标区域平均概率值较高时说明分割网络训练较好，可以降低分割网络的损失贡献。当目标区域平均概率值较低时说明分割网络收敛欠佳，应提升分割网络的损失贡献，降低网络的训练难度，提升网络训练效果。

3.提出一种新的网络结构danchornet来提升目标检测的效果，提出融合分割的目标检测方法，在计算量增加不大的前提下增加分割分支，融合分割分支后得到一种新的网络结构danchornet。通过danchornet计算两个分支的检测目标的交并集来获取最终的检测结果，当二者交并集满足设定的要求时，即认为该预测框为目标。该网络结构能够避免单独检测方法目标置信度超参阈值的设定，充分利用网络模型，有效的提升了目标检测的准确率。

下面结合附图和具体实施方式对本发明做进一步说明。

说明书附图

图1为本发明的方法流程图；

图2为本发明实施实例中融合分割的网络结构danchornet。

具体实施方式

参看图1和图2，本发明一种大焦距监控场景下多尺度目标的快速精准识别方法，其方法步骤为：

1.动态anchor设定：

获取训练数据，并对训练的目标进行数据拟合，获取anchor的拟合结果，其步骤如下：

(1)获取数据m(x,y,w,h)，mi为数据集中的第i组数据，xi、yi为第i个目标左上角坐标，wi、hi为第i个目标的长和宽，对数据m(x,y,w,h)进行重新组合得到两组数据m_h(y,h)、m_w(y,w)。

(2)对获取的m_h(y,h)、m_w(y,w)分别进行数据线性拟合，得到针对m_w(y,w)拟合的斜率k_w与截距b_w，以及针对m_h(y,h)拟合的斜率k_h与截距b_h。

(3)在网络训练时，通过k_w、b_w、k_h、b_h动态的设定anchor的宽度anchor_w以及anchor的高度anchor_h，结果为:

其中y为在每个featuremap上网格(i,j)中j转换为原始图像的高度坐标。

2.设计网络结构danchornet：

(1)通过检测分支获取目标检测结果rd，rd包括预测目标的坐标位置，rd_x、rd_y目标的长宽rd_w、rd_h，目标的置信度rd_conf。

(2)通过分割分支获取目标的分割结果f_seg，该分割结果包括两个单通道分割图ffull_seg、finter_seg，其中ffull_seg是全部目标的预测分割结果，finter_seg是全部目标的粘连部分的分割结果，通过ffull_seg、finter_seg获取最终图像目标的单独分割结果seg。

(3)对获取的分割结果seg做轮廓提取，进而获得目标的外轮廓矩形seg_seg_boud,该seg_boud包括分割目标的左上角坐标位置s_x、s_y，目标的长宽s_w、s_h，目标的置信度s_conf。

(4)通过s_conf、rd_conf来获取部分目标的最终结果r_1、r_2，其计算方式如式(4)所示:

(5)对步骤(4)计算后剩余的检测结果相互间计算交并集iou，获取目标检测结果r_3，该结果会设定一个交并集阈值thiou为0.7，对于置信度较低的预测结果会通过分割得到的seg_boud与检测得到的rd结合的方式来进行目标判定，如果两个目标的交并集iou>thiou,获取最终的目标检测结果r_3，计算方式如下式(5)所示，如果iou<thiou就把当前目标丢掉。

(6)通过步骤(4)、(5)获取的r_1、r_2、r_3合并获取得到最终的检测结果r_all。

3.设计danchornet的损失函数：

(1)获取检测分支的损失l1，该损失函数用的是yolo_v3的损失函数。

(2)获取分割分支的损失l2，该损失函数用的是sigmoid损失函数，pi,j为最终分割的featuremap的i,j位置的概率值，获取groundtruth的目标位置区域的所有featuremap的概率值，假如groundtruth中有n个目标框，目标区域总的面积为area，获取总的概率值p，进而获取到n个目标区域的平均概率值pavg：

(3)根据步骤(2)获取的pavg动态的获取总的损失l，其计算方法如下所示:

本发明方法中，结合分割的目标检测网络结构danchornet，首先优化了原始目标检测方法，利用动态anchor有效的兼顾大场景下的大目标与小目标，提升网络对多尺度目标情况下的检出率；然后在检测的分支上引出分割网络，通过二者的结合避免了单独目标检测网络置信度的设置，在计算量增加不大的情况下有效的提升了目标的检出率与准确率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：魏世安;刘立强;江龙;王亚涛
技术所有人：北京同方软件有限公司;同方股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。