一种在视频中针对快速移动物体跟踪的位置补偿方法与流程

文档序号：17777999发布日期：2019-05-28 20:30阅读：493来源：国知局

本发明涉及一种在视频中针对快速移动物体跟踪的位置补偿方法。

背景技术：

随着计算机硬件和软件技术的发展，计算机视觉技术受到了人们越来越多的关注。尤其在军事、航空航天、计算机辅助设计、智能机器人等邻域，计算机视觉技术得到了广泛的应用。在计算机视觉技术中，基于视频图像序列的视觉技术是最为重要的，因此也成为人们研究的重点和难点。视频序列中运动目标的检测与跟踪，又是基于视频序列的计算机视觉技术的基础和关键。首先，能否将运动目标从视频图像序列中准确地检测出来，是运动估计、目标识别及行为理解等后续处理成功与否的关键。为了实现运动目标的检测，很多学者进行了相关的研究，并提出了大量的运动目标检测算法。

在连续帧的视频中，上一帧的物体检测结果对于下一帧具有极大的参考价值，基于此原理文献《learningtotrackat100fpswithdeepregressionnetworks》中提出了一种视频人脸追踪的方法，借鉴于其进行人脸追踪的方法，移植到物体追踪的应用中。但是在此方法法的追踪中，当物体快速运动的时候，物体的位置信息框会出现跟不上的情况。

技术实现要素：

为了能够达到更加完美的追踪效果，本发明提供了一种在视频中针对快速移动物体跟踪的位置补偿方法，将根据当前帧的物体位置信息根据上一帧的位置信息为基准，通过计算优化来使得物体追踪框能够很好地进行帧与帧之间的过渡，得到更为精准的位置检测结果。这种方法充分的利用了视频中帧与帧之间的相关性，大大的提升了物体检测的效率和准确性。

为了实现上述目的，本发明采用的技术方案如下：

一种在视频中针对快速移动物体跟踪的位置补偿方法，利用连续帧视频中的多帧物体检测结果作为参考，计算当前输入帧物体检测结果与上一帧和多帧的物体检测结果之间的关系，当物体快速移动时，通过计算加入补偿的方式使得对应的最终检测位置信息更为精准。

本发明提供的在视频中针对快速移动物体跟踪的位置补偿方法使用简单的数学运算对视频中的物体检测进行上下帧之间的结果关联计算，使得在检测追踪的过程中不会因为速度快而导致检测框跟不上的情况；利用权重和保存fps数量的物体为基础计算偏移量，比直接取平均值可以获得更佳的过度平滑性；无需对输入图像进行复杂的降噪等处理，对物体检测器也无特殊需求，可以大大提升检测的速率；适用性广，可以在低端的嵌入式设备中保证足够的计算效率。

附图说明

构成本技术的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明实施例流程图；

图2为本发明中sigmoid函数曲线。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例

本发明主要利用了连续帧视频中的多帧物体检测结果作为参考，计算当前输入帧物体检测结果与上一帧和多帧的物体检测结果之间的关系，当物体快速移动时，通过计算加入补偿的方式使得对应的最终检测位置信息更为精准。

在本发明中，不涉及到物体检测器的编写或者训练和对于物体追踪的具体实现，我们的方法在于提升视频中的物体检测追踪的显示效果，对于物体检测器无特殊的需求或者改良要求，只需要对输入的数字图像矩阵计算得到物体检测的结果即为满足该方法的物体检测器。

如图1所示，一种改良的视频人脸检测追踪效果的方法详细的实现步骤如下：

1、通过硬件设备摄像头采集实时的视频作为输入，或者直接输入包含多帧的视频文件。在这里我们要求输入的视频必须是有效的并且每一帧的视频图像矩阵的数据类型和大小尺寸应该是保持一致的(相同一个输入视频内的)。

2、对摄像头采集的实时视频或者视频文件进行分解，使得能够以单帧为单位对视频进行分解。例如一个视频中包含30帧数字图像，那么将会分为30次输入，每一次输入均为1帧数组图像的矩阵数据。输入的数据可以是各种格式的数字图像矩阵。

3、由于步骤2中输入的数字图像矩阵的格式可能不尽相同，我们在处理前需要将不同的数字图像矩阵格式转化为物体检测器支持的数字图像矩阵格式。这个步骤也可以在输入视频的时候进行统一的转换。

4、输入1帧数字图像矩阵到物体检测器中，物体检测器通过计算后返回物体检测的结果。这种结果通常是以数组的方式进行保存的，数组的长度是检测到的物体数量大小。其中每个物体信息我们定义的储存内容如下：

x1:物体位置标注框的左上角横轴坐标

y1：物体位置标注框的左上角纵轴坐标

w：物体标注框的宽度值

h：物体标注框的高度值

x11：物体标注框的右下角横轴坐标

y11：物体标注框的右下角纵轴坐标

5、经过步骤4之后可以获得当前输入帧的物体位置信息，我们将根据此位置信息进行一系列的计算。

1)根据当前输入帧(定义为上一帧)的物体位置信息，经过追踪算法后得到当前帧的物体位置信息，物体的位置定义为：

x2:当前帧物体位置标注框的左上角横轴坐标

y2：当前帧物体位置标注框的左上角纵轴坐标

x22：当前帧物体标注框的右下角横轴坐标

y22：当前帧物体标注框的右下角纵轴坐标

2)接下里根据4和1)得到的位置信息进行计算，首先先计算出对应的位置偏移量，横坐标的偏移量为(x2-x1),纵坐标的偏移量为(y2-y1)。

将得到的横纵坐标分别(当做公式中的x)代入到如图2所示的sigmoid函数公式中进行计算求得对应的权重量dx和dy。

将得到的dx和dy代入到下面的公式来计算当前帧物体回归框的位置

x’＝(x1+(x2-x1)*dx)

y’＝(y2+(y2-y1)*dy)

3)经过2)后得到当前帧最终输出框的左上角坐标点信息，根据w和h分别算出右下角的坐标点位置。

6、经过了步骤5后得到了当前帧的最终输出物体检测追踪的位置结果，同时更新数组中的元素信息。

7、输入下一帧图像矩阵，从步骤5开始执行该流程直到视频帧处理结束。

如上所述，对本发明的实施例进行了详细地说明，但是只要实质没有脱离本发明的发明点及效果可以有很多的变形，这对本领域的技术人员来说是显而易见的。因此，这样的变形例也全部包含在本发明的保护范围之内。

技术特征：

技术总结
本发明涉及一种在视频中针对快速移动物体跟踪的位置补偿方法，利用连续帧视频中的多帧物体检测结果作为参考，计算当前输入帧物体检测结果与上一帧和多帧的物体检测结果之间的关系，当物体快速移动时，通过计算加入补偿的方式使得对应的最终检测位置信息更为精准。本发明使用简单的数学运算对视频中的物体检测进行上下帧之间的结果关联计算，使得在检测追踪的过程中不会因为速度快而导致检测框跟不上的情况；利用权重和保存FPS数量的物体为基础计算偏移量，比直接取平均值可以获得更佳的过度平滑性；无需对输入图像进行复杂的降噪等处理，对物体检测器也无特殊需求，可以大大提升检测的速率；可以在低端的嵌入式设备中保证足够的计算效率。

技术研发人员：容李庆;关毅;袁亚荣
受保护的技术使用者：广州二元科技有限公司
技术研发日：2019.03.08
技术公布日：2019.05.28

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：容李庆;关毅;袁亚荣
技术所有人：广州二元科技有限公司
我是此专利的发明人

上一篇：一种通气管接头及防漏组件的制作方法
上一篇：基于微流控技术的明胶甲基丙烯酰胺核壳微球的制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。