一种基于深度学习的人工智能目标跟踪方法与流程

文档序号:16903213发布日期:2019-02-19 18:11阅读:643来源:国知局
一种基于深度学习的人工智能目标跟踪方法与流程

本发明属于目标跟踪技术领域,具体涉及一种基于深度学习的人工智能目标跟踪方法。



背景技术:

过去几十年以来,目标跟踪的研究取得了长足的发展,尤其是各种机器学习算法被引入以来,目标跟踪算法呈现百花齐放的态势,2013年以来,深度学习方法开始在目标跟踪领域展露头脚,并逐渐在性能上超越传统方法,取得巨大的突破,目前大部分深度学习目标跟踪方法归属于判别式框架,深度模型的魔力之一来自于对大量标注训练数据的有效学习,而目标跟踪仅仅提供第一帧的bounding-box作为训练数据,这种情况下,在跟踪开始针对当前目标从头训练一个深度模型困难重重。



技术实现要素:

本发明的目的在于提供一种基于深度学习的人工智能目标跟踪方法,以解决上述背景技术中提出的目标跟踪仅仅提供第一帧的bounding-box作为训练数据,这种情况下,在跟踪开始针对当前目标从头训练一个深度模型困难重重。

为实现上述目的,本发明提供如下技术方案:一种基于深度学习的人工智能目标跟踪方法,具体跟踪方法如下:

预训练步骤:先使用栈式降噪自编码器在大规模自然图像收集上进行无监督的离线预训练来获得通用的物体表征能力,预训练一共堆叠了4个降噪自编码器,降噪自编码器对输入加入噪声,通过重构出无噪声的原图来获得更好的特征表达能力。

在线跟踪步骤:取离线sdae的encoding部分叠加sigmoid分类层组成分类网络,此时的网络并没有获取对当前被跟踪物体的特定表达能力,此时利用第一帧获取正负样本,对分类网络进行fine-tune获得对当前跟踪目标和背景更有针对性的分类网络,在跟踪过程中,对当前帧采用粒子滤波的方式提取一批候选的patch,这些patch输入分类网络中,置信度最高的成为最终的预测目标。

更新步骤:在目标跟踪非常重要的模型更新策略上,采取限定阈值的方式,即当所有粒子中最高的confidence低于阈值时,认为目标已经发生了比较大的表观变化,当前的分类网络已经无法适应,需要进行更新。

进一步地,所述大规模自然图像收集为tinyimagesdataset。

进一步地,所述patch相当于detection中的proposal。

进一步地,所述sdae为1024-2560-1024-512-256的瓶颈式结构。

与现有技术相比,本发明的有益效果是:在目标跟踪的训练数据非常有限的情况下,使用辅助的非跟踪训练数据进行预训练,获取对物体特征的通用表示,在实际跟踪时,通过利用当前跟踪目标的有限样本信息对预训练模型微调,使模型对当前跟踪目标有更强的分类性能,这种迁移学习的思路极大的减少了对跟踪目标训练样本的需求,也提高了跟踪算法的性能,将深度网络运用于单目标跟踪的跟踪算法,利用“离线预训练+在线微调”的思路,很大程度的解决了跟踪中训练样本不足的问题。

附图说明

图1为本发明一种基于深度学习的人工智能目标跟踪方法的预训练网络结构图。

图2为本发明一种基于深度学习的人工智能目标跟踪方法的在线跟踪结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1-2所示,一种基于深度学习的人工智能目标跟踪方法,具体跟踪方法如下:

预训练步骤:先使用栈式降噪自编码器在大规模自然图像收集上进行无监督的离线预训练来获得通用的物体表征能力,预训练一共堆叠了4个降噪自编码器,降噪自编码器对输入加入噪声,通过重构出无噪声的原图来获得更好的特征表达能力。

在线跟踪步骤:取离线sdae的encoding部分叠加sigmoid分类层组成分类网络,此时的网络并没有获取对当前被跟踪物体的特定表达能力,此时利用第一帧获取正负样本,对分类网络进行fine-tune获得对当前跟踪目标和背景更有针对性的分类网络,在跟踪过程中,对当前帧采用粒子滤波的方式提取一批候选的patch,这些patch输入分类网络中,置信度最高的成为最终的预测目标。

更新步骤:在目标跟踪非常重要的模型更新策略上,采取限定阈值的方式,即当所有粒子中最高的confidence低于阈值时,认为目标已经发生了比较大的表观变化,当前的分类网络已经无法适应,需要进行更新。

其中,所述大规模自然图像收集为tinyimagesdataset。

其中,所述patch相当于detection中的proposal。

其中,所述sdae为1024-2560-1024-512-256的瓶颈式结构。

本发明的工作原理及使用流程:在目标跟踪的训练数据非常有限的情况下,使用辅助的非跟踪训练数据进行预训练,获取对物体特征的通用表示,在实际跟踪时,通过利用当前跟踪目标的有限样本信息对预训练模型微调,使模型对当前跟踪目标有更强的分类性能,这种迁移学习的思路极大的减少了对跟踪目标训练样本的需求,也提高了跟踪算法的性能,将深度网络运用于单目标跟踪的跟踪算法,利用“离线预训练+在线微调”的思路,很大程度的解决了跟踪中训练样本不足的问题。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。



技术特征:

技术总结
本发明公开了一种基于深度学习的人工智能目标跟踪方法,具体跟踪方法如下,预训练步骤:先使用栈式降噪自编码器在大规模自然图像收集上进行无监督的离线预训练来获得通用的物体表征能力,预训练一共堆叠了4个降噪自编码器,降噪自编码器对输入加入噪声,通过重构出无噪声的原图来获得更好的特征表达能力,在线跟踪步骤:取离线SDAE的encoding部分叠加sigmoid分类层组成分类网络,此时的网络并没有获取对当前被跟踪物体的特定表达能力,此时利用第一帧获取正负样本,本发明将深度网络运用于单目标跟踪的跟踪算法,利用“离线预训练+在线微调”的思路,很大程度的解决了跟踪中训练样本不足的问题。

技术研发人员:韩青江
受保护的技术使用者:武汉拓睿传奇科技有限公司
技术研发日:2018.10.25
技术公布日:2019.02.19
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1