基于字典学习的视频中判别性在线目标跟踪方法

文档序号:6548452阅读:428来源:国知局
基于字典学习的视频中判别性在线目标跟踪方法
【专利摘要】一种图像处理【技术领域】的基于字典学习的视频中判别性在线目标跟踪方法,通过手动标定或者已有跟踪结果构建目标的模板,同时获得待跟踪目标的状态;然后构建目标初始状态矩阵,然后进行运动建模,并采样形成候选样本;再将候选样本和模板进行分块,将各块进行稀疏编码,获得对应块的表示系数;将表示系数作为特征输入到相应块的分类器,获得该块各候选样本的判定置信度,将各块的判定置信度随机性抽取K个并求和,遍历所有可能性,取和值最大且在各可能性中被选取次数最多的候选样本,作为当前帧的目标跟踪结果。本发明能够提高复杂背景和目标外观变化情况下对目标跟踪的准确性和鲁棒性。
【专利说明】基于字典学习的视频中判别性在线目标跟踪方法
【技术领域】
[0001]本发明涉及的是一种图像处理【技术领域】的方法,具体是一种基于字典学习的视频中判别性在线目标跟踪方法。
【背景技术】
[0002]近年来,视频监控技术得到了广泛的应用。目标跟踪,融合了计算机图像处理、模式识别、人工智能以及自动控制等诸多相关领域的知识与技术,目的在于模拟人类视觉感知功能,赋予机器辨识图像序列中运动目标的能力,为视频内容的高层次分析和理解提供重要的数据依据。复杂环境中目标的稳定和准确跟踪是当前跟踪技术研究与应用急需解决的问题,传统的跟踪方法往往表现不佳。近些年来,一类能够随着目标和环境变化自适应更新跟踪器有关参数的方法,被称为在线目标跟踪,受到了广泛的关注。该类方法能够克服目标姿态变化等内部因素、光照变化以及摄像机视角变换等外部因素对跟踪器的影响,取得了更好的跟踪效果。
[0003]近年来,基于线性表示假设的稀疏表示和压缩感知技术已经引起了信号处理和机器视觉领域的广泛关注。2011年,X.Mei和H.Ling发表在《IEEE Transaction On PatternAnalysis And Machine Intelligence》上的论文“Robust Visual Tracking and VehicleClassification via Sparse Representation〃将稀疏表示运用于目标跟踪,该方法首先在模板空间下将目标由模板(候选模板与琐碎模板)的线性组合表示,然后用LI正则化模型表示模板的线性组合,最后使用内点法求解模板的系数,将重构误差最小的候选样本作为当前帧的跟踪结果。同年,B.Liu等人发表在《Computer Vision and PatternRecognition (CVPR), 2011IEEE Conference))的论文 “Robust tracking using localsparse appearance model and K-selection”中,提出了生成型在线跟踪方法SPT。该方法基于局部化稀疏表示模型,采用新提出的K - selection方法在线更新用于稀疏编码的基分布模型以形成字典,通过mean-shift和稀疏表示结果在判决图(Voting Map)上进行观测估计用以确定当前帧目标位置,从而将字典学习引入到在线跟踪领域。而从观测建模角度进行分类,在线跟踪方法可以分为生成型方法和判别型方法,相对于前者,后者在背景混乱及目标剧烈运动的环境中具备一定的性能优势。
[0004]一般性地,跟踪问题可以表述为对目标状态序列演化的估计过程。在原理上,在线目标跟踪遵循贝叶斯状态估计的基本原理,可以归结为序列化的滤波过程,表述为:
[0005]
【权利要求】
1.一种基于字典学习的视频中判别性在线目标跟踪方法,其特征在于,包括以下步骤: 步骤1:跟踪器初始化:从待处理视频中,通过手动标定若干帧或者已有跟踪结果构建目标的模板,同时获得模板中待跟踪目标的状态; 所述的目标的状态包括:目标矩形框在当前时刻的位置、倾斜角度、尺度、宽高比和偏斜角度,其状态空间为Xt= {xt, Yt, Θ t, St, at,Cj5t},其中Jemv,.1T分别对应于标定目标方框的旋转角、缩放尺度、宽高比和偏斜方向; 步骤2:在跟踪器完成初始化后,构建目标初始状态矩阵,然后进行运动建模,即相邻时刻目标状态的转移概率模型,并采样形成候选样本; 步骤3:将候选样本和模板进行分块,将各块进行稀疏编码,获得对应块的表示系数;将表示系数作为特征组成结构化字典并输入到相应块的分类器,获得该块各候选样本的判定置信度,将各块的判定置信度随机性抽取K个并求和,遍历所有可能性,取和值最大且在各可能性中被选取次数最多的候选样本,作为当前帧的目标跟踪结果; 所述的结构化字典通过判别性结构化字典学习方法进行更新。
2.根据权利要求1所述的方法,其特征是,所述的已有跟踪结果是指:当首次本文所提算法开始进行跟踪,则采用初始化时获得的过去若干帧手动标定的目标的状态或其它跟踪器跟踪处理的目标的状态作为模板;否则直接采用过去若干帧的目标的状态作为模板。
3.根据权利要求1所述的方法,其特征是,所述的采样是指:根据AffineWarping的基本原理,基于仿射参数通过零均值、方差预先定义的正态分布进行,具体为:当相邻时刻目标状态各参数符合高斯分布,满足:&J=AmiAu)*则可按照预先设定的进行采样获得候选样本;其中:p (Xt I Xt^1)为状态转移概率模型,即t时刻的先验概率;xt对应时刻t的目标状态变量,Μ(?, ,,ψβ)表示以xt_i为均值向量,以Wtl为方差求解Xt的高斯分布;Ψ (I表不仿射变换中六个参数方差组成的向量。
4.根据权利要求1所述的方法,其特征是,所述的候选样本为:由/HX,iXM) =.V(X,;X( ,U在Xt周围采样获得的候选区域。
5.根据权利要求1所述的方法,其特征是,所述的分块是指:在时刻t,将候选样本和模板行向量化,得到:Y,]eE(i/€Ri/ = 1,2,,.,,Μ,?并进行分块,得到N个互相重叠的块区域,每一块的向量尺寸为d2Xl,分块后的模板为t, 根据线性表征的假设,任意一个图像块可以由模板块进行线性表示,P;=靡;+麻+."+U气
6.根据权利要求1所述的方法,其特征是,所述的目标跟踪结果具体通过以下方式得到:使用<表示第t帧各图像块对应的分类器的支持向量,则对于第P个候选样本,其置信度为:
C11.Piyl (Xf) = arg max Y S(p]), S( p] ) = 1,

^ip ?
7.根据权利要求1所述的方法,其特征是,所述的结构化字典为Di= {D;}^,其中^表


示第i个图像块对应的字典元素,D;表示为:
8.根据权利要求1所述的方法,其特征是,所述的分类器的支持向量通过以下方式进行更新:在跟踪结果周围选取正、负样本,并进行分块,进行稀疏编码,输入到相应块的分类器进行模型的训练并实现支持向量的更新。
9.根据权利要求8所述的方法,其特征是,所述的支持向量的更新具体是指:在时刻t,建立一个线性支持向量机分类组{Modet,}二,其中:Model; i表示第i个分类器对应的模型,使用D;作为字典进行稀疏编码得到的系数对该模型进行训练,即P: =,β?, /; e丨+L-】丨,那么Model丨,对应的分类器支持向量可以通过最小化如下函数得到
【文档编号】G06T7/20GK103985143SQ201410240810
【公开日】2014年8月13日 申请日期:2014年5月30日 优先权日:2014年5月30日
【发明者】郑世宝, 薛明, 李宏波, 丁正彦, 朱文婕, 陈宇航 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1