基于低秩稀疏的视频目标跟踪方法与流程

文档序号:11638835阅读:来源:国知局

技术特征:

1.一种基于低秩稀疏的视频目标跟踪方法,其特征在于包括以下步骤:

S1:初始化参数:

S11:给定图像序列{I1,I2,…,IM},M为序列总数;随机选择图像序列中的一张图像中的一个对象为目标,手动选定该目标的左上角p1(x1,y1),左下角p2(x2,y2)以及右上角p3(x3,y3),且用矩阵P表示,生成相应的矩形框确定该目标在图像中的位置,记该目标矩形框的矢量形式为O,其宽和高分别为wi和he;

S12:压缩S11中选定的图像,设置压缩后的图像大小,宽为sz_w,高为sz_h,目标压缩后将其用向量表示,定义x为目标压缩后的图像构成的向量,其维度为sz_w*sz_h;

S13:初始化字典Dt

在目标矩形框O上,定义2*3维随机矩阵RAND,RAND中的元素为随机生成的且服从高斯分布;

设置正样本数为Np,生成Np个RAND,令Ti=P+RANDip(i=1,2...Np),得到Np正样本框,其中Ti指第i个样本框的坐标表示,δp是指正样本框离目标距离,值越大表明离目标越远,RANDi表示生成的第i个样本框;

同样的,设置负样本数为Nn,生成Nn个RAND,令得到Nn负样本框;其中Ti+p指第i+p个样本框的坐标表示,δn是指负样本框离目标距离,值越大表明离目标越远;表示生成的第i+Np个样本框;

定义Dt为t时刻的字典,将这Np+Nn个矩形框矢量化后得到第1时刻的字典D1

S14:z为x在字典上的表示系数;如果Dt为完备字典,则有x=Dtz,x、Dt已知,z为求解项,λ0是z的一范数前的系数;求解目标矩形框O在字典Dt上的表示系数z0

<mrow> <msub> <mi>z</mi> <mn>0</mn> </msub> <mo>=</mo> <munder> <mi>argmin</mi> <mi>z</mi> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>x</mi> <mn>0</mn> </msub> <mo>-</mo> <msub> <mi>D</mi> <mi>t</mi> </msub> <mi>z</mi> <mo>|</mo> <msub> <mo>|</mo> <mn>2</mn> </msub> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>0</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>z</mi> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> </mrow>

其中:x0是初始目标压缩后的图像构成的向量;

S15:仿射参数设置为:σ0=[σ010203040506];

S16:用w表示Dt每个向量的权值,w为Np+Nn维向量,wi(i=1,2...Np+Nn)为w的分量;设置wi(i=1,2...Np+Nn)初始值为设置权值的最小阈值为τ,0<τ<1;

S2:视频跟踪过程:

S21:利用粒子滤波方法进行状态预测,在目标矩形框O的临近区域内随机选取n个与目标矩形O大小相同或相近的粒子,作为下一图像序列目标预测值候选者;

(1)将粒子作为目标候选框,将S15设置的仿射参数σ0=[σ010203040506]作为高斯分布参数,生成n个粒子,每个粒子有6个参数;生成n*6维随机矩阵T,令S=T*diag(σ0),生成n*6的仿射参数矩阵,代表n个粒子;

其中,

(2)利用S在Ii中截取图片,其中S可以转化为坐标矩阵,通过坐标矩阵截取n张图片,每张图片转化为sz_w*sz_h维向量,这n张图片在坐标矩阵P附近,与P的距离呈高斯分布,P为Ii-1时刻的目标图片坐标;这些图片作为粒子,构成X0,X0为(sz_w*sz_h)*n维矩阵,作为下一图像序列目标预测值候选者;

S22:构建重建错误,剔除与目标差距较大的粒子:

首先,定义e0i=||X0i-Dz0||2(i=1,2...n),e0值越大,说明与目标的差距越大,X0i是矩阵X0的第i列向量,选出X0中e0最小的25个候选粒子构成矩阵X,方法如下:

<mrow> <mi>c</mi> <mi>o</mi> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <msup> <msub> <mi>mine</mi> <mn>0</mn> </msub> <mi>i</mi> </msup> </mrow> <mn>25</mn> </munder> <mo>,</mo> <mrow> <mo>(</mo> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>...</mo> <mi>n</mi> <mo>)</mo> </mrow> </mrow>

X=X0j(j∈co)

其中,

S23:Zt为X在字典Dt上的表示系数矩阵,有X=Dt×Zt;由于X是低秩,因此Zt也是低秩;由于25个候选粒子接近目标向量,因此Zt也是稀疏矩阵,因此求解Zt可以根据约束求解,约束设置如下:

<mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>Z</mi> <mo>,</mo> <mi>E</mi> </mrow> </munder> <msub> <mi>&lambda;</mi> <mn>1</mn> </msub> <mo>|</mo> <mo>|</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>2</mn> </msub> <mo>|</mo> <mo>|</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>-</mo> <msub> <mi>Z</mi> <mn>0</mn> </msub> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>3</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>E</mi> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>1</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mrow>

其中||E||1,1=∑j(∑i|[E]ij|),

<mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <msub> <mi>&Sigma;</mi> <mi>j</mi> </msub> <msup> <mrow> <mo>(</mo> <msub> <mi>&Sigma;</mi> <mi>i</mi> </msub> <msup> <mrow> <mo>|</mo> <msub> <mrow> <mo>&lsqb;</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>&rsqb;</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </msup> <mo>,</mo> </mrow>

<mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>-</mo> <msub> <mi>Z</mi> <mn>0</mn> </msub> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <msub> <mo>&Sigma;</mo> <mi>j</mi> </msub> <msup> <mrow> <mo>(</mo> <msub> <mo>&Sigma;</mo> <mi>i</mi> </msub> <msup> <mrow> <mo>|</mo> <msub> <mrow> <mo>&lsqb;</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>-</mo> <msub> <mi>Z</mi> <mn>0</mn> </msub> <mo>&rsqb;</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </msup> <mo>;</mo> </mrow>

其中,||Zt||2,1项代表低秩稀疏,Z0为z0复制NP+Nn个后所组成的矩阵,||E||1,1为重建错误差表示计算X=Dt×Zt时,Dt×Zt的结果与X的误差,误差越小,表明用字典Dt恢复的图像越接近原始图像;λi(i=1,2,3)作为不同项的系数;

S24:定义zio为zi正样本系数,为Np维向量,zib为zi负样本系数,为Nn维向量;设置差别分数Δz,Δz表示正样本系数绝对值的总和减去负样本系数绝对值总和,Δz计算方法如下:

Δzi=||zio||1-||zib||1(i=1,2...n)

其中i表示第i个粒子,将差别分数最小的向量作为目标向量,同时替换上一时刻目标表示系数z0,赋予z0新的值:

<mrow> <msub> <mi>z</mi> <mn>0</mn> </msub> <mo>=</mo> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>...</mo> <mn>25</mn> </mrow> </munder> <msub> <mi>&Delta;z</mi> <mi>i</mi> </msub> </mrow>

其中,||zio||1=(∑j(∑i|(zio)ij|)),||zib||1=(∑j(∑i|(zib)ij|));

z0即为新选出的目标在字典Dt上的表示系数;

S25:字典更新;

目标跟踪过程中,每一帧都要将权值进行更新,将权值阈值小于τ的向量进行更换,方法如下:

令wi←wi*exp(zoi)(i=1,2...Np+Nn),如果wi<τ,则令i0=argmin1≤i≤nai

其中表示图像t序列中字典Dt的第i0个分量,wi表示w的第i个分量,wi←wi*exp(zoi)(i=1,2...Np+Nn)表示将wi*exp(zoi)赋值给wi,同理,表示将z0赋值给

S26:重复S21~S25。

2.根据权利要求1所述的基于低秩稀疏的视频目标跟踪方法,其特征在于,S12中图像的压缩方法如下:

如果有min(wi,he)≤50,则取S11中选定的目标大小,取值如下:

sz_w=wi,sz_h=he

如果有min(wi,he)>50,则将S11中选定的图像通过降采样,降到原分辨率的一半,取值如下:

<mrow> <mi>s</mi> <mi>z</mi> <mo>_</mo> <mi>w</mi> <mo>=</mo> <mfrac> <mrow> <mi>w</mi> <mi>i</mi> </mrow> <mn>2</mn> </mfrac> <mo>,</mo> <mi>s</mi> <mi>z</mi> <mo>_</mo> <mi>h</mi> <mo>=</mo> <mfrac> <mrow> <mi>h</mi> <mi>e</mi> </mrow> <mn>2</mn> </mfrac> </mrow>

如果S11中选定的目标过大即max(wi,he)>64,则将将该目标大小通过降采样设置为定值:

sz_w=32,sz_h=32。

3.根据权利要求1所述的基于低秩稀疏的视频目标跟踪方法,其特征在于,S13中,δn>>δp,δn>>δp表示δn远大于δp

4.根据权利要求1所述的基于低秩稀疏的视频目标跟踪方法,其特征在于,S15中,σ01、σ04的取值为0.01~0.05,σ02、σ03的取值为0.0001~0.0005,σ05、σ06的取值为1~5。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1