基于低秩稀疏的视频目标跟踪方法与流程

文档序号：11638835阅读：来源：国知局

技术特征：

1.一种基于低秩稀疏的视频目标跟踪方法，其特征在于包括以下步骤：

S1：初始化参数：

S11：给定图像序列{I₁,I₂,…,I_M}，M为序列总数；随机选择图像序列中的一张图像中的一个对象为目标，手动选定该目标的左上角p₁(x₁,y₁)，左下角p₂(x₂,y₂)以及右上角p₃(x₃,y₃)，且用矩阵P表示，生成相应的矩形框确定该目标在图像中的位置，记该目标矩形框的矢量形式为O，其宽和高分别为wi和he；

S12：压缩S11中选定的图像，设置压缩后的图像大小，宽为sz_w，高为sz_h，目标压缩后将其用向量表示，定义x为目标压缩后的图像构成的向量，其维度为sz_w*sz_h；

S13：初始化字典D_t

在目标矩形框O上，定义2*3维随机矩阵RAND，RAND中的元素为随机生成的且服从高斯分布；

设置正样本数为N_p，生成N_p个RAND，令T_i＝P+RAND_i*δ_p(i＝1,2...N_p)，得到N_p正样本框，其中T_i指第i个样本框的坐标表示，δ_p是指正样本框离目标距离，值越大表明离目标越远，RAND_i表示生成的第i个样本框；

同样的，设置负样本数为N_n，生成N_n个RAND，令得到N_n负样本框；其中T_i+p指第i+p个样本框的坐标表示，δ_n是指负样本框离目标距离，值越大表明离目标越远；表示生成的第i+N_p个样本框；

定义D_t为t时刻的字典，将这N_p+N_n个矩形框矢量化后得到第1时刻的字典D₁；

S14：z为x在字典上的表示系数；如果D_t为完备字典，则有x＝D_tz，x、D_t已知,z为求解项，λ₀是z的一范数前的系数；求解目标矩形框O在字典D_t上的表示系数z₀：

$<mrow> <msub> <mi>z</mi> <mn>0</mn> </msub> <mo>=</mo> <munder> <mi>argmin</mi> <mi>z</mi> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>x</mi> <mn>0</mn> </msub> <mo>-</mo> <msub> <mi>D</mi> <mi>t</mi> </msub> <mi>z</mi> <mo>|</mo> <msub> <mo>|</mo> <mn>2</mn> </msub> <mo>+</mo> <msub> <mi>λ</mi> <mn>0</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>z</mi> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> </mrow>$

其中：x₀是初始目标压缩后的图像构成的向量；

S15：仿射参数设置为：σ₀＝[σ₀¹,σ₀²,σ₀³,σ₀⁴,σ₀⁵,σ₀⁶]；

S16：用w表示D_t每个向量的权值，w为N_p+N_n维向量，w_i(i＝1,2...N_p+N_n)为w的分量；设置w_i(i＝1,2...N_p+N_n)初始值为设置权值的最小阈值为τ，0<τ<1；

S2：视频跟踪过程：

S21：利用粒子滤波方法进行状态预测，在目标矩形框O的临近区域内随机选取n个与目标矩形O大小相同或相近的粒子，作为下一图像序列目标预测值候选者；

(1)将粒子作为目标候选框，将S15设置的仿射参数σ₀＝[σ₀¹,σ₀²,σ₀³,σ₀⁴,σ₀⁵,σ₀⁶]作为高斯分布参数，生成n个粒子，每个粒子有6个参数；生成n*6维随机矩阵T，令S＝T*diag(σ₀)，生成n*6的仿射参数矩阵，代表n个粒子；

其中，

(2)利用S在I_i中截取图片，其中S可以转化为坐标矩阵，通过坐标矩阵截取n张图片，每张图片转化为sz_w*sz_h维向量，这n张图片在坐标矩阵P附近，与P的距离呈高斯分布，P为I_i-1时刻的目标图片坐标；这些图片作为粒子，构成X₀，X₀为(sz_w*sz_h)*n维矩阵，作为下一图像序列目标预测值候选者；

S22：构建重建错误，剔除与目标差距较大的粒子：

首先，定义e₀ⁱ＝||X₀ⁱ-Dz₀||₂(i＝1,2...n)，e₀值越大，说明与目标的差距越大，X₀ⁱ是矩阵X₀的第i列向量，选出X₀中e₀最小的25个候选粒子构成矩阵X，方法如下：

$<mrow> <mi>c</mi> <mi>o</mi> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <msup> <msub> <mi>mine</mi> <mn>0</mn> </msub> <mi>i</mi> </msup> </mrow> <mn>25</mn> </munder> <mo>,</mo> <mrow> <mo>(</mo> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>...</mo> <mi>n</mi> <mo>)</mo> </mrow> </mrow>$

X＝X₀^j(j∈co)

其中，

S23：Z_t为X在字典D_t上的表示系数矩阵，有X＝D_t×Z_t；由于X是低秩，因此Z_t也是低秩；由于25个候选粒子接近目标向量，因此Z_t也是稀疏矩阵，因此求解Z_t可以根据约束求解，约束设置如下：

$<mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>Z</mi> <mo>,</mo> <mi>E</mi> </mrow> </munder> <msub> <mi>λ</mi> <mn>1</mn> </msub> <mo>|</mo> <mo>|</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>λ</mi> <mn>2</mn> </msub> <mo>|</mo> <mo>|</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>-</mo> <msub> <mi>Z</mi> <mn>0</mn> </msub> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>λ</mi> <mn>3</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>E</mi> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>1</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mrow>$

其中||E||_1,1＝∑_j(∑_i|[E]_ij|),

$<mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mi>j</mi> </msub> <msup> <mrow> <mo>(</mo> <msub> <mi>Σ</mi> <mi>i</mi> </msub> <msup> <mrow> <mo>|</mo> <msub> <mrow> <mo>[</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>]</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </msup> <mo>,</mo> </mrow>$

$<mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>-</mo> <msub> <mi>Z</mi> <mn>0</mn> </msub> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <msub> <mo>Σ</mo> <mi>j</mi> </msub> <msup> <mrow> <mo>(</mo> <msub> <mo>Σ</mo> <mi>i</mi> </msub> <msup> <mrow> <mo>|</mo> <msub> <mrow> <mo>[</mo> <msub> <mi>Z</mi> <mi>t</mi> </msub> <mo>-</mo> <msub> <mi>Z</mi> <mn>0</mn> </msub> <mo>]</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> </msup> <mo>;</mo> </mrow>$

其中，||Z_t||_2,1项代表低秩稀疏，Z₀为z₀复制N_P+N_n个后所组成的矩阵，||E||_1,1为重建错误差表示计算X＝D_t×Z_t时，D_t×Z_t的结果与X的误差，误差越小，表明用字典D_t恢复的图像越接近原始图像；λ_i(i＝1,2,3)作为不同项的系数；

S24：定义z_i^o为z_i正样本系数，为N_p维向量，z_i^b为z_i负样本系数，为N_n维向量；设置差别分数Δz，Δz表示正样本系数绝对值的总和减去负样本系数绝对值总和，Δz计算方法如下：

Δz_i＝||z_i^o||₁-||z_i^b||₁(i＝1,2...n)

其中i表示第i个粒子，将差别分数最小的向量作为目标向量，同时替换上一时刻目标表示系数z₀，赋予z₀新的值：

$<mrow> <msub> <mi>z</mi> <mn>0</mn> </msub> <mo>=</mo> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>...</mo> <mn>25</mn> </mrow> </munder> <msub> <mi>Δz</mi> <mi>i</mi> </msub> </mrow>$

其中，||z_i^o||₁＝(∑_j(∑_i|(z_i^o)_ij|))，||z_i^b||₁＝(∑_j(∑_i|(z_i^b)_ij|))；

z₀即为新选出的目标在字典D_t上的表示系数；

S25：字典更新；

目标跟踪过程中，每一帧都要将权值进行更新，将权值阈值小于τ的向量进行更换，方法如下：

令w_i←w_i*exp(z_oⁱ)(i＝1,2...N_p+N_n)，如果w_i＜τ，则令i₀＝argmin_1≤i≤na_i，

其中表示图像t序列中字典D_t的第i₀个分量，w_i表示w的第i个分量，w_i←w_i*exp(z_oⁱ)(i＝1,2...N_p+N_n)表示将w_i*exp(z_oⁱ)赋值给w_i，同理，表示将z₀赋值给

S26：重复S21～S25。

2.根据权利要求1所述的基于低秩稀疏的视频目标跟踪方法，其特征在于，S12中图像的压缩方法如下：

如果有min(wi,he)≤50，则取S11中选定的目标大小，取值如下：

sz_w＝wi，sz_h＝he

如果有min(wi,he)＞50，则将S11中选定的图像通过降采样，降到原分辨率的一半，取值如下：

$<mrow> <mi>s</mi> <mi>z</mi> <mo>_</mo> <mi>w</mi> <mo>=</mo> <mfrac> <mrow> <mi>w</mi> <mi>i</mi> </mrow> <mn>2</mn> </mfrac> <mo>,</mo> <mi>s</mi> <mi>z</mi> <mo>_</mo> <mi>h</mi> <mo>=</mo> <mfrac> <mrow> <mi>h</mi> <mi>e</mi> </mrow> <mn>2</mn> </mfrac> </mrow>$

如果S11中选定的目标过大即max(wi,he)＞64，则将将该目标大小通过降采样设置为定值：

sz_w＝32，sz_h＝32。

3.根据权利要求1所述的基于低秩稀疏的视频目标跟踪方法，其特征在于，S13中，δ_n＞＞δ_p，δ_n＞＞δ_p表示δ_n远大于δ_p。

4.根据权利要求1所述的基于低秩稀疏的视频目标跟踪方法，其特征在于，S15中，σ₀¹、σ₀⁴的取值为0.01～0.05，σ₀²、σ₀³的取值为0.0001～0.0005，σ₀⁵、σ₀⁶的取值为1～5。

完整全部详细技术资料下载

当前第2页1 2 3